ميسترال تطلق نموذجًا جديدًا مفتوح المصدر لتوليد الكلام
أصدرت شركة Mistral الفرنسية المدعومة بالذكاء الاصطناعي نموذجًا جديدًا مفتوح المصدر لتحويل النص إلى كلام يوم الخميس يمكن استخدامه من قبل مساعدي الصوت أو في حالات الاستخدام المؤسسي مثل دعم العملاء. يتيح هذا النموذج للشركات بناء وكلاء صوتيين للمبيعات والتفاعل مع العملاء، مما يضع Mistral في منافسة مباشرة مع شركات مثل ElevenLabs وDeepgram وOpenAI.
النموذج الجديد، الذي يُطلق عليه Voxtral TTS، يدعم تسع لغات، بما في ذلك الإنجليزية والفرنسية والألمانية والإسبانية والهولندية والبرتغالية والإيطالية والهندية والعربية.
قال بيير ستوك، نائب رئيس العمليات العلمية في Mistral AI، لـ TechCrunch خلال مقابلة هاتفية: “لقد كان عملاؤنا يطلبون نموذجًا للخطاب. لذا قمنا ببناء نموذج خطاب صغير يمكن أن يتناسب مع ساعة ذكية أو هاتف ذكي أو كمبيوتر محمول أو أجهزة حافة أخرى. تكلفته جزء ضئيل من أي شيء آخر في السوق، لكنه يقدم أداءً متطورًا.”

قالت Mistral إن النموذج الجديد يمكنه تكيف صوت مخصص بعينة أقل من خمس ثوانٍ، كما يمكنه أيضًا التقاط الخصائص مثل اللهجات الدقيقة، والتنغيم، والتغيرات، والاختلافات في تدفق الكلام. النموذج، المبني على Ministral 3B، يمكنه التبديل بين اللغات بسهولة دون فقدان خصائص الصوت، وهو ما يُعد مفيدًا في حالات الاستخدام مثل الدبلجة أو الترجمة الفورية. وذكر ستوك أن الشركة أرادت أن يبدو النموذج إنسانيًا وليس آليًا.
تم بناء النموذج لأداء فوري، وفقًا للشركة. لديه زمن التفاعل الأول (TTFA) — وهو مقياس لوقت بدء النموذج في “الكلام” بعد تلقي الإدخال — يبلغ 90 مللي ثانية لعينة مدتها 10 ثوانٍ تحتوي على 500 حرف. كما أن للنموذج عامل الزمن الفوري (RTF) يبلغ 6x، مما يعني أنه يمكنه تقديم مقطع مدته 10 ثوانٍ في حوالي 1.6 ثانية.

في وقت سابق من هذا العام، أطلقت Mistral زوجًا من نماذج النسخ، واحدة لمعالجة الدفعات الكبيرة والأخرى لحالات الاستخدام الفورية مع زمن تأخير منخفض. مع النموذج الصوتي الجديد، من المحتمل أن تهدف الشركة إلى توفير مجموعة كاملة من منتجات الصوت للمؤسسات.
قال ستوك: “نخطط لإنشاء منصة شاملة يمكنها التعامل مع تدفقات متعددة الأشكال من الإدخال، بما في ذلك الصوت والنص والصورة وخروج أيضًا. الفائدة الرئيسية من ذلك هي أنك تحصل على معلومات أكثر بكثير مع نظام وكيل شامل يدعم الصوت كمدخل أو مخرج.”
حدث Techcrunch
سان فرانسيسكو، كاليفورنيا
|
13-15 أكتوبر 2026
تعتبر Mistral أن موقعها في السوق بفضل نموذجها المفتوح المصدر وإمكانية التخصيص سيساعد المؤسسات على اعتماد نماذج صوتها بدلاً من منافسيها، حيث يمكنهم ضبطها كما يريدون.