تطبيق Speechify على ويندوز يستخدم نماذج محلية للتفريغ والكتابة الصوتية

أطلقت شركة Speechify، المتخصصة في الذكاء الاصطناعي الصوتي، تطبيقاً محلياً جديداً لنظام ويندوز يستخدم نماذج مخزنة محلياً تمكّن من الكتابة الصوتية عبر التطبيقات، وقراءة المقالات والمستندات أو PDF بصوت عالٍ باستخدام مكتبتها من الأصوات.

تتنافس الشركة مع أمثال Wispr Flow وWillow وSuperwhisper التي توفر أيضاً تطبيقات للكتابة الصوتية والتحويل إلى نص عبر المنصات المختلفة.

ذكرت شركة Speechify أن تطبيق ويندوز يقوم بعمليات المعالجة الصوتية بالكامل على أجهزة Copilot+ (التي تحتوي على NPUs من AMD وIntel وQualcomm) وأجهزة ويندوز 11 الأخرى التي تحتوي على GPUs من Intel وAMD.

يعمل التطبيق على ثلاثة نماذج محلية: تحويل النص إلى كلام باستخدام الشبكات العصبية، واكتشاف نشاط الصوت في الوقت الحقيقي، والتحويل المدعوم من Whisper. يمكن للمستخدمين تكوين التطبيق للانتقال إلى نماذج سحابية أو حتى تغييرها أثناء الاستخدام.

وقالت الشركة، التي لديها أكثر من 50 مليون مستخدم، إن نموذج VITS Neural يمكن أن يولد الصوت عبر سبعة إعدادات سرعة مختلفة، مما يسمح للمستخدمين بأن يقوم التطبيق بقراءة المستندات أو صفحات الويب بصوت عالٍ. تستخدم الشركة نموذج Silero مفتوح المصدر لاكتشاف نشاط الصوت.

قال Cliff Weitzman، مؤسس ومدير تنفيذي لشركة Speechify، في بيان له: “يستخدم أكثر من مليار شخص على هذا الكوكب نظام ويندوز. مع إطلاق هذا التطبيق، نتأكد من أن القراءة، والآن الكتابة، لا تكون عائقاً، بغض النظر عن الجهاز الذي تستخدمه أو كيف تفضل العمل. نحن متحمسون بشكل خاص للفرصة في الشركات نظراً لعدد المحترفين الذين طلبوا استخدام Speechify على أجهزة الكمبيوتر الخاصة بهم.”

في الشهر الماضي، أطلقت الشركة ميزة النسخ النصي للاجتماعات على غرار Granola، ولكن هذه الميزة كانت محدودة للاجتماعات المعتمدة على المتصفح. الآن بعد أن أصبحت الشركة لديها تطبيقات عبر المنصات، من المحتمل أن تنقل هذه الميزة إلى التطبيقات الأصلية لنسخ الاجتماعات في أي تطبيق أو متصفح.

حدث Techcrunch

سان فرانسيسكو، كاليفورنيا
|
13-15 أكتوبر 2026

حتى قبل بضع سنوات، كانت شركة Speechify تركز بشكل كبير على استخدامات تحويل النص إلى كلام مثل قراءة المقالات ورسائل البريد الإلكتروني، وإنتاج البودكاست من المستندات. مؤخراً، كانت الشركة تحاول أن تصبح تطبيق صوتي متكامل للمستخدمين من خلال إطلاق الكتابة الصوتية، ونسخ الاجتماعات، ومساعد صوتي.


المصدر