فيديو 3 يمكنه إنشاء مقاطع فيديو وموسيقى تصويرية تتناسب معها

Written by

in

يمكن لنموذج الذكاء الاصطناعي الخاص بـ Google الأخير لإنشاء الفيديوهات، Veo 3، إنشاء صوت يرافق المقاطع التي ينتجها.

خلال مؤتمر Google I/O 2025 لمطوري البرمجيات يوم الثلاثاء، كشفت Google عن Veo 3، الذي تدعي الشركة أنه يمكنه توليد مؤثرات صوتية، وأصوات خلفية، وحتى حوارات لمرافقة الفيديوهات التي ينشئها. كما أن Veo 3 يحسن عن سلفه، Veo 2، من حيث جودة اللقطات التي يمكنه إنتاجها، وفقًا لما تقوله Google.

يتوفر Veo 3 اعتبارًا من يوم الثلاثاء في تطبيق Gemini للدردشة من Google لمشتركي خطة الذكاء الاصطناعي Ultra البالغة $249.99 شهريًا، حيث يمكن تفعيله بنص أو صورة.

قال ديميس هاسابيس، الرئيس التنفيذي لـ Google DeepMind، قسم البحث والتطوير في Google للذكاء الاصطناعي، خلال مؤتمر صحفي: “لأول مرة، نحن نخرج من العصر الصامت لتوليد الفيديو.” “[يمكنك أن تعطي Veo 3] طلبًا يصف شخصيات وبيئة، وتقترح حوارًا مع وصف لكيفية رغبتك في أن يبدو.”

أدى التوفر الواسع للأدوات لبناء مولدات الفيديو إلى انفجار في عدد مقدمي الخدمة حتى أصبحت السوق مشبعة. الشركات الناشئة مثل Runway، Lightricks، Genmo، Pika، Higgsfield، Kling، و Luma، بالإضافة إلى عمالقة التكنولوجيا مثل OpenAI و Alibaba، تصدر نماذج بسرعة كبيرة. في كثير من الحالات، لا يميز القليل من الأشياء بين نموذج وآخر.

يبدو أن إخراج الصوت سيكون عامل تمايز كبير لـ Veo 3، إذا تمكنت Google من الوفاء بوعودها. ليست أدوات توليد الصوت المعتمدة على الذكاء الاصطناعي جديدة، ولا النماذج لإنشاء مؤثرات صوتية للفيديو. لكن Veo 3 يمكنه بشكل فريد فهم البيكسلات الخام من مقاطعه ومزامنة الأصوات المولدة مع المقاطع تلقائيًا، وفقًا لـ Google.

إليك عينة من النموذج:

ربما تم تحقيق Veo 3 بفضل الأعمال السابقة لمختبر DeepMind في “تحويل الفيديو إلى صوت”. في يونيو الماضي، أعلنت DeepMind أنها تعمل على تقنية الذكاء الاصطناعي لإنشاء مقاطع صوتية للفيديوهات من خلال تدريب نموذج على مجموعة من الأصوات ونصوص الحوار بالإضافة إلى مقاطع الفيديو.

لم تكشف DeepMind بالضبط عن مصدر المحتوى الذي استخدمته لتدريب Veo 3، لكن من المحتمل أن يكون YouTube. تمتلك Google YouTube، وقد أخبرت DeepMind TechCrunch سابقًا أن نماذج Google مثل Veo “قد” يتم تدريبها على بعض المواد من YouTube.

للتخفيف من مخاطر الفيديوهات المزيفة، تقول DeepMind إنها تستخدم تقنية العلامة المائية الخاصة بها، SynthID، لإدخال علامات غير مرئية في الإطارات التي ينتجها Veo 3.

بينما تقدم شركات مثل Google Veo 3 كأداة إبداعية قوية، فإن العديد من الفنانين يشعرون بالتوتر حيالها — فهي تهدد بزعزعة صناعات كاملة. تشير دراسة عام 2024 commissioned من قبل Animation Guild، نقابة تمثل الرسامين والرسامين الكارتونيين في هوليوود، إلى أن أكثر من 100,000 وظيفة في مجال الأفلام والتلفزيون والرسوم المتحركة في الولايات المتحدة ستتعرض للاضطراب بسبب الذكاء الاصطناعي بحلول عام 2026.

كما أطلقت Google اليوم ميزات جديدة لـ Veo 2، بما في ذلك ميزة تتيح للمستخدمين إعطاء النموذج صورًا لشخصيات، مشاهد، أشياء، وأنماط للحصول على اتساق أفضل. يمكن لـ Veo 2 الأحدث أن يفهم حركات الكاميرا مثل التدوير، والانزلاق، والتقريب، ويسمح للمستخدمين بإضافة أو حذف الأشياء من الفيديوهات أو توسيع إطارات المقاطع، على سبيل المثال، لتحويلها من الوضع العمودي إلى الوضع الأفقي.

تقول Google إن جميع هذه الميزات الجديدة لنموذج Veo 2 ستتوفر على منصة Vertex AI API الخاصة بها في الأسابيع المقبلة.

المصدر

فيديو 3 يمكنه إنشاء مقاطع فيديو وموسيقى تصويرية تتناسب معها

More posts

تقدير شركة وزوم الأوزبكية يقفز بأكثر من 50% خلال سبعة أشهر ليصل إلى 2.3 مليار دولار

الهلال السوداني يقدم شكره للرجاء البيضاوي على استضافة بعثته في الأكاديمية – عرب فايف

آبل الآن تصنع واحدة من كل أربعة آيفون في الهند: تقرير

الهلال يرفض العرض المقدم للتعاقد مع سعود عبدالحميد حسب تقارير حلم سبورت – عرب فايف