ديميس هاسابيس، الرئيس التنفيذي لمنظمة أبحاث الذكاء الاصطناعي في جوجل، ديب مايند، اقترح مساء الثلاثاء أن فيو 3، أحدث نموذج لتوليد الفيديو من جوجل، يمكن استخدامه في ألعاب الفيديو.
ردًا على منشور على X يناشد جوجل “دعني ألعب لعبة فيديو من مقاطع الفيديو الخاصة بي على فيو 3 بالفعل”، ويسأل “متى ستكون هناك نماذج عوالم قابلة للعب؟”، أجاب هاسابيس “ألن يكون هذا شيئًا رائعًا؟”.
في صباح يوم الأربعاء، تدخل لوغان كيلباتريك، المنتج الرئيسي لاستوديو الذكاء الاصطناعي في جوجل وواجهة برمجة التطبيقات جمنيا، برد: “🤐🤐🤐🤐”
كلا المنشورين من مسؤولي جوجل لا يعدو كونهما اقتراحات مرحة، وأخبر متحدث باسم جوجل موقع TechCrunch أن الشركة ليس لديها ما تشاركه في الوقت الحالي. لكن بناء نماذج عوالم قابلة للعب ليس خارج نطاق الاحتمالات للعملاق التكنولوجي.
نموذج العوالم يختلف عن نماذج توليد الفيديو. حيث يحاكي الأول ديناميكيات بيئة العالم الحقيقي، مما يسمح للعملاء بتوقع كيفية تطور العالم استجابةً لأفعالهم. بينما النماذج التي تُنتج الفيديو تولد تسلسلات فيديو واقعية.
لدى جوجل خطط لتحويل نموذجه الأساسي متعدد الوسائط، جمنيا 2.5 برو، إلى نموذج عالم يحاكي جوانب من الدماغ البشري. في ديسمبر، كشفت ديب مايند عن جيني 2، نموذج يمكنه توليد مجموعة “لا نهاية” لها من العوالم القابلة للعب. في الشهر التالي، أبلغنا أن جوجل كانت تشكل فريقًا جديدًا للعمل على نماذج الذكاء الاصطناعي التي يمكنها محاكاة العالم الحقيقي.
يعمل آخرون على بناء نماذج العوالم — وأبرزهم رائدة الذكاء الاصطناعي في في في لي. خرجت لي من الظل العام الماضي مع World Labs، شركة ناشئة بنيت نظام ذكاء اصطناعي خاص بها يُنتج مشاهد ثلاثية الأبعاد تشبه ألعاب الفيديو من صورة واحدة.
فيو 3، الذي لا يزال في معاينة عامة، يمكنه إنشاء فيديو بالإضافة إلى الصوت المرافق للمقاطع — أي شيء من الكلام إلى الموسيقى التصويرية. بينما يُنتج فيو 3 حركات واقعية من خلال محاكاة فيزياء العالم الحقيقي، إلا أنه ليس نموذج عالم بعد. بدلاً من ذلك، يمكن استخدامه في السرد السينمائي في الألعاب، مثل مشاهد الانتقال، الإعلانات الترويجية، ونماذج السرد.
النموذج لا يزال أيضًا نموذجًا توليديًا “سلبياً”، وسيحتاج إلى الانتقال إلى محاكي يكون أكثر نشاطًا وتفاعلية وتنبؤًا.
لكن التحدي الحقيقي في إنتاج ألعاب الفيديو لا يقتصر على الرسوميات المدهشة؛ بل هو محاكاة مستمرة وقابلة للتحكم في الوقت الحقيقي. ولهذا السبب قد يكون من المنطقي رؤية جوجل تتبنى نهجًا هجينًا يستفيد من فيو وجيني في المستقبل، إذا قررت متابعة تطوير ألعاب الفيديو أو العوالم القابلة للعب.
قد تجد جوجل نفسها تتنافس مع مايكروسوفت، سيناريو، رانواي، بيكا، وأخيرًا، نموذج توليد الفيديو OpenAI سورا.
نظرًا لخطط جوجل المستقبلية في مجال نماذج العوالم وسمعتها في استخدام ثرواتها العميقة وقوتها التوزيعية لتمرير المنافسين، سيكون من الحكمة للمنافسين في هذا المجال أن يظلوا على دراية.
