كشفت شركة جوجل ديب مايند عن جيني 3، أحدث نموذج عالمي قاعدي لديها يمكن استخدامه لتدريب وكلاء ذكيين عامين، وهو ما تصفه مختبر الذكاء الاصطناعي بأنه خطوة حاسمة نحو “الذكاء الاصطناعي العام”، أو الذكاء الشبيه بالبشر.
قال شلومو فروختر، مدير الأبحاث في ديب مايند، خلال مؤتمر صحفي: “جيني 3 هو أول نموذج عالمي تفاعلي عام في الوقت الحقيقي”. “إنه يتجاوز النماذج العالمية الضيقة التي كانت موجودة من قبل. إنه ليس محددًا لأي بيئة معينة. يمكنه توليد عوالم واقعية وصور خيالية، وكل شيء بينهما.”
لا يزال جيني 3 في مرحلة الاختبار البحثي وليس متاحًا للجمهور، ويت builds على سلفه جيني 2 (الذي يمكنه توليد بيئات جديدة للوكلاء) وعلى نموذج فيديو الجيل الأحدث لدى ديب مايند فيو 3 (الذي يقال إنه يمتلك فهمًا عميقًا للفيزياء).

بتحفيز نصي بسيط، يمكن لجيني 3 توليد عدة دقائق من البيئات التفاعلية ثلاثية الأبعاد بدقة 720 بكسل بمعدل 24 إطارًا في الثانية — وهو قفزة كبيرة مقارنة بـ 10 إلى 20 ثانية التي كان بإمكان جيني 2 إنتاجها. ويتميز النموذج أيضًا بـ “أحداث العالم القابلة للتحفيز”، أو القدرة على استخدام التحفيز لتغيير العالم الذي تم توليده.
ربما الأهم من ذلك، أن محاكاة جيني 3 تبقى متسقة جسديًا بمرور الوقت، حيث يمكن للنموذج تذكر ما تم توليده سابقًا — قدرة يقول ديب مايند إن باحثيها لم يبرمجوا بشكل صريح في النموذج.
قال فروختر إنه في حين أن لجيني 3 تأثيرات على التجارب التعليمية، والألعاب، أو نمذجة المفاهيم الإبداعية، فإن الفتح الحقيقي سيكون في تدريب الوكلاء على المهام العامة، وهو ما قال إنه ضروري للوصول إلى AGI.
قال جاك باركر-هولدر، عالم أبحاث في فريق الانفتاح لدى ديب مايند، خلال المؤتمر: “نعتقد أن نماذج العالم هي المفتاح في الطريق إلى AGI، وبشكل خاص لوكلاء الجسد، حيث أن محاكاة سيناريوهات العالم الحقيقي تكون تحديًا بشكل خاص.”
حدث تك كرانش
سان فرانسيسكو
|
27-29 أكتوبر 2025

من المفترض أن جيني 3 مصمم لحل ذلك الاختناق. مثل فيو، إنه لا يعتمد على محرك فيزياء مشفر بشكل صارم؛ بدلاً من ذلك، تقول ديب مايند إن النموذج يعلم نفسه كيف يعمل العالم – كيف تتحرك الأشياء وتسقط وتتفاعل – من خلال تذكر ما قام بتوليده والتفكير على مدى زمني طويل.
قال فروختر لتك كرانش في مقابلة: “النموذج يعتمد على التراجع الذاتي، مما يعني أنه يولد إطارًا واحدًا في كل مرة”. “يجب أن ينظر إلى الوراء في ما تم توليده سابقًا ليقرر ما سيحدث بعد ذلك. هذا جزء رئيسي من الهيكلية.”
تلك الذاكرة، كما تقول الشركة، تضيف إلى الاتساق في العوالم المحاكية لجيني 3، مما يسمح له بتطوير فهم للفيزياء، مماثل لكيفية فهم البشر أن كأسًا يتأرجح على حافة الطاولة على وشك السقوط، أو أنه يجب عليهم الانحناء لتجنب جسم يسقط.
يجدر بالذكر أن ديب مايند تقول إن النموذج لديه أيضًا القدرة على دفع الوكلاء الذكاء الاصطناعي إلى حدودهم – مما يجبرهم على التعلم من تجربتهم الخاصة، مثلما يتعلم البشر في العالم الحقيقي.
كمثال، شاركت ديب مايند في اختبار جيني 3 مع إصدار حديث من وكيلها متعدد العوالم القابل للتعليم (SIMA)، مع التوجيه للقيام بمجموعة من الأهداف. في بيئة مستودع، طلبوا من الوكيل أداء مهام مثل “الاقتراب من ضاغط القمامة الأخضر اللامع” أو “المشي نحو رافعة الشوكة الحمراء المعبأة.”
قال باركر-هولدر: “في كل الحالات الثلاث، يتمكن وكيل SIMA من تحقيق الهدف”. “إنه يتلقى فقط الإجراءات من الوكيل. لذا الوكيل يأخذ الهدف، ويرى العالم المحاكى من حوله، ثم ينفذ الإجراءات في العالم. جيني 3 يحاكي إلى الأمام، وحقيقة أنه قادر على تحقيق ذلك هو بسبب أن جيني 3 يبقى متسقًا.”

ومع ذلك، فإن جيني 3 له قيود. على سبيل المثال، بينما يدعي الباحثون أنه يمكنه فهم الفيزياء، فإن العرض التوضيحي الذي يظهر متزلجًا يتجه أسفل الجبل لم يعكس كيفية حركة الثلج بالنسبة للمتزلج.
بالإضافة إلى ذلك، فإن نطاق الإجراءات التي يمكن أن يتخذها الوكيل محدود. على سبيل المثال، تسمح أحداث العالم القابلة للتحفيز بنطاق واسع من التدخلات البيئية، لكنها لا تتم بالضرورة من قِبل الوكيل نفسه. وما زال من الصعب نمذجة التفاعلات المعقدة بدقة بين عدة وكلاء مستقلين في بيئة مشتركة.
يمكن لجيني 3 أيضًا دعم بضع دقائق فقط من التفاعل المستمر، بينما سيكون من الضروري ساعات للتدريب بشكل مناسب.
ومع ذلك، يقدم النموذج خطوة مثيرة نحو تعليم الوكلاء لتجاوز التفاعل مع المدخلات، مما يسمح لهم بالتخطيط، الاستكشاف، البحث عن عدم اليقين، والتحسين من خلال التجربة والخطأ — وهو نوع من التعلم الذاتي المدفوع بالجسد الذي يقول الكثيرون إنه مفتاح الانتقال نحو الذكاء العام.
قال باركر-هولدر: “لم نحصل بعد على لحظة Move 37 لوكلاء الجسد، حيث يمكنهم فعل إجراءات جديدة في العالم الحقيقي”، مشيرًا إلى اللحظة الأسطورية في مباراة Go لعام 2016 بين وكيل الذكاء الاصطناعي AlphaGo من ديب مايند وبطل العالم لي سيدول، التي لعب فيها Alpha Go حركة غير تقليدية رائعة أصبحت رمزية لقدرة الذكاء الاصطناعي على اكتشاف استراتيجيات جديدة تتجاوز فهم البشر.
قال: “لكن الآن، يمكننا أن نستهل حقبة جديدة محتملة”.
