بعد فترة قصيرة من انضمام هانتر لايتمن إلى OpenAI كباحث في عام 2022، شهد زملاءه يطلقون ChatGPT، أحد أسرع المنتجات نمواً على الإطلاق. في هذه الأثناء، كان لايتمن يعمل بهدوء على فريق يعلّم نماذج OpenAI كيفية حل مسابقات الرياضيات الثانوية.
اليوم، يُعتبر ذلك الفريق المعروف باسم MathGen عنصراً أساسياً في جهود OpenAI الرائدة في الصناعة لإنشاء نماذج تفكير الذكاء الاصطناعي: التكنولوجيا الأساسية وراء الوكلاء الذكاء الاصطناعي القادرين على إنجاز مهام على الكمبيوتر كما يفعل البشر.
“كنا نحاول جعل النماذج أفضل في التفكير الرياضي، وهو ما لم تكن جيدة فيه في ذلك الوقت،” قال لايتمن لـ TechCrunch، واصفاً الأعمال المبكرة لـ MathGen.
نموذج OpenAI بعيدة عن الكمال اليوم — لا تزال أنظمة الذكاء الاصطناعي الأخيرة لدى الشركة تتوهّم ويعاني وكلاؤها من المهام المعقدة.
لكن نماذجها الحديثة حققت تحسناً كبيراً في التفكير الرياضي. فقد حصل أحد نماذج OpenAI مؤخراً على ميدالية ذهبية في الأولمبياد الرياضي الدولي، وهي مسابقة رياضيات للطلاب اللامعين في المدارس الثانوية على مستوى العالم. تعتقد OpenAI أن هذه القدرات الفكرية ستترجم إلى مواضيع أخرى، وستكون في النهاية قوة لوكلاء عامين لطالما حلمت الشركة بإنشائهم.
كان ChatGPT حادثة سعيدة – عينة بحث منخفضة المستوى تحولت إلى عمل تجاري شهير – لكن وكلاء OpenAI هم نتاج جهود مدروسة استمرت لسنوات داخل الشركة.
“في النهاية، ستطلب من الكمبيوتر ما تحتاجه وسيقوم بكل هذه المهام من أجلك،” قال سام التمان، الرئيس التنفيذي لـ OpenAI في أول مؤتمر للمطورين في الشركة في عام 2023. “غالباً ما يتحدث عن هذه القدرات في مجال الذكاء الاصطناعي على أنها وكلاء. وستمثل الفوائد هنا أموراً مذهلة.”
حدث TechCrunch
سان فرانسيسكو
|
27-29 أكتوبر 2025
سواء كانت الوكلاء ستفي برؤية التمان أم لا يبقى أن نرى، لكن OpenAI صدمت العالم بإطلاق أول نموذج تفكير ذكاء اصطناعي الخاص بها، o1، في خريف عام 2024. بعد أقل من عام، أصبح 21 من الباحثين الأساسيين وراء هذا الإنجاز من أكثر المواهب المرغوبة في وادي السيليكون.
تجند مارك زوكربيرج خمسة من الباحثين في o1 للعمل في وحدة ميتا الجديدة التي تركز على الذكاء الفائق، مقدماً بعض حزم التعويض التي تتجاوز 100 مليون دولار. وقد تم تعيين أحدهم، شنجيا تشاو، مؤخراً كبير العلماء في مختبرات ميتا للذكاء الفائق.
عصر التعلم المعزز
ارتفاع نماذج تفكير OpenAI والوكلاء مرتبط بتقنية تدريب تعلم الآلة المعروفة باسم التعلم المعزز (RL). يوفر التعلم المعزز تعليقات لنموذج الذكاء الاصطناعي حول ما إذا كانت خياراته صحيحة أم لا في بيئات محاكية.
لقد تم استخدام التعلم المعزز لعقود. على سبيل المثال، في عام 2016، بعد حوالي عام من تأسيس OpenAI في عام 2015، حصل نظام ذكاء اصطناعي أنشأته Google DeepMind باستخدام التعلم المعزز، AlphaGo، على انتباه عالمي بعد أن هزم بطل العالم في لعبة اللوحة، Go.
في ذلك الوقت، بدأ أحد أول موظفي OpenAI، أندريه كارباثي، يتساءل عن كيفية استغلال التعلم المعزز لإنشاء وكيل ذكاء اصطناعي يمكنه استخدام الكمبيوتر. لكن سيستغرق الأمر سنوات من OpenAI لتطوير النماذج وتقنيات التدريب اللازمة.
بحلول عام 2018، ابتكرت OpenAI أول نموذج لغوي كبير في سلسلة GPT، تم تدريبه على كميات هائلة من بيانات الإنترنت ومجموعات كبيرة من وحدات معالجة الرسوميات. تميزت نماذج GPT في معالجة النصوص، مما أدى في النهاية إلى ChatGPT، لكنها كانت تعاني مع الرياضيات الأساسية.
استغرق الأمر حتى عام 2023 لتحقيق اختراق، سمي في البداية “Q*” ثم “Strawberry”، من خلال الجمع بين النماذج اللغوية الكبيرة، التعلم المعزز، وتقنية تعرف باسم حساب وقت الاختبار. أعطى الأمر الأخير النماذج وقتاً إضافياً وقوة حسابية للتخطيط والتعامل مع المشكلات، والتحقق من خطواتها، قبل تقديم إجابة.
سمح ذلك لـ OpenAI بتقديم نهج جديد يسمى “سلسلة التفكير” (CoT)، والذي حسّن أداء الذكاء الاصطناعي على الأسئلة الرياضية التي لم تشاهدها النماذج من قبل.
“كنت أستطيع رؤية النموذج يبدأ في التفكير،” قال الكيشي. “كان يلاحظ الأخطاء ويعود إلى الوراء، وكان يشعر بالإحباط. كان حقاً من الجيد قراءة أفكار الشخص.”
رغم أن هذه التقنيات لم تكن جديدة بمفردها، إلا أن OpenAI قامت بدمجها بشكل فريد لإنشاء Strawberry، مما قاد مباشرة إلى تطوير o1. حددت OpenAI بسرعة أن قدرات التخطيط والتحقق من الحقائق لنماذج تفكير الذكاء الاصطناعي قد تكون مفيدة لدعم وكلاء الذكاء الاصطناعي.
“لقد حللنا مشكلة كنت أضرب رأسي بها لعدة سنوات،” قال لايتمن. “كانت من أكثر اللحظات إثارة في مسيرتي البحثية.”
توسيع التفكير
مع نماذج تفكير الذكاء الاصطناعي، حددت OpenAI أنها لديها محورين جديدين سيسمحان لها بتحسين نماذج الذكاء الاصطناعي: استخدام المزيد من القوة الحاسوبية أثناء التدريب بعد الانتهاء من النماذج، ومنح نماذج الذكاء الاصطناعي المزيد من الوقت وقوة المعالجة أثناء الإجابة على سؤال.
“تتفكر OpenAI، كشركة، كثيراً ليس فقط في طريقة الأمور الحالية، ولكن في كيفية توسيعها،” قال لايتمن.
بعد فترة قصيرة من اختراق Strawberry في عام 2023، أنشأت OpenAI فريق “الوكلاء” بقيادة الباحث في OpenAI دانييل سيلسما لتحقيق المزيد من التقدم في هذا النموذج الجديد، حسبما أخبر مصدران TechCrunch. على الرغم من أن الفريق كان يُطلق عليه اسم “الوكلاء”، لم تفرق OpenAI في البداية بين نماذج التفكير والوكلاء كما نفكر بهم اليوم. كانت الشركة ترغب فقط في جعل أنظمة الذكاء الاصطناعي قادرة على إتمام مهام معقدة.
في نهاية المطاف، أصبحت أعمال فريق سيلسما جزءاً من مشروع أكبر لتطوير نموذج التفكير o1، مع قادة بما في ذلك المؤسس المشارك لـ OpenAI إيليا سوتسكيبر، ومسؤول البحث الرئيسي مارك تشين، والعالم الرئيسي يعقوب باكوشكي.
ستضطر OpenAI إلى تحويل موارد ثمينة – لا سيما المواهب ووحدات معالجة الرسوميات – لإنشاء o1. طوال تاريخ OpenAI، كان على الباحثين التفاوض مع قادة الشركة للحصول على الموارد؛ إذ كان إظهار الإنجازات هو طريق مؤكد لتأمينها.
“أحد المكونات الأساسية لـ OpenAI هو أن كل شيء في البحث يأتي من القاعدة إلى القمة،” قال لايتمن. “عندما أظهرنا الدليل [للـ o1]، كانت الشركة مثل، ‘هذا منطقي، دعونا ندفع باتجاهه.’”
يقول بعض الموظفين السابقين إن مهمة الشركة الناشئة لتطوير AGI كانت العامل الرئيسي في تحقيق الإنجازات حول نماذج تفكير الذكاء الاصطناعي. من خلال التركيز على تطوير نماذج الذكاء الاصطناعي الأكثر ذكاءً – بدلاً من المنتجات – تمكنت OpenAI من إعطاء الأولوية لـ o1 على غيرها من الجهود. لم يكن من الممكن دائمًا الاستثمار بهذا القدر الكبير في الأفكار في مختبرات الذكاء الاصطناعي المنافسة.
أثبتت القرار لمحاولة طرق تدريب جديدة أنه حكيم. بحلول أواخر عام 2024، بدأت العديد من مختبرات الذكاء الاصطناعي الرائدة في رؤية عوائد متناقصة على النماذج التي تم إنشاؤها من خلال توسيع التدريب التقليدي. اليوم، يأتي الكثير من زخم مجال الذكاء الاصطناعي من التقدم في نماذج التفكير.
ماذا يعني أن يكون لدى الذكاء الاصطناعي “تفكير؟”
بطرق عديدة، الهدف من أبحاث الذكاء الاصطناعي هو إعادة إنشاء الذكاء البشري باستخدام أجهزة الكمبيوتر. منذ إطلاق o1، أصبح UX لـ ChatGPT مليئًا بميزات تبدو أكثر إنسانية مثل “التفكير” و”التفكير الاستدلالي”.
عند سؤال ما إذا كانت نماذج OpenAI تتوهم حقاً، تردد الكيشي، قائلاً إنه يفكر في المفهوم من حيث علوم الحاسوب.
“نحن نعلم النموذج كيفية استهلاك الحساب بكفاءة للحصول على إجابة. لذا إذا عرفت ذلك بهذه الطريقة، نعم، إنه يفكر،” قال الكيشي.
يتبع لايتمن نهجاً يركز على نتائج النموذج وليس كثيراً على الوسائل أو علاقتها بالدماغ البشري.
“إذا كان النموذج يقوم بأشياء صعبة، فإنه يقوم بما هو ضروري من تقريب التفكير الذي يحتاجه للقيام بذلك،” قال لايتمن. “يمكننا تسمية ذلك بالتفكير، لأنه يبدو كآثار التفكير هذه، ولكن كل ذلك مجرد إشارات في محاولة لجعل أدوات الذكاء الاصطناعي قوية ومفيدة للكثير من الناس.”
يشير باحثو OpenAI إلى أن الناس قد يختلفون مع تسمياتهم أو تعريفاتهم للتفكير – وبالتأكيد، ظهرت انتقادات – لكنهم يجادلون بأن ذلك أقل أهمية من قدرات نماذجهم. يميل باحثو الذكاء الاصطناعي الآخرون إلى الاتفاق.
يقارن ناثان لامبرت، باحث في الذكاء الاصطناعي مع منظمة AI2 غير الربحية، أوضاع التفكير في الذكاء الاصطناعي بالطائرات في منشور مدونة. وكلاهما، كما يقول، هما نظامان من صنع الإنسان مستلهمان من الطبيعة – التفكير البشري وطيران الطيور، على التوالي – لكنهما يعملان من خلال آليات مختلفة تمامًا. وهذا لا يجعلهما أقل فائدة، أو أقل قدرة على تحقيق نتائج مشابهة.
اتفقت مجموعة من باحثي الذكاء الاصطناعي من OpenAI، وأنثروبيك، وGoogle DeepMind في ورقة موقف حديثة على أن نماذج تفكير الذكاء الاصطناعي ليست مفهومة جيدًا اليوم، وهناك حاجة لمزيد من الأبحاث. قد يكون من المبكر اتخاذ موقف واضح حول ما الذي يحدث بالضبط بداخلها.
الحدود التالية: وكلاء الذكاء الاصطناعي للمهام ذات الطابع الشخصي
تعمل وكلاء الذكاء الاصطناعي المتاحة في السوق اليوم بشكل أفضل في المجالات المحددة والمتحققة مثل البرمجة. يسعى وكيل Codex من OpenAI لمساعدة مهندسي البرمجيات في تخفيف الأعباء المتعلقة بالبرمجة البسيطة. في الوقت نفسه، أصبحت نماذج أنثروبيك شائعة بشكل خاص في أدوات البرمجة الذكاء الاصطناعي مثل Cursor وClaude Code – هذه من أولى وكلاء الذكاء الاصطناعي التي يرغب الناس في دفع مقابل خدماتها.
ومع ذلك، فإن وكلاء الذكاء الاصطناعي العامة مثل وكيل ChatGPT من OpenAI وComet من Perplexity يعانون من العديد من المهام المعقدة والذاتية التي يرغب الأشخاص في أتمتتها. عند محاولة استخدام هذه الأدوات للتسوق عبر الإنترنت أو إيجاد مكان طويل الأمد لوقوف السيارات، وجدت أن الوكلاء يستغرقون وقتًا أطول مما أود وارتكبت أخطاء سخيفة.
الوكلاء، بالطبع، أنظمة مبكرة ستحسن بلا شك. لكن يجب على الباحثين أولاً معرفة كيفية تدريب النماذج الأساسية أفضل لإتمام المهام التي هي أكثر ذات طابع شخصي.
“مثل العديد من المشكلات في تعلم الآلة، إنها مشكلة بيانات،” قال لايتمن، عندما سُئل عن قيود الوكلاء في المهام الذاتية. “بعض الأبحاث التي أشعر بالحماس بشأنها الآن تتعلق بكيفية التدريب على مهام أقل قابلية للتحقق. لدينا بعض الأدلة حول كيفية القيام بهذه الأمور.”
قال نوام براون، باحث في OpenAI ساعد في إنشاء نموذج IMO وo1، لـ TechCrunch إن OpenAI لديها تقنيات جديدة للتعلم المعزز العامة التي تسمح لهم بتعليم نماذج الذكاء الاصطناعي مهارات ليست سهلة التحقق منها. كان هذا هو كيف أن الشركة بنت النموذج الذي حقق ميدالية ذهبية في IMO، كما قال.
كان نموذج IMO الخاص بـ OpenAI نظام ذكاء اصطناعي أحدث ينتج عدة وكلاء، يستكشفون في آن واحد عدة أفكار، ثم يختارون أفضل إجابة ممكنة. هذه الأنواع من نماذج الذكاء الاصطناعي أصبحت أكثر شيوعًا؛ فقد أطلقت Google وxAI مؤخرًا نماذج متطورة باستخدام هذه التقنية.
“أعتقد أن هذه النماذج ستصبح أكثر قدرة في الرياضيات، وأعتقد أنها ستصبح أكثر قدرة في مجالات التفكير الأخرى أيضاً،” قال براون. “التقدم كان سريعًا بشكل مذهل. لا أرى أي سبب يدعو للاعتقاد أنه سيتباطأ.”
يمكن أن تساعد هذه التقنيات نماذج OpenAI على أن تصبح أكثر كفاءة، وقد تظهر هذه الفوائد في نموذج الشركة المقبل GPT-5. تأمل OpenAI في أن تؤكد هيمنتها على المنافسين من خلال إطلاق GPT-5، على أمل أن تقدم أفضل نموذج ذكاء اصطناعي لدعم الوكلاء للمطورين والمستهلكين.
لكن الشركة تريد أيضًا جعل منتجاتها أسهل في الاستخدام. يقول الكيشي إن OpenAI ترغب في تطوير وكلاء ذكاء اصطناعي يفهمون بديهة ما يريده المستخدمون، دون الحاجة إلى اختيار إعدادات معينة. يقول إن OpenAI تهدف إلى بناء أنظمة ذكاء اصطناعي تفهم متى يجب استخدام أدوات معينة، ومدى طول فترة التفكير.
تقدم هذه الأفكار صورة عن النسخة النهائية من ChatGPT: وكيل يمكنه القيام بأي شيء على الإنترنت من أجلك، ويفهم كيف تريد أن يتم ذلك. هذا منتج مختلف تمامًا عما هو عليه ChatGPT اليوم، لكن أبحاث الشركة تتجه بوضوح في هذا الاتجاه.
بينما كانت OpenAI بلا شك رائدة في صناعة الذكاء الاصطناعي قبل بضع سنوات، تواجه الشركة الآن مجموعة من المنافسين الجادين. لم يعد السؤال هو ما إذا كانت OpenAI يمكنها تحقيق مستقبلها الوكالي، بل هل بإمكان الشركة فعل ذلك قبل أن تتفوق عليها Google، أو Anthropic، أو xAI، أو Meta؟
