إذًا لقد سمعت هذه المصطلحات المتعلقة بالذكاء الاصطناعي وقد أيمنت برأسك؛ دعنا نصحح ذلك.
الذكاء الاصطناعي يغير العالم، ويبتكر في الوقت نفسه لغة جديدة بالكامل لوصف كيفية حدوث ذلك. اقضِ خمس دقائق في قراءة عن الذكاء الاصطناعي، وستصادف LLMs وRAG وRLHF، وعشرات من المصطلحات الأخرى التي يمكن أن تجعل حتى الأشخاص الأذكياء في عالم التقنية يشعرون بعدم الأمان. هذا المعجم هو محاولتنا لحل هذه المشكلة. نقوم بتحديثه بانتظام مع تطور هذا المجال، لذا اعتبره وثيقة حية، تمامًا مثل أنظمة الذكاء الاصطناعي التي يصفها.
الذكاء الاصطناعي العام، أو AGI، هو مصطلح غامض. لكنه يشير عمومًا إلى الذكاء الاصطناعي الأكثر قدرة من الإنسان العادي في العديد من، إن لم يكن معظم، المهام. وصف الرئيس التنفيذي لشركة OpenAI سام التمان AGI ذات مرة بأنه “ما يعادل إنسانًا متوسط المستوى يمكنك توظيفه كزميل عمل.” من ناحية أخرى، تعرف ميثاق OpenAI AGI بأنه “أنظمة ذاتية للغاية تتفوق على البشر في معظم الأعمال ذات القيمة الاقتصادية.” فهم Google DeepMind يختلف قليلاً عن هذين التعريفين؛ إذ ترى المختبر أن AGI هو “الذكاء الاصطناعي الذي يكون قادرًا على الأقل مثل البشر في معظم المهام الإدراكية.” مشوش؟ لا تقلق – فالخبراء في طليعة أبحاث الذكاء الاصطناعي كذلك.
يشير وكيل الذكاء الاصطناعي إلى أداة تستخدم تقنيات الذكاء الاصطناعي لأداء سلسلة من المهام نيابة عنك – تتجاوز ما يمكن أن يفعله روبوت محادثة ذكاء اصطناعي أساسي – مثل تقديم النفقات، حجز التذاكر أو طاولة في مطعم، أو حتى كتابة وصيانة التعليمات البرمجية. ولكن، كما أوضحنا سابقًا، هناك الكثير من الأجزاء المتحركة في هذه المساحة الناشئة، لذلك قد يعني “وكيل الذكاء الاصطناعي” أشياء مختلفة لأشخاص مختلفين. كما أن البنية التحتية لا تزال تُبنى لتحقيق قدراته المتوقعة. لكن الفكرة الأساسية توحي بنظام مستقل قد يستند إلى أنظمة ذكاء اصطناعي متعددة لتنفيذ مهام متعددة الخطوات.
فكر في واجهات برمجة التطبيقات كـ “أزرار” على ظهر برمجيات يمكن للبرامج الأخرى الضغط عليها لجعلها تفعل أشياء. يستخدم المطورون هذه الواجهات لبناء تكاملات — على سبيل المثال، السماح لتطبيق واحد بسحب البيانات من آخر، أو تمكين وكيل ذكاء اصطناعي من التحكم في خدمات خارجية مباشرة دون الحاجة إلى شخص يقوم بتشغيل كل واجهة يدويًا. تحتوي معظم الأجهزة المنزلية الذكية والمنصات المتصلة على هذه الأزرار المخفية المتاحة، حتى لو لم يرها المستخدمون العاديون أو يتفاعلون معها أبدًا. مع زيادة قدرة وكلاء الذكاء الاصطناعي، أصبحوا أكثر قدرة على العثور على واستخدام هذه الواجهات بأنفسهم، مما يفتح إمكانيات قوية — وأحيانًا غير متوقعة — لأتمتة العمليات.
عند إعطاء سؤال بسيط، يمكن للدماغ البشري أن يجيب دون التفكير كثيرًا — أشياء مثل “أي حيوان أطول، الزرافة أم الحيوان الأليف؟” ولكن في العديد من الحالات، تحتاج غالبًا إلى قلم وورقة للوصول إلى الإجابة الصحيحة لأن هناك خطوات وسيطة. على سبيل المثال، إذا كان لدى مزارع دجاج وبقر، وكان لديهم معًا 40 رأسًا و120 ساقًا، قد تحتاج إلى كتابة معادلة بسيطة للوصول إلى الجواب (20 دجاجة و20 بقرة).
في سياق الذكاء الاصطناعي، يعني التفكير التسلسلي للنماذج اللغوية الكبيرة تقسيم المشكلة إلى خطوات أصغر، متوسطة لتحسين جودة النتيجة النهائية. عادةً ما يستغرق الأمر وقتًا أطول للحصول على إجابة، لكن من المحتمل أن تكون الإجابة صحيحة، خاصةً في سياق المنطق أو البرمجة. يتم تطوير نماذج التفكير من نماذج اللغة الكبيرة التقليدية وتحسينها لتفكير تسلسلي بفضل التعلم المعزز.
(انظر: نموذج اللغة الكبير)
هذا مفهوم أكثر تحديدًا من “وكيل الذكاء الاصطناعي”، مما يعني برنامجًا يمكنه اتخاذ إجراءات بمفرده، خطوة بخطوة، لتحقيق هدف. وكيل البرمجة هو نسخة متخصصة تطبق على تطوير البرمجيات. بدلاً من تقديم اقتراحات كود للبشر للمراجعة واللصق، يمكن لوكيل البرمجة كتابة واختبار وتصحيح الكود بشكل مستقل، مما يتعامل مع نوع من العمل التكراري، الحديد والتجريبي الذي يستهلك عادةً يوم المطور. يمكن لهذه الوكلاء أن تعمل عبر مجموعة كاملة من التعليمات البرمجية، واكتشاف الأخطاء، وتشغيل الاختبارات، وتطبيق التصحيحات بأدنى إشراف بشري. فكر في الأمر كما لو كنت توظف متدربًا سريعًا جدًا لا ينام أبدًا ولا يفقد التركيز — على الرغم من أنه، كما هو الحال مع أي متدرب، لا يزال يتعين على الإنسان مراجعة العمل.
على الرغم من كونه مصطلحًا متعدد الأوجه إلى حد ما، يشير الحوسبة عمومًا إلى الطاقة الحاسوبية الحيوية التي تسمح لنماذج الذكاء الاصطناعي بالعمل. هذا النوع من المعالجة يغذي صناعة الذكاء الاصطناعي، مما يمنحها القدرة على تدريب وتوظيف نماذجها القوية. غالبًا ما يكون المصطلح اختصارًا لأنواع من الأجهزة التي توفر الطاقة الحاسوبية— أشياء مثل وحدات معالجة الرسوميات (GPUs)، ووحدات المعالجة المركزية (CPUs)، ووحدات معالجة التنسق (TPUs)، وأشكال أخرى من البنية التحتية التي تشكل أساس صناعة الذكاء الاصطناعي الحديثة.
مجموعة فرعية من التعلم الآلي الذاتي التحسين التي يتم تصميم خوارزميات الذكاء الاصطناعي بها بهيكل شبكة عصبية اصطناعية (ANN) متعددة الطبقات. وهذا يسمح لها بعمل ارتباطات أكثر تعقيدًا مقارنةً بالأنظمة المعتمدة على التعلم الآلي الأساسية، مثل النماذج الخطية أو أشجار القرار. يستلهم هيكل خوارزميات التعلم العميق من المسارات المترابطة للخلايا العصبية في الدماغ البشري.
نموذجات الذكاء الاصطناعي القائمة على التعلم العميق قادرة على التعرف على الخصائص المهمة في البيانات بنفسها، بدلاً من الحاجة إلى مهندسين بشريين لتعريف هذه الميزات. كما أن الهيكل يدعم الخوارزميات التي يمكنها التعلم من الأخطاء، ومن خلال عملية التكرار والتعديل، تحسين نتائجها الخاصة. ومع ذلك، فإن أنظمة التعلم العميق تتطلب الكثير من نقاط البيانات لتحقيق نتائج جيدة (ملايين أو أكثر). كما أنها تحتاج عادةً إلى وقت أطول للتدريب مقارنةً بخوارزميات التعلم الآلي الأبسط — لذا تميل تكاليف التطوير إلى أن تكون أعلى.
(انظر: الشبكة العصبية)
الانتشار هو التقنية في قلب العديد من نماذج الذكاء الاصطناعي التي تولد الفن والموسيقى والنصوص. مستوحاة من الفيزياء، تدمر أنظمة الانتشار ببطء بنية البيانات – على سبيل المثال، الصور والأغاني وما إلى ذلك – عن طريق إضافة ضوضاء حتى لا يبقى شيء. في الفيزياء، الانتشار عفوي ولا رجعة فيه — السكر المذاب في القهوة لا يمكن استعادته إلى شكل مكعب. ولكن تهدف أنظمة الانتشار في الذكاء الاصطناعي إلى تعلم نوع من عملية “الانتشار العكسي” لاستعادة البيانات المدمرة، مكتسبة القدرة على استرجاع البيانات من الضوضاء.
التقطير هو تقنية تُستخدم لاستخراج المعرفة من نموذج كبير للذكاء الاصطناعي بنموذج “المدرس-الطالب”. يرسل المطورون طلبات إلى نموذج المعلم ويسجلون المخرجات. في بعض الأحيان، تتم مقارنة الإجابات مع مجموعة بيانات لقياس مدى دقتها. تُستخدم هذه المخرجات بعد ذلك لتدريب نموذج الطالب، الذي يتم تدريبه ليقارب سلوك المعلم.
يمكن استخدام التقطير لإنشاء نموذج أصغر وأكثر كفاءة بناءً على نموذج أكبر مع انخفاض الحد الأدنى من خسائر التقطير. من المحتمل أن يكون هذا هو الطريقة التي طورت بها OpenAI GPT-4 Turbo، النسخة الأسرع من GPT-4.
بينما تستخدم جميع شركات الذكاء الاصطناعي التقطير داخليًا، قد يكون قد تم استخدامه أيضًا من قبل بعض شركات الذكاء الاصطناعي لملاحقة النماذج الرائدة. عادةً ما ينتهك التقطير من المنافسين شروط خدمة واجهات برمجة التطبيقات الخاصة بالذكاء الاصطناعي ومساعدي المحادثة.
يشير هذا إلى مزيد من تدريب نموذج الذكاء الاصطناعي لتحسين الأداء لمهمة أو مجال أكثر تحديدًا مما كان نقطة تركيز التدريب السابقة — عادةً من خلال إدخال بيانات جديدة متخصصة (أي موجهة نحو المهمة).
تقوم العديد من الشركات الناشئة في مجال الذكاء الاصطناعي بأخذ نماذج اللغة الكبيرة كنقطة انطلاق لبناء منتج تجاري لكنها تنافس على زيادة الفائدة لقطاع أو مهمة معينة من خلال تكملة دورات التدريب السابقة على معارفها وخبراتها الخاصة.
(انظر: نموذج اللغة الكبير [LLM])
GAN، أو الشبكة التنافسية التوليدية، هي نوع من إطار التعلم الآلي الذي يدعم بعض التطورات المهمة في الذكاء الاصطناعي التوليدي عندما يتعلق الأمر بإنتاج بيانات واقعية – بما في ذلك (لكن ليس فقط) أدوات التزييف العميق. تتضمن GANs استخدام زوج من الشبكات العصبية، حيث تستند إحداها إلى بياناتها التدريبية لتوليد مخرج يتم تمريره إلى النموذج الآخر للتقييم.
تم برمجة النموذجاتين في الأساس لمحاولة التفوق على بعضهم البعض. يحاول المولد تمرير مخرجه إلى منفذ التمييز، بينما يعمل منفذ التمييز على كشف البيانات المتولدة صناعيًا. يمكن أن تساعد هذه المنافسة المنظمة في تحسين مخرجات الذكاء الاصطناعي لتكون أكثر واقعية دون الحاجة إلى تدخل بشري إضافي. ومع أن GANs تعمل بشكل أفضل في تطبيقات أضيق (مثل إنتاج صور أو مقاطع فيديو واقعية)، بدلاً من الذكاء الاصطناعي العام.
الهلوسة هو المصطلح المفضل لصناعة الذكاء الاصطناعي لوصف نماذج الذكاء الاصطناعي التي تخلق معلومات خاطئة – أي توليد معلومات غير صحيحة. من الواضح أن هذه مشكلة كبيرة لجودة الذكاء الاصطناعي.
تؤدي الهلاوس إلى إنتاج نتائج GenAI التي يمكن أن تكون مضللة وقد تؤدي حتى إلى مخاطر حقيقية – مع عواقب محتملة خطيرة (فكر في استفسار صحي يعود بنصائح طبية ضارة).
يعتقد أن مشكلة تصنيع المعلومات من قبل الذكاء الاصطناعي تنشأ كعاقبة للفجوات في بيانات التدريب.تساهم الهلاوس في دفع نحو نماذج الذكاء الاصطناعي المتخصصة بشكل متزايد و/أو الرأسية – أي الذكاءات الاصطناعية الخاصة بالنطاق التي تتطلب خبرة أضيق – كوسيلة لتقليل احتمال الفجوات المعرفية وتقليص مخاطر المعلومات المضللة.
الاستنتاج هو عملية تشغيل نموذج الذكاء الاصطناعي. إنها عملية اتخاذ نموذج ليتنبأ أو يستخلص استنتاجات من البيانات المرئية مسبقًا. لتكون الأمور واضحة، لا يمكن أن يحدث الاستنتاج بدون تدريب؛ يجب على النموذج تعلم الأنماط في مجموعة من البيانات قبل أن يتمكن من استنتاج المعلومات بشكل فعال من بيانات التدريب هذه.
يمكن لعدة أنواع من الأجهزة أداء الاستنتاج، بدءًا من معالجات الهواتف الذكية إلى وحدات المعالجة الرسومية القوية إلى المسرعات الذكية المصممة خصيصًا للذكاء الاصطناعي. لكن ليس جميع تلك الأجهزة يمكنها التعامل مع النماذج بنفس الكفاءة. قد تستغرق النماذج الكبيرة جدًا عمرًا في تقديم التنبؤات على، دعنا نقول، جهاز اللابتوب مقارنةً بالخادم السحابي مع شرائح ذكاء اصطناعي عالية الأداء.
[انظر: التدريب]
نموذج اللغة الكبير، أو LLMs، هو نماذج الذكاء الاصطناعي المستخدمة من قبل مساعدين ذكاء اصطناعي شهيرين، مثل ChatGPT، وClaude، وGoogle’s Gemini، وMeta’s AI Llama، وMicrosoft Copilot، أو Mistral’s Le Chat. عندما تتحدث مع مساعد ذكاء اصطناعي، تتفاعل مع نموذج اللغة الكبير الذي يعالج طلبك مباشرة أو بمساعدة أدوات مختلفة متاحة، مثل تصفح الويب أو مترجمات الكود.
LLMs هي شبكات عصبية عميقة مصنوعة من مليارات المعلمات العددية (أو الأوزان، انظر أدناه) التي تتعلم العلاقات بين الكلمات والعبارات وتخلق تمثيلًا للغة، وهو شبه خريطة متعددة الأبعاد للكلمات.
تُنشأ هذه النماذج من ترميز الأنماط التي تجدها في مليارات الكتب والمقالات والنسخ النصية. عندما تطلب نموذج LLM، يولد النموذج الأرجح الأنماط التي تناسب الطلب.
(انظر: الشبكة العصبية)
ذاكرة التخزين المؤقت تشير إلى عملية مهمة تعزز الاستنتاج (وهي العملية التي يعمل بها الذكاء الاصطناعي لتوليد استجابة لاستفسار المستخدم). في الجوهر، تعتبر التخزين المؤقت تقنية تحسين، مصممة لجعل الاستنتاج أكثر كفاءة. من الواضح أن الذكاء الاصطناعي يعمل بدفع حسابات رياضية عالية الطاقة، وكلما تم إجراء تلك الحسابات، يستهلكون المزيد من الطاقة. تم تصميم التخزين المؤقت لتقليل عدد الحسابات التي قد يحتاج النموذج إلى تشغيلها من خلال حفظ حسابات معينة لاستفسارات المستخدم المستقبلية والعمليات. هناك أنواع مختلفة من التخزين المؤقت، على الرغم من أن واحدة من أكثرها شهرة هي تخزين KV (أو تخزين القيمة الرئيسية). يعمل تخزين KV في النماذج القائمة على المحولات، ويزيد من الكفاءة، مما يدفع النتائج الأسرع عن طريق تقليل الوقت (والجهد الخوارزمي) المطلوب لتوليد إجابات على أسئلة المستخدمين.
(انظر: الاستنتاج)
الشبكة العصبية تشير إلى الهيكل الخوارزمي متعدد الطبقات الذي يقوم عليه التعلم العميق – وأيضًا، بشكل أوسع، الزخم بالكامل في أدوات الذكاء الاصطناعي التوليدية following the emergence of large language models.
على الرغم من أن فكرة أخذ الإلهام من المسارات المتصلة بكثافة في الدماغ البشري كهياكل تصميم خوارزميات معالجة البيانات تعود إلى الأربعينيات، فقد كان ارتفاع عتاد معالجة الرسوميات (GPUs) — عبر صناعة ألعاب الفيديو — هو الذي فتح حقًا قوة هذه النظرية. أثبتت هذه الشرائح أنها مناسبة للغاية لتدريب الخوارزميات التي تحتوي على العديد من الطبقات بشكل أكبر من السابق — مما مكن أنظمة الذكاء الاصطناعي القائمة على الشبكات العصبية من تحقيق أداء أفضل بكثير عبر العديد من المجالات، بما في ذلك التعرف على الصوت، والملاحة الذاتية، واكتشاف الأدوية.
(انظر: نموذج اللغة الكبير [LLM])
المصادر المفتوحة تشير إلى البرمجيات — أو، بشكل متزايد، نماذج الذكاء الاصطناعي — حيث يتم جعل الشفرة الأساسية متاحة للجمهور ليستخدمها أي شخص، أو تفحصها، أو تعديلها. في عالم الذكاء الاصطناعي، عائلة نماذج Llama التابعة لشركة Meta هي مثال بارز؛ في حين أن Linux هو التوازي التاريخي الشهير في أنظمة التشغيل. تتيح approaches المفتوحة للباحثين والمطورين والشركات حول العالم البناء على عمل بعضهم البعض، مما يسرع التقدم ويسمح بإجراء تدقيقات أمان مستقلة لا يمكن أن توفرها الأنظمة المغلقة بسهولة. المصدر المغلق يعني أن الشفرة خاصة – يمكنك استخدام المنتج لكن لا يمكنك رؤية كيفية عمله، مثلما هو الحال مع نماذج OpenAI GPT – وهذا التمييز أصبح واحدًا من المناقشات المحددة في صناعة الذكاء الاصطناعي.
التوازي يعني القيام بعدة أشياء في نفس الوقت بدلاً من القيام بها واحدة تلو الأخرى – مثل وجود 10 موظفين يعملون على أجزاء مختلفة من مشروع في نفس الوقت، بدلاً من أن يقوم موظف واحد بعمل كل شيء بالتسلسل. في الذكاء الاصطناعي، يُعتبر التوازي أساسيًا لكل من التدريب والاستنتاج: تم تصميم وحدات معالجة الرسوم الحديثة خصيصًا لإجراء الآلاف من الحسابات في وقت واحد، مما يعد سببًا كبيرًا وراء كونها العمود الفقري للأجهزة في الصناعة. مع زيادة تعقيد أنظمة الذكاء الاصطناعي وكبر حجم النماذج، أصبحت القدرة على توزيع العمل عبر العديد من الشرائح والعديد من الآلات إحدى العوامل الأكثر أهمية في تحديد مدى سرعة وفعالية هندسة النماذج ونشرها. أصبحت الأبحاث حول استراتيجيات التوازي الأفضل الآن مجال دراسة منفصل.
راماجيدون هو المصطلح الجديد الممتع لاتجاه غير ممتع يجتاح صناعة التكنولوجيا: نقص دائم ومتزايد في ذاكرة الوصول العشوائي، أو شرائح RAM، التي تدعم تقريبًا جميع المنتجات التقنية التي نستخدمها في حياتنا اليومية. مع ازدهار صناعة الذكاء الاصطناعي، كانت أكبر الشركات التكنولوجية ومختبرات الذكاء الاصطناعي — جميعها تتنافس للحصول على أقوى وأفضل ذكاء اصطناعي — تشتري RAM بكميات هائلة لتشغيل مراكز بياناتها بحيث لم يتبقى الكثير لباقي منا. ويعني هذا الاختناق في الإمدادات أن ما تبقى يصبح أكثر وأكثر تكلفة.
يتضمن ذلك صناعات مثل الألعاب (حيث كان يتعين على الشركات الكبرى رفع أسعار الأجهزة لأنها أصبحت أكثر صعوبة في إيجاد شرائح الذاكرة لأجهزتها)، والإلكترونيات الاستهلاكية (حيث قد يؤدي نقص الذاكرة إلى أكبر انخفاض في شحنات الهواتف الذكية منذ أكثر من عقد)، والحوسبة العامة للشركات (لأن تلك الشركات لا تستطيع الحصول على ما يكفي من RAM لمراكز البيانات الخاصة بها). من المتوقع أن يتوقف ارتفاع الأسعار بعد انتهاء النقص المخيف، لكن للأسف، لا توجد أي علامة على أن ذلك سيحدث في أي وقت قريب.
مثل AGI، فإن التحسين الذاتي المتكرر هو حاجز لكيفية ذكاء الذكاء الاصطناعي وكيف يمكن أن يعتمد قليلًا على البشر. في سيناريو RSI، تبدأ نماذج الذكاء الاصطناعي في تحسين نفسها بدون تدخل بشري، مما يؤدي إلى تسريع هائل في القدرات والاعتماد على الذات. في بعض الروايات، سيكون هذه لحظة كارثية توازي التفرد، لحظة يصبح فيها نماذج الذكاء الاصطناعي محصنة ضد التدخل الخارجي. لكن RSI يصف أيضًا قدرة أساسية – هل يمكن أن يصمم نموذج الذكاء الاصطناعي سلفه؟ – مما يجعل من الأسهل بكثير على المهندسين محاولة بناءه. وقد قامت عدد من الشركات الناشئة في الذكاء الاصطناعي مؤخرًا بمحاولة بناء نماذج تتحسن ذاتيًا بشكل متكرر، لكن معظمها تتجاهل الآثار الكارثية، مقدمة RSI فقط كالتالي حدود جديدة للبحث.
التعلم المعزز هو وسيلة لتدريب الذكاء الاصطناعي حيث يتعلم النظام من خلال تجربة الأشياء والحصول على مكافآت مقابل الإجابات الصحيحة — مثل تدريب حيوانك الأليف المحبوب بعلاجات، باستثناء أن “الحيوان الأليف” في هذا السيناريو هو شبكة عصبية و”المكافأة” هي إشارة رياضية تدل على النجاح. بعكس التعلم الموجه، حيث يتم تدريب النموذج على مجموعة بيانات ثابتة من الأمثلة المصنفة، يسمح التعلم المعزز للنموذج باستكشاف بيئته، واتخاذ الإجراءات، وتحديث سلوكه بشكل مستمر بناءً على التعليقات التي يتلقاها. وقد أثبتت هذه الطريقة أنها قوية بشكل خاص لتدريب الذكاء الاصطناعي على لعب الألعاب، والتحكم في الروبوتات، ومؤخراً، تحسين القدرات الاستدلالية للنماذج اللغوية الكبيرة. تقنيات مثل التعلم المعزز من ردود الفعل البشرية، أو RLHF، أصبحت الآن مركزية في كيفية تعديل مختبرات الذكاء الاصطناعي الرائدة نماذجها لتكون أكثر فائدة ودقة وأمانًا.
عندما يتعلق الأمر بالتواصل بين الإنسان والآلة، هناك بعض التحديات الواضحة – فالناس يتواصلون باستخدام اللغة البشرية، بينما تنفذ برامج الذكاء الاصطناعي المهام من خلال عمليات حسابية معقدة مستندة إلى البيانات. وتعمل الرموز كجسر لتلك الفجوة: فهي اللبنات الأساسية للتواصل بين البشر والذكاء الاصطناعي، وتمثل أجزاء منفصلة من البيانات التي تم معالجتها أو إنتاجها بواسطة LLM. يتم إنشاؤها من خلال عملية تسمى الترميز، التي تقوم بتفكيك النص الخام إلى وحدات صغيرة يمكن لنموذج اللغة هضمها، بشكل مشابه لكيفية ترجمة المترجمين اللغة البشرية إلى كود ثنائي يمكن للحاسوب فهمه. في أماكن العمل، تحدد الرموز أيضًا التكلفة – حيث تتقاضى معظم شركات الذكاء الاصطناعي رسوم استخدام LLM على أساس لكل رمز، مما يعني أنه كلما استخدمت الأعمال المزيد، زادت ما تدفعه.
لذا مرة أخرى، الرموز هي القطع الصغيرة من النص — وغالبًا أجزاء من الكلمات بدلاً من الكلمات الكاملة — التي تفكك نماذج اللغة الاصطناعية اللغة إلى ما قبل معالجتها؛ فهي تعادل تقريبيًا “الكلمات” لأغراض فهم أعباء عمل الذكاء الاصطناعي. يشار إلى الإنتاجية بأنها مقدار ما يمكن معالجته في فترة معينة من الوقت، لذا فإن إنتاجية الرموز هي في الأساس مقياس لمدى قدرة نظام على معالجة العمل AI في وقت واحد. تعتبر إنتاجية الرموز العالية هدفًا رئيسيًا لفرق بنية الذكاء الاصطناعي، حيث تحدد عدد المستخدمين الذين يمكن أن يخدمهم النموذج في وقت واحد ومدى سرعة تلقي كل منهم استجابة. لقد وصف الباحث في الذكاء الاصطناعي أندريه كارباتي شعور القلق عندما تجلس اشتراكاته في الذكاء الاصطناعي بلا استخدام — مترددًا بنفس الشعور الذي شعر به كطالب دراسات عليا عندما كانت الأجهزة الحاسوبية باهظة الثمن لم تُستخدم بشكل كامل — شعور يلتقط سبب كون زيادة إنتاجية الرموز نوعًا من الهوس في هذا المجال.
تطوير الذكاء الاصطناعي القائم على التعلم الآلي يتضمن عملية تُعرف باسم التدريب. ببساطة، تشير هذه إلى البيانات التي يتم تغذيتها للنموذج لكي يتعلم الأنماط ويولِّد مخرجات مفيدة. في الأساس، هي عملية استجابة النظام للخصائص في البيانات التي تمكنه من تكييف المخرجات نحو هدف مطلوب — سواء كان ذلك تحديد صور القطط أو إنتاج هايكو عند الطلب.
يمكن أن يكون التدريب مكلفًا لأنه يتطلب الكثير من المدخلات، وحجم البيانات المطلوبة كان في اتجاه تصاعدي – وهذا هو السبب في أن الأساليب الهجينة، مثل تحسين الذكاء الاصطناعي القائم على القواعد باستخدام بيانات مستهدفة، يمكن أن تساعد في إدارة التكاليف دون بدء العمل من الصفر تمامًا.
[انظر: الاستنتاج]
تقنية حيث يتم استخدام نموذج ذكاء اصطناعي تم تدريبه سابقًا كنقطة انطلاق لتطوير نموذج جديد لمهمة مختلفة ولكن عادةً مرتبطة – مما يسمح بإعادة استخدام المعرفة المكتسبة في دورات التدريب السابقة.
يمكن أن يدفع التعلم الانتقالي توفيرات الكفاءة من خلال اختصار تطوير النماذج. يمكن أن يكون مفيدًا أيضًا عندما تكون البيانات الخاصة بالمهمة التي يتم تطوير النموذج من أجلها محدودة نوعًا ما. ومع ذلك، من المهم أن نلاحظ أن هذه الطريقة لها حدود. ستحتاج النماذج التي تعتمد على التعلم الانتقالي للحصول على قدرات عامة إلى التدريب على بيانات إضافية من أجل الأداء بشكل جيد في مجال تركيزها.
(انظر: تحسين)
خسارة التحقق هي رقم يخبرك بمدى تعلم نموذج الذكاء الاصطناعي أثناء التدريب — وكلما كانت أقل، كان أداء النموذج أفضل. يتتبع الباحثون ذلك عن كثب كنوع من تقرير بطاقة في الوقت الفعلي، مما يستخدمونه لتحديد متى يتوقفون عن التدريب، ومتى يجب عليهم ضبط المعلمات، أو ما إذا كان يجب عليهم التحقيق في مشكلة محتملة. واحدة من المخاوف الرئيسية التي يساعد ذلك في تحديدها هي الإفراط في التجهيز، وهي حالة يحفظ فيها النموذج بيانات التدريب الخاصة به بدلاً من تعلم الأنماط التي يمكن تعميمها على حالات جديدة. فكر في ذلك كفرق بين طالب يفهم فعلاً المادة وآخر يحفظ ببساطة الامتحان من العام الماضي — تساعد خسارة التحقق في كشف أي منهما يصبح نموذجك.
الأوزان هي جوهر تدريب الذكاء الاصطناعي، حيث تحدد مدى أهمية (أو وزن) ميزات مختلفة (أو متغيرات إدخال) في البيانات المستخدمة لتدريب النظام — مما يشكل مخرجات نموذج الذكاء الاصطناعي.
بعبارة أخرى، الأوزان هي معلمات عددية تحدد ما هو الأكثر بروزًا في مجموعة البيانات المهمة للتدريب المعني. تقوم بذلك من خلال تطبيق الضرب على المدخلات. عادة ما يبدأ تدريب النموذج بأوزان معينة تعيين عشوائيًا، ولكن مع تقدم العملية، تتAdjust الأوزان وفقًا لما يسعى النموذج إلى الوصول إليه.
على سبيل المثال، نموذج ذكاء اصطناعي لتوقع أسعار المنازل الذي يتم تدريبه بناءً على بيانات العقارات التاريخية لموقع مستهدف قد يتضمن أوزان لميزات مثل عدد غرف النوم والحمامات، وما إذا كانت الممتلكات منفصلة أو شبه منفصلة، وما إذا كان لديها موقف سيارات، وكراج، وما إلى ذلك.
في النهاية، تعكس الأوزان التي يرفقها النموذج بكل من هذه المدخلات مدى تأثيرها على قيمة الممتلكات، استنادًا إلى مجموعة البيانات المعطاة.
تتم تحديث هذه المقالة بانتظام بمعلومات جديدة.
عند الشراء من خلال الروابط في مقالاتنا، قد نكسب عمولة صغيرة. هذا لا يؤثر على استقلاليتنا التحريرية.