أدوات البرمجة المعتمدة على الذكاء الاصطناعي تنتقل إلى مكان مفاجئ: الطرفية

أدوات البرمجة المعتمدة على الذكاء الاصطناعي تنتقل إلى مكان مفاجئ

على مر السنين، كانت أدوات تحرير الشيفرة مثل Cursor وWindsurf وCopilot من GitHub هي المعيار لتطوير البرمجيات المدعومة بالذكاء الاصطناعي. ولكن مع تزايد قوة الذكاء الاصطناعي الفعال وازدهار البرمجة بالاهتزاز، حدث تحول طفيف في كيفية تفاعل أنظمة الذكاء الاصطناعي مع البرمجيات. بدلاً من العمل على الشيفرات، أصبحوا بشكل متزايد يتفاعلون مباشرة مع واجهة النظام الذي تم تثبيت البرامج فيه. إنها تغييرات كبيرة في كيفية حدوث تطوير البرمجيات المدعوم بالذكاء الاصطناعي – وعلى الرغم من أن هذا التحول ليس ملحوظًا كثيرًا، إلا أنه قد يكون له آثار كبيرة على اتجاه هذا المجال في المستقبل.

تُعرف وحدة التحكم بشكل أفضل بشاشة الأبيض والأسود التي تتذكرها من أفلام القراصنة في التسعينيات – وهي طريقة قديمة جدًا لتشغيل البرامج ومعالجة البيانات. إنها ليست مثيرة بصريًا مثل محررات الشيفرات المعاصرة، لكنها واجهة قوية للغاية إذا كنت تعرف كيفية استخدامها. وعلى الرغم من أن الوكلاء المعتمدين على الشيفرات يمكنهم كتابة وتصحيح الشيفرات، فإن أدوات الوحدة الطرفية غالبًا ما تكون مطلوبة لتحويل البرمجيات من الشيفرات المكتوبة إلى شيء يمكن استخدامه فعليًا.

جاء أوضح دليل على التحول إلى الوحدة الطرفية من المختبرات الكبرى. منذ فبراير، أصدرت كل من Anthropic وDeepMind وOpenAI أدوات برمجة من سطر الأوامر (Claude Code وGemini CLI وCLI Codex على التوالي)، وهي بالفعل من بين المنتجات الأكثر شعبية لهذه الشركات. كان من السهل تفويت هذا التحول، حيث تعمل إلى حد كبير تحت نفس العلامة التجارية مثل أدوات البرمجة السابقة. لكن في الخلفية، كانت هناك تغييرات حقيقية في كيفية تفاعل الوكلاء مع أجهزة الكمبيوتر الأخرى، سواءً عبر الإنترنت أو خارجها. يعتقد بعضهم أن هذه التغييرات لا تزال في بداياتها.

يقول أليكس شو، الشريك في إنشاء المعايير الرائدة التي تركز على وحدة التحكم TerminalBench: “رهاننا الكبير هو أن هناك مستقبلًا حيث يكون 95% من تفاعل LLM مع الكمبيوتر من خلال واجهة تشبه الوحدة الطرفية.”

تأتي أدوات قائمة على الوحدة الطرفية في وقت يبدأ فيه ظهور أدوات قائمة على الشيفرات في تراجع. تم تفكيك محرر شيفرات الذكاء الاصطناعي Windsurf جراء عمليات استحواذ متعارضة، حيث تم توظيف كبار المديرين التنفيذيين من قبل Google وتم الاستحواذ على الشركة المتبقية من قبل Cognition – مما ترك المستقبل بعيد المدى للمنتج الاستهلاكي غير مؤكد.

في الوقت نفسه، تشير الأبحاث الجديدة إلى أن المبرمجين قد يبالغون في تقدير المكاسب الإنتاجية من الأدوات التقليدية. وجدت دراسة METR التي اختبرت Cursor Pro، منافسة Windsurf الرئيسية، أنه بينما قدر المطورون أنهم يمكنهم إكمال المهام بشكل أسرع بنسبة 20-30%، كانت العملية الملحوظة أبطأ بما يقرب من 20%. باختصار، كان مساعد الشيفرة يكلف المبرمجين الوقت.

ترك ذلك فرصة لشركات مثل Warp، التي تحتل حاليًا المرتبة الأولى على TerminalBench. تصف Warp نفسها بأنها “بيئة تطوير فعالة”، نقطة وسط بين برامج IDE وأدوات سطر الأوامر مثل Claude Code. لكن مؤسس Warp زاك لويد لا يزال متفائلًا بشأن الوحدة الطرفية، حيث يرى أنها وسيلة لمواجهة المشكلات التي ستكون خارج نطاق محرر الشيفرات مثل Cursor.

يقول لويد: “تشغل الوحدة الطرفية مستوى منخفض جدًا في مجموعة أدوات المطور، لذا هي الأكثر تنوعًا لتشغيل الوكلاء.”

لفهم كيف يختلف النهج الجديد، يمكن أن يكون من المفيد النظر إلى المعايير المستخدمة لقياسها. كان الجيل القائم على الشيفرة من الأدوات يركز على حل مشكلات GitHub، وهي أساس اختبار SWE-Bench. كل مشكلة على SWE-Bench هي قضية مفتوحة من GitHub – أساسًا، قطعة من الشيفرة التي لا تعمل. يقوم النماذج بتكرار الشيفرة حتى يجدوا شيئًا يعمل، مما يحل المشكلة. أنشأت المنتجات المتكاملة مثل Cursor أساليب أكثر تطورًا للمشكلة، لكن نموذج GitHub/SWE-Bench لا يزال هو جوهر كيفية اقتراب هذه الأدوات من المشكلة: بدءًا من الشيفرات المعطلة وتحويلها إلى شيفرة تعمل.

تأخذ الأدوات المستندة إلى الوحدة الطرفية نظرة أوسع، حيث تنظر إلى ما وراء الشيفرة إلى البيئة الكاملة التي يعمل فيها البرنامج. يشمل ذلك البرمجة ولكن أيضًا مهام تتوجه أكثر نحو DevOps مثل تكوين خادم Git أو استكشاف مشاكل تشغيل سكريبت. في أحد مشاكل TerminalBench، تعطي التعليمات برنامج فك الضغط وملف نصي مستهدف، تتحدَّى الوكيل لعكس هندسة خوارزمية ضغط متطابقة. تسأل أخرى الوكيل لبناء نواة لينكس من المصدر، دون أن تذكر أن الوكيل سيحتاج لتحميل الشيفرة المصدرية بنفسه. يتطلب حل المشكلات نوع المهارات الحادة في حل المشكلات التي يحتاجها المبرمجون.

يقول شو: “ما يجعل TerminalBench صعبًا ليس فقط الأسئلة التي نقدمها للوكلاء، بل البيئات التي نضعهم فيها.”

من الأهمية بمكان، أن يعني هذا النهج الجديد معالجة القضية خطوة بخطوة – نفس المهارة التي تجعل الذكاء الاصطناعي الفعال قويًا جدًا. ولكن حتى أكثر النماذج المتقدمة لا يمكنها التعامل مع كل تلك البيئات. حصلت Warp على درجتها العالية في TerminalBench من خلال حل أكثر بقليل من نصف المشكلات – علامة على مدى تحدي المعيار، ولكن أيضًا مدى العمل الذي لا يزال يتعين القيام به لإطلاق العنان للإمكانات الكاملة للوحدة الطرفية.

مع ذلك، يعتقد لويد أننا في نقطة حيث يمكن للأدوات القائمة على الوحدة الطرفية التعامل بشكل موثوق مع الكثير من العمل غير البرمجي للمطور – وهي قيمة يصعب تجاهلها.

يقول لويد: “إذا فكرت في العمل اليومي لتأسيس مشروع جديد، وفهم الاعتماديات وجعله قابلاً للتشغيل، يمكن لـ Warp القيام بذلك بشكل شبه مستقل.” “وإذا لم تتمكن من القيام بذلك، فسوف تخبرك لماذا.”


المصدر

Exit mobile version