أصبح من الأسهل قليلاً بناء مشاريع روبوتية متطورة في المنزل.
في وقت سابق من هذا الأسبوع، أصدرت منصة تطوير الذكاء الاصطناعي Hugging Face نموذجًا مفتوحًا للذكاء الاصطناعي للروبوتات يسمى SmolVLA. تم تدريبه على مجموعات بيانات مرخصة ومت共享ة من المجتمع، وتزعم Hugging Face أن SmolVLA يتفوق على نماذج أكبر بكثير في الروبوتات في كل من البيئات الافتراضية والواقعية.
“تهدف SmolVLA إلى ديمقراطية الوصول إلى نماذج الرؤية-اللغة-العمل [VLA] وتسريع البحث نحو وكلاء الروبوتات العامة”، تكتب Hugging Face في منشور مدونة. “SmolVLA ليس نموذجًا خفيف الوزن لكنه قادر، بل أيضًا طريقة لتدريب وتقييم تكنولوجيات الروبوتات العامة.”
SmolVLA هو جزء من جهود Hugging Face النامية بسرعة لإنشاء نظام بيئي من الأجهزة والبرامج الروبوتية منخفضة التكلفة. في العام الماضي، أطلقت الشركة LeRobot، وهي مجموعة من النماذج ومجموعات البيانات والأدوات التي تركز على الروبوتات. ومؤخراً، استحوذت Hugging Face على Pollen Robotics، وهي شركة ناشئة في مجال الروبوتات مقرها في فرنسا، وكشفت عن عدة أنظمة روبوتية منخفضة التكلفة، بما في ذلك الروبوتات البشرية، للبيع.
تم تدريب SmolVLA، الذي يحتوي على 450 مليون معلمة، على بيانات من مجموعات بيانات مجتمع LeRobot، وهي مجموعات بيانات روبوتية محددة بشكل خاص تم مشاركتها على منصة تطوير الذكاء الاصطناعي الخاصة بـ Hugging Face. المعلمات، التي تُسمى أحيانًا الأوزان، هي المكونات الداخلية للنموذج التي توجه سلوكه.
تدعي Hugging Face أن SmolVLA صغير بما يكفي للعمل على وحدة معالجة الرسوميات الاستهلاكية الواحدة — أو حتى MacBook — ويمكن اختباره ونشره على الأجهزة “الميسورة التكلفة”، بما في ذلك أنظمة الروبوتات الخاصة بالشركة.
في تطور مثير، يدعم SmolVLA أيضًا “كومة استدلال غير متزامنة”، والتي تقول Hugging Face إنها تسمح للنموذج بفصل معالجة أفعال الروبوت عن معالجة ما يراه ويسمعه. كما تشرح الشركة في منشور مدونتها، “[ب]فضل هذا الفصل، يمكن للروبوتات الاستجابة بشكل أسرع في البيئات المتغيرة بسرعة.”
SmolVLA متاح للتنزيل من Hugging Face. وقد ادعى مستخدم على منصة X أنه استخدم النموذج للتحكم في ذراع روبوتية تابعة لجهة خارجية:
ومن الجدير بالذكر أن Hugging Face ليست اللاعب الوحيد في سباق الروبوتات المفتوحة الناشئة.
تمتلك Nvidia مجموعة من الأدوات للروبوتات المفتوحة، وتقوم شركة K-Scale Labs الناشئة ببناء المكونات لما تعتقد أنه “الروبوتات البشرية مفتوحة المصدر”. تشمل الشركات القوية الأخرى في هذا المجال Dyna Robotics، وPhysical Intelligence المدعومة من جيف بيزوس، وRLWRLD.