تقوم Google بطرح ميزة في واجهة برمجة تطبيقات Gemini التي تدعي الشركة أنها ستجعل أحدث طرز الذكاء الاصطناعي أرخص لمطوري الطرف الثالث.
تستدعي Google ميزة “التخزين المؤقت الضمنية” وتقول إنها يمكن أن توفر مدخرات 75 ٪ على “السياق المتكرر” التي تم تمريرها إلى النماذج عبر واجهة برمجة تطبيقات Gemini. وهو يدعم طرازات Google Gemini 2.5 Pro و 2.5 فلاش.
من المحتمل أن تكون هذه الأخبار موضع ترحيب للمطورين مع استمرار نمو نماذج الحدود.
التخزين المؤقت ، وهي ممارسة تم تبنيها على نطاق واسع في صناعة الذكاء الاصطناعى ، تعيد استخدامها بشكل متكرر أو تم حساب البيانات مسبقًا من النماذج لخفض متطلبات الحوسبة والتكلفة. على سبيل المثال ، يمكن لذاكرة التخزين المؤقت تخزين إجابات للأسئلة التي يطرحها المستخدمون غالبًا على نموذج ، مما يلغي الحاجة إلى النموذج لإعادة إنشاء إجابات على نفس الطلب.
عرضت Google سابقًا التخزين المؤقت النموذجية ، ولكن فقط صريح التخزين المؤقت السريع ، وهذا يعني أن Devs كان على تحديد المطالبات أعلى التردد. على الرغم من أنه من المفترض أن تكون وفورات التكاليف مضمونة ، إلا أن التخزين المؤقت السريع الصريح غالبًا ما يشمل الكثير من العمل اليدوي.
لم يكن بعض المطورين سعداء بكيفية عمل تنفيذ التخزين المؤقت الصريح من Google مع Gemini 2.5 Pro على وجه التحديد ، والذي قالوا إنه تسبب في فواتير API كبيرة بشكل مدهش. وصلت الشكاوى إلى درجة حرارة في الأسبوع الماضي ، مما دفع فريق الجوزاء للاعتذار والتعهد بإجراء تغييرات.
على عكس التخزين المؤقت الصريح ، فإن التخزين المؤقت الضمني هو تلقائي. تم تمكينه افتراضيًا لنماذج Gemini 2.5 ، فهو يمر بتوفير التكاليف إذا طلب API Gemini إلى طراز ذاكرة التخزين المؤقت.
حدث TechCrunch
بيركلي ، كاليفورنيا
|
5 يونيو
كتاب الآن
“[W]وأوضح Google في منشور مدونة: “إنك ترسل طلبًا إلى أحد طرازات Gemini 2.5 ، إذا كان الطلب يشارك بادئة شائعة كواحد من الطلبات السابقة ، فهو مؤهل للحصول على ذاكرة التخزين المؤقت”.
الحد الأدنى لعدد الرمز المميز للتخزين المؤقت الضمني هو 1024 لـ 2.5 فلاش و 2،048 لـ 2.5 Pro ، وفقًا لوثائق مطور Google ، والتي ليست كمية كبيرة بشكل رهيب ، مما يعني أنه لا ينبغي أن يستغرق الكثير من المدخرات التلقائية. الرموز هي أجزاء خام من نماذج البيانات التي تعمل معها ، مع ألف رمز يعادل حوالي 750 كلمة.
بالنظر إلى أن مطالبات Google الأخيرة بتوفير التكاليف من التخزين المؤقت RAN RAN ، فهناك بعض مناطق المشتري في هذه المطالبات الجديدة. لأحدهم ، توصي Google بأن يحتفظ المطورون بالسياق المتكرر في بداية طلبات زيادة فرص ضربات ذاكرة التخزين المؤقت الضمنية. وتقول الشركة إن السياق الذي قد يتغير من الطلب إلى الطلب يجب إلحاقه في النهاية.
بالنسبة لآخر ، لم تقدم Google أي التحقق من طرف ثالث من أن نظام التخزين المؤقت الضمني الجديد سيوفر التوفير التلقائي الموعود. لذلك سيتعين علينا أن نرى ما يقوله المتبنون الأوائل.