"ديب سيك" تطور نماذج ذكاء اصطناعي تحسن أداءها ذاتيا
تعمل "ديب سيك" مع جامعة تسينغهوا على تقليل التدريب اللازم لنماذج الذكاء الاصطناعي في محاولة لخفض التكاليف التشغيلية.
بعد أن هزت شركة "ديب سيك" الصينية الناشئة الأسواق بطرح نموذج الاستدلال المنطقي منخفض التكلفة في يناير، تعاونت مع باحثين من المؤسسة التعليمية التي يقع مقرها في بكين في ورقة بحثية تتناول نهجاً جديداً في التعلم التعزيزي لتحسين كفاءة النماذج.
يهدف النهج الجديد إلى مساعدة نماذج الذكاء الاصطناعي على زيادة الالتزام بالتفضيلات البشرية من خلال تقديم مكافآت مقابل الإجابات الأكثر دقة وقابلية للفهم، بحسب ما كتبه الباحثون.
أثبت التعلم التعزيزي فاعليته في تسريع وتيرة مهام الذكاء الاصطناعي في تطبيقات ومجالات محدودة. رغم ذلك، ظهرت بعض التحديات أمام توسعة نطاق استخدامه ليشمل مزيداً من التطبيقات العامة، وهي المشكلة التي يسعى فريق "ديب سيك" إلى حلها عبر ما أطلق عليه "الضبط الذاتي القائم على النقد" (Self-Principled Critique Tuning).
تفوقت هذه الاستراتيجية على الأساليب والنماذج الحالية في عديد من المعايير القياسية، وأظهرت النتائج تحسن الأداء مع استخدام مصادر حوسبة أقل، بحسب الورقة البحثية.
الذكاء الاصطناعي يتطور ذاتياً
تطلق "ديب سيك" على هذه النماذج اسم "جي آر إم"- اختصاراً لـ"نماذج المكافآت العامة" (Generalist Reward Modeling)- وستطرحها مفتوحة المصدر، بحسب الشركة. فيما يعمل مطورو الذكاء الاصطناعي الآخرون، مثل مجموعة "علي بابا القابضة" عملاقة التكنولوجيا الصينية و"أوبن إيه آي" (OpenAI) التي يقع مقرها في سان فرانسيسكو، على استكشاف آفاق جديدة في تعزيز قدرات الاستدلال المنطقي والتطوير الذاتي لنماذج الذكاء الاصطناعي أثناء أداء المهام في الوقت الفعلي.
أطلقت "ميتا بلاتفورمز"-ومقرها في مينلو بارك، كاليفورنيا- "لاما 4" (Llama 4)، مجموعتها الأحدث من نماذج الذكاء الاصطناعي خلال نهاية الأسبوع، وأشارت إلى أنها أول نماذج تطورها باستخدام بنية "مزيج الخبراء" (Mixture of Experts).
تعتمد نماذج "ديب سيك" بشكل كبير على بنية "مزيج الخبراء" لزيادة فعالية استخدام الموارد، فيما تقارن "ميتا" النماذج التي أصدرتها حديثاً بتلك التي طورتها الشركة الصينية الناشئة التي يقع مقرها في هانغتشو. لم تحدد "ديب سيك" الموعد المحتمل إطلاق نموذجها الأساسي الجديد.