في ندوة تنمية الاستخبارات المجسدة الأخيرة ، أعلن فريق البروفيسور تشن تاو من جامعة فودان عن اختراق أبحاث كبير: إن الجيل القادم من حركة الروبوت البشرية ، يتخطى النموذج الكبير من خلال "التحكم في النماذج البصرية التقليدية" (VLA). الترجمة ، "بناء" بناء جملة المفردات-بناء جملة "يمكّن الروبوتات من إنشاء حركات أطراف معقدة فقط من خلال تعليمات اللغة الطبيعية ، مع دقة تحسن بنسبة 40 ٪ مقارنة بالنماذج التقليدية .

تشمل النقاط التقنية الرئيسية للفريق ما يلي: تطوير نموذج متعدد الوسائط ثلاثي الأبعاد ، وتمكين الروبوتات من تحقيق قدرات "فهم" الهيكل المكاني للمرة الأولى ، وقادرة على تجسيد الإجابات والتخطيط للمسار الديناميكي ؛ وإنشاء إطار عمل مبتكر لضغط النماذج ، وتقليل متطلبات الطاقة الحاسوبية الحافة بنسبة 70 ٪ ، واختراق اختناقات الأجهزة للاعتماد الواسع النطاق للروبوتات الذكية . تم نشر النموذج بنجاح على منصات الروبوت المادية ، مما يدل على قدرات التحكم في الحركة السلسة في سيناريو التجميع الصناعي والخدمة {

قامت تقنية Moushen الذكية ، المحضرة بناءً على إنجازات البحث ، بتأمين شراكات استراتيجية مع العديد من عمالقة الصناعة من خلال تقنية سلسلة الحركة التوليدية الرائدة عالميًا . صرح البروفيسور تشن تاو ، "لقد تعاملت أبحاثنا إلى" أبحاثنا ". لا يؤدي اختراق حقن القدرة التنافسية التكنولوجية الأساسية في صناعة الروبوتات في الصين ، بل يضع أيضًا معيارًا جديدًا في مجال الذكاء المتجسد في منافسة AI العالمية .
