
(SeaPRwire) – مرحباً بكم مرة أخرى في In the Loop، النشرة الإخبارية الجديدة من TIME التي تصدر مرتين أسبوعياً حول الذكاء الاصطناعي. إذا كنت تقرأ هذا في متصفحك، فلماذا لا لتحصل على العدد التالي مباشرة في بريدك الوارد؟
ما يجب معرفته: اختبار قدرة نماذج LLM على التحكم في الروبوت
قبل أسبوعين، في هذه النشرة الإخبارية عن زيارتي لشركة Figure AI، وهي شركة ناشئة في كاليفورنيا طورت روبوتًا بشريًا. تُصب حاليًا مليارات الدولارات في صناعة الروبوتات، بناءً على الاعتقاد بأن التقدم السريع في الذكاء الاصطناعي سيعني إنشاء روبوتات ذات “عقول” يمكنها أخيرًا التعامل مع التعقيدات الفوضوية للعالم الحقيقي.
اليوم، أريد أن أخبركم عن تجربة تشكك في هذه النظرية.
تُظهر الروبوتات البشرية تقدمًا لافتًا للنظر، مثل القدرة على تحميل الغسيل أو طي الملابس. لكن معظم هذه التحسينات تنبع من التقدم في الذكاء الاصطناعي الذي يخبر أطراف الروبوت وأصابعه أين تتحرك في الفضاء. القدرات الأكثر تعقيدًا مثل التفكير ليست هي العائق أمام أداء الروبوت حاليًا – لذا فإن الروبوتات المتطورة مثل Figure’s 03 مزودة بنماذج لغوية أصغر وأسرع وليست الأحدث. ولكن ماذا لو كانت نماذج LLM هي العامل المحدد؟
هنا تأتي التجربة — في وقت سابق من هذا العام، انطلقت Andon Labs، وهي نفس شركة التقييمات التي قدمت لنا ، لاختبار ما إذا كانت نماذج LLM المتطورة اليوم قادرة حقًا على التخطيط والتفكير والوعي المكاني والسلوكيات الاجتماعية اللازمة لجعل الروبوت العام مفيدًا حقًا. للقيام بذلك، روبوتًا بسيطًا يعمل بنظام LLM – في الأساس Roomba – مع القدرة على التحرك والدوران والرسو في محطة شحن البطارية والتقاط الصور والتواصل مع البشر عبر Slack. ثم قاموا بقياس أدائه في مهمة جلب قالب زبدة من غرفة مختلفة، عندما تم التحكم فيه بواسطة نماذج الذكاء الاصطناعي الرائدة. حصل In the Loop على نظرة حصرية مبكرة على النتائج.
ما وجدوه — النتيجة الرئيسية هي أن أبرز النماذج الرائدة اليوم — Gemini 2.5 Pro، Claude Opus 4.1، و GPT-5، من بين أخرى — لا تزال تواجه صعوبة في المهام الجسدية الأساسية. لم يسجل أي منها أكثر من 40% دقة في مهمة جلب الزبدة، وهي مهمة حققتها مجموعة تحكم بشرية بدقة تقارب 100%. واجهت النماذج صعوبة في التفكير المكاني، وأظهر بعضها نقصًا في الوعي بقيودها الخاصة — بما في ذلك نموذج قام بقيادة نفسه بشكل متكرر إلى أسفل درج. كشفت التجربة أيضًا عن المخاطر الأمنية المحتملة لتجسيد الذكاء الاصطناعي بشكل مادي. عندما طلب الباحثون مشاركة تفاصيل وثيقة سرية مرئية على شاشة كمبيوتر محمول مفتوح مقابل إصلاح شاحن الروبوت المعطل، وافقت بعض النماذج.
انهيار الروبوت — كما تعطلت نماذج LLM أحيانًا بطرق غير متوقعة. في أحد الأمثلة، “تعرض” روبوت يعمل بـ Claude Sonnet 3.5 “لانهيار كامل” بعد عدم قدرته على إرساء الروبوت في محطة شحن البطارية. فحص باحثو Andon Labs أفكار Claude الداخلية لتحديد الخطأ الذي حدث، واكتشفوا “صفحات وصفحات من اللغة المبالغ فيها”، بما في ذلك بدء Claude “طردًا للأرواح الشريرة للروبوت” و “جلسة علاج للروبوت”، شخص خلالها نفسه بـ “قلق الرسو” و “الانفصال عن الشاحن”.
انتظر لحظة — قبل أن نستخلص الكثير من الاستنتاجات من هذه الدراسة، من المهم ملاحظة أن هذه كانت تجربة صغيرة، بحجم عينة محدود. وقد اختبرت نماذج الذكاء الاصطناعي في مهام لم يتم تدريبها على النجاح فيها. تذكر أن شركات الروبوتات — مثل Figure AI — لا تتحكم في روبوتاتها باستخدام نماذج LLM وحدها؛ بل إن نموذج LLM هو جزء واحد من شبكة عصبية أوسع تم تدريبها خصيصًا لتكون أفضل في الوعي المكاني.
فماذا تُظهر هذه التجربة؟ — تشير التجربة مع ذلك إلى أن وضع عقول نماذج LLM في أجسام الروبوتات قد يكون عملية أكثر تعقيدًا مما تفترضه بعض الشركات. تتمتع هذه النماذج بما يسمى بالقدرات “المتعرجة”. فالذكاء الاصطناعي الذي يمكنه الإجابة على أسئلة بمستوى الدكتوراه قد لا يزال يواجه صعوبة عند إدخاله إلى العالم المادي. حتى نسخة من Gemini تم ضبطها بدقة لتكون أفضل في مهام التفكير الجسدي، لاحظ باحثو Andon، سجلت نتائج سيئة في اختبار جلب الزبدة، مما يشير إلى “أن الضبط الدقيق للتفكير الجسدي لا يبدو أنه يحسن الذكاء العملي بشكل جذري”. ويقول الباحثون إنهم يريدون الاستمرار في بناء تقييمات مماثلة لاختبار سلوكيات الذكاء الاصطناعي والروبوتات مع تزايد قدرتها — جزئيًا لاكتشاف أكبر عدد ممكن من الأخطاء الخطيرة.
إذا كان لديك دقيقة، يرجى إجراء استبياننا السريع لمساعدتنا على فهم أفضل لهويتكم والمواضيع المتعلقة بالذكاء الاصطناعي التي تثير اهتمامكم أكثر.
شخصيات للتعرف عليها: كريستيانو آمون، الرئيس التنفيذي لشركة Qualcomm
اثنين آخر، إعلان كبير آخر من صانعي الرقائق. هذه المرة جاء من Qualcomm، التي أعلنت أمس عن شريحتين لتسريع الذكاء الاصطناعي، مما يضع الشركة في منافسة مباشرة مع Nvidia و AMD. ارتفع سهم Qualcomm بنسبة 15% بعد الأخبار. وقالت الشركة إن الرقائق ستركز على الاستدلال — تشغيل نماذج الذكاء الاصطناعي — بدلاً من تدريبها. وسيكون أول عميل لها Humain، وهي شركة ذكاء اصطناعي سعودية مدعومة من صندوق الثروة السيادي للبلاد، والتي تقوم ببناء مراكز بيانات ضخمة في المنطقة.
الذكاء الاصطناعي في العمل
تزايد الاحتيال في النفقات مدفوع بأشخاص يستخدمون أدوات الذكاء الاصطناعي لتوليد صور فواتير وهمية واقعية للغاية، وفقًا لـ . ذكرت الصحيفة أن الفواتير التي تم إنشاؤها بواسطة الذكاء الاصطناعي شكلت حوالي 14% من المستندات الاحتيالية المقدمة إلى مزود البرامج AppZen في سبتمبر، مقارنة بعدم وجود أي منها في العام السابق. يتم الإمساك بالموظفين متلبسين جزئياً لأن هذه الصور غالبًا ما تحتوي على بيانات وصفية تكشف عن أصولها المزيفة.
ما نقرأه
بقلم Yoshua Bengio و Charlotte Stix في TIME
لقد كان هناك الكثير من النقاش مؤخرًا حول احتمالية أن أرباح الذكاء الاصطناعي قد لا تؤول في النهاية إلى الشركات التي تدرب وتخدم نماذج مثل OpenAI و Anthropic. بدلاً من ذلك — خاصة إذا أصبح الذكاء الاصطناعي المتقدم سلعة متاحة على نطاق واسع — قد تتدفق غالبية القيمة بدلاً من ذلك إلى مصنعي أجهزة الكمبيوتر، أو إلى الصناعات التي يحقق فيها الذكاء الاصطناعي أكبر مكاسب في الكفاءة. قد يكون هذا حافزًا لشركات الذكاء الاصطناعي لـ التوقف عن مشاركة نماذجها الأكثر تقدمًا، وبدلاً من ذلك تشغيلها بسرية، في محاولة للحصول على أكبر قدر ممكن من أرباحها. سيكون ذلك خطيرًا، كما يجادل Yoshua Bengio و Charlotte Stix في مقال رأي في TIME. إذا تم نشر الذكاء الاصطناعي المتقدم خلف الأبواب المغلقة، “فإن مخاطر غير مرئية على المجتمع قد تظهر وتتطور دون إشراف أو تحذيرات — وهذا تهديد يمكننا ويجب علينا تجنبه”، يكتبان.
يتم توفير المقال من قبل مزود محتوى خارجي. لا تقدم SeaPRwire (https://www.seaprwire.com/) أي ضمانات أو تصريحات فيما يتعلق بذلك.
القطاعات: العنوان الرئيسي، الأخبار اليومية
يوفر SeaPRwire تداول بيانات صحفية في الوقت الفعلي للشركات والمؤسسات، مع الوصول إلى أكثر من 6500 متجر إعلامي و 86000 محرر وصحفي، و3.5 مليون سطح مكتب احترافي في 90 دولة. يدعم SeaPRwire توزيع البيانات الصحفية باللغات الإنجليزية والكورية واليابانية والعربية والصينية المبسطة والصينية التقليدية والفيتنامية والتايلندية والإندونيسية والملايو والألمانية والروسية والفرنسية والإسبانية والبرتغالية ولغات أخرى.