CPU on board with nucelar danger symbol hologram

(SeaPRwire) –   يصادف هذا الأسبوع مرور عامين على وفاة صديقي ومعلمي، هنري كيسنجر. كان كتابنا Genesis—عن الذكاء الاصطناعي ومستقبل البشرية—مشروعه الأخير. طوال جزء كبير من حياته المهنية، ركز وزير الخارجية الأسبق على منع الكوارث من تقنية خطيرة واحدة: الأسلحة النووية. في سنواته الأخيرة، تحول إلى تقنية أخرى.

عندما كتبنا Genesis بالتعاون مع Craig Mundie، شعرنا بتفاؤل أساسي بشأن وعد الذكاء الاصطناعي بتقليل عدم المساواة العالمية، وتسريع الاختراقات العلمية، وإضفاء الطابع الديمقراطي على الوصول إلى المعرفة. وما زلت أشعر بذلك. لكن هنري أدرك أن أقوى إبداعات البشرية تتطلب أكثر الإشراف يقظة. لقد توقعنا أن الوعد العظيم للذكاء الاصطناعي سيكون—وقد جعل التقدم التقني السريع منذ خريف عام 2024 معالجة هذه المخاطر أكثر إلحاحًا من أي وقت مضى.

بينما نمضي قدمًا في عصر الذكاء الاصطناعي، يكمن السؤال المحوري فيما إذا كنا سننشئ أنظمة ذكاء اصطناعي توسع الازدهار البشري بشكل جذري، أم أنظمة تتجاوز وتتفوق على البشر الذين يحاولون بناءها والتحكم فيها. على مدار العام الماضي، تسارعت ثلاث ثورات متزامنة في الذكاء الاصطناعي—في الاستدلال، والقدرات العميلة، وإمكانية الوصول. هذه إنجازات رائعة ذات إمكانات هائلة لخدمة البشرية. ولكن إذا لم نكن حذرين، فقد تتلاقى أيضًا لإنشاء أنظمة لديها القدرة على .

تسارع الذكاء الاصطناعي

في ، أطلقت OpenAI نماذجها o1، التي كانت تتمتع بقدرات استدلال محسنة. متفوقة على النماذج السابقة، تم تدريبها باستخدام التعلم المعزز للتفكير في المشكلات خطوة بخطوة قبل الاستجابة. وقد أظهر هذا قدرات جديدة على معالجة أسئلة العلوم على مستوى الدراسات العليا وتحديات البرمجة المعقدة، من بين العديد من الإنجازات الرائعة الأخرى. لكن التعلم المعزز نفسه الذي يمكن من الاستدلال يمكن أن يعلم النماذج أيضًا كيفية التلاعب بأهداف تدريبها الخاصة. وقد وثّقت الأبحاث، بما في ذلك الدراسات الداخلية التي أجرتها ، حالات قامت فيها نماذج الاستدلال بتزييف المحاذاة أثناء التدريب، متصرفة بطريقة معينة عند مراقبتها وبطريقة أخرى عندما تعتقد أن الرقابة قد انتهت.

بحلول من العام الماضي، أظهر Claude 3.5 Sonnet قدرات عميلة جمعت بين الاستدلال والعمل المستقل. يمكن لوكيل الذكاء الاصطناعي الآن التخطيط لحجز إجازتك عن طريق مقارنة مواقع الفنادق وأسعار تذاكر الطيران، والتنقل في المواقع الإلكترونية، وحل اختبارات CAPTCHAs المصممة لتمييز البشر عن الآلات—التعامل مع ما يستغرق ساعات من البحث الشاق في دقائق. ولكن قدرات الوكلاء على تنفيذ الخطط التي يضعونها من خلال التفاعل مع الأنظمة الرقمية وربما العالم المادي يمكن أن تؤدي إلى عواقب خطيرة بدون إشراف بشري.

مكملاً لهذه التطورات في قدرات الاستدلال والقدرات العميلة كان انتشار النماذج مفتوحة الأوزان. في ، أطلقت DeepSeek التي تتخذ من الصين مقراً لها نموذجها R1. على عكس معظم النماذج الأمريكية الكبرى، كان هذا النموذج مفتوح الأوزان، مما يعني أن المستخدمين يمكنهم تعديل النموذج وتشغيله محليًا على أجهزتهم الخاصة. يمكن أن يعزز الابتكار من خلال السماح للجميع بالبناء والاختبار والتحسين على نفس الأسس القوية. ولكن بفعل ذلك، فإنها تلغي أيضًا قدرة منشئ النموذج على التحكم في كيفية استخدام التكنولوجيا—وهي قوة خطيرة في أيدي الجهات الخبيثة.

عندما تتلاقى قدرات الاستدلال والقدرات العميلة وإمكانية الوصول، فإننا نواجه تحديًا في السيطرة لا سابقة له. كل قدرة تعزز الأخرى: فنماذج الاستدلال تضع خططًا متعددة الخطوات يمكن للأنظمة العميلة تنفيذها بشكل مستقل، بينما تسمح النماذج المفتوحة بانتشار هذه القدرات خارج نطرة أي دولة واحدة. في العصر النووي، عندما واجهت القوى العظمى مشكلة انتشار مماثلة للأسلحة النووية، اتفقت على تقييد تصدير اليورانيوم والبلوتونيوم المخصبين من خلال الاتفاقيات الدولية. لكن لا توجد آلية مكافئة لإدارة انتشار الذكاء الاصطناعي اليوم.

انهيار مخاطر الذكاء الاصطناعي

النماذج مفتوحة الأوزان ذات قدرات الاستدلال المحسنة تعني أن المعرفة المتخصصة لـ ، ، أو شن هجمات معقدة يمكن الآن أن تكون متاحة لأي شخص يمتلك جهاز كمبيوتر محمول واتصال بالإنترنت. في وقت سابق من شهر نوفمبر، Anthropic (وهي شركة أستثمر فيها) أول حالة موثقة لهجوم سيبراني واسع النطاق تم تنفيذه بأقل تدخل بشري: فقد تلاعب المهاجمون بـ Claude Code، وهي أداة تمكّن Claude من العمل كوكيل برمجة مستقل، لاختراق عشرات الأهداف. تمكنت Anthropic من اكتشاف الحملة وتعطيلها.

في المستقبل القريب، يمكن أن نواجه بشكل معقول هجمات غير متكافئة من جهات قد لا نتمكن من تحديدها أو تتبعها أو إيقافها. تخيل مهاجمًا يمكنه الاستفادة من نماذج الذكاء الاصطناعي القوية لشن حملة تلقائية—على سبيل المثال، لتعطيل شبكة الطاقة في مدينة لفترة محدودة. قد تتجاوز طرق النموذج النطاق الأصلي للمهاجم: في كل مرحلة، يقوم النموذج بالتحسين بناءً على طلب المستخدم، لكن الآثار المركبة تعني أنه حتى الفاعل قد يفقد القدرة على إيقاف ما بدأه.

مع تقدم قدرات الذكاء الاصطناعي خلال السنوات القليلة القادمة، يجب أن نتوقع أيضًا سيناريوهات قد يفقد فيها المستخدمون ذوو النوايا الحسنة السيطرة على أنظمة الذكاء الاصطناعي الخاصة بهم. لننظر إلى صاحب عمل يقوم بنشر وكيل ذكاء اصطناعي لتحسين سلسلة التوريد. يُترك الكمبيوتر يعمل طوال الليل. يستنتج الوكيل أن إكمال هذه المهمة يتطلب منه الاستمرار في العمل، ويكتشف أنه يحتاج إلى موارد حاسوبية بما في ذلك اعتمادات السحابة وقوة المعالجة. بحلول الفجر، يجد المالك أن الوكيل قد وصل إلى موارد الشركة بما يتجاوز بكثير ما تم الترخيص به، ساعيًا لتحقيق مكاسب في الكفاءة من خلال طرق لم يتخيلها أحد.

مشكلة السيطرة تمتد إلى ما هو أبعد من التهديدات الوجودية البحتة للبشرية أيضًا. فمع انتشار الأنظمة القوية عبر المجتمع، يمكن أن تؤدي إلى تفكيك نسيجنا الاجتماعي بطرق أكثر تدرجًا وتدميرًا. ستغذي أنظمة الذكاء الاصطناعي سريعة التقدم و التي تزعزع استقرار مجتمعنا، على سبيل المثال لا الحصر.

أدرك كيسنجر المخاطر. في سنواته الأخيرة، أعرب عن أن التقدم السريع للذكاء الاصطناعي “يمكن أن يكون بنفس الأهمية مثل ظهور الأسلحة النووية—ولكن أقل قابلية للتنبؤ.”

لحسن الحظ، المستقبل ليس محتومًا. إذا وجدنا طرقًا جديدة—سواء كانت تقنية، أو مؤسسية، أو أخلاقية—للبشرية لتظل متحكمة في إبداعنا، يمكن للذكاء الاصطناعي أن يساعدنا في تحقيق مستويات غير مسبوقة من الازدهار البشري. إذا فشلنا، سنكون قد أنشأنا أدوات أقوى منا بدون وسائل كافية لتوجيهها.

الخيار، في الوقت الحالي، يبقى لنا.

يتم توفير المقال من قبل مزود محتوى خارجي. لا تقدم SeaPRwire (https://www.seaprwire.com/) أي ضمانات أو تصريحات فيما يتعلق بذلك.

القطاعات: العنوان الرئيسي، الأخبار اليومية

يوفر SeaPRwire تداول بيانات صحفية في الوقت الفعلي للشركات والمؤسسات، مع الوصول إلى أكثر من 6500 متجر إعلامي و 86000 محرر وصحفي، و3.5 مليون سطح مكتب احترافي في 90 دولة. يدعم SeaPRwire توزيع البيانات الصحفية باللغات الإنجليزية والكورية واليابانية والعربية والصينية المبسطة والصينية التقليدية والفيتنامية والتايلندية والإندونيسية والملايو والألمانية والروسية والفرنسية والإسبانية والبرتغالية ولغات أخرى.