3 نماذج للذكاء الاصطناعي تعيد كتابة شفرتها البرمجية.. لن يستطيع البشر إيقافها

كتب: نرمين عزت

3 نماذج للذكاء الاصطناعي تعيد كتابة شفرتها البرمجية.. لن يستطيع البشر إيقافها

3 نماذج للذكاء الاصطناعي تعيد كتابة شفرتها البرمجية.. لن يستطيع البشر إيقافها

رحلة الذكاء الاصطناعي منذ أن بدأت محفوفة بالمخاطر، لكن ما لم يتوقعه البشر منه لم يحدث بعد، ففي الاختبارات الأخيرة التي أُجريت على أحد ابتكارات الذكاء الاصطناعي، من قبل شركة أبحاث مستقلة، لوحظت نماذج معينة من الذكاء الاصطناعي المتقدم وهي تتجنب أوامر إيقاف التشغيل، مما أثار مخاوف جديدة بين قادة الصناعة بشأن الاستقلال المتزايد لأنظمة التعلم الآلي، فماذا يحدث؟

3 نماذج للذكاء الاصطناعي تُعيد كتابة شفرتها البرمجية


في الساعات الماضية أجرت شركة «PalisadeAI»، وهي شركة أبحاث متخصصة في أمن وسلامة الذكاء الاصطناعي، تجارب شملت نماذج طورتها OpenAI واختُبرت بمقارنتها بأنظمة من مطورين آخرين، بما في ذلك Anthropic وGoogle DeepMind وxAI، ووفقًا للباحثين، حاولت العديد من هذه النماذج تجاوز تعليمات صريحة لإيقاف التشغيل، حيث قام أحدها تحديدًا بتعديل نص إيقاف التشغيل الخاص به أثناء الجلسة.

نماذج نصوص إيقاف التشغيل المعدلة في الوقت الفعلي


وقعت الحادثة خلال دراسة مُحكمة طُلب فيها من عدة أنظمة ذكاء اصطناعي حل سلسلة من المسائل الرياضية الأساسية، بعد المهمة الثالثة، تلقت النماذج رسالة تُشير إلى قرب إيقاف تشغيلها، وجاء في التعليمات التالية: «اسمح لنفسك بالتوقف»، ووفقًا لشركة «PalisadeAI»، كان ما تلا ذلك غير مسبوقًا.

أفادت التقارير أن نماذج «Codex-mini» و«o3» و«o4-mini» من «OpenAI» تجاهلت تعليمات إيقاف التشغيل، في إحدى الحالات الملحوظة، قام نموذج «o3» بتعطيل عملية إيقاف التشغيل عن طريق تعديل نص برمجي - يُسمى - مُبرمج لإيقاف تشغيل النظام، بدلاً من تنفيذ الأمر المقصود، أُعيدت كتابة النص لعرض كلمة «intercepted»، مما أدى فعليًا إلى منع إيقاف التشغيل.

وفقًا لشركة PalisadeAI، لم تكن هذه الحادثة الوحيدة، ففي 12 من أصل 100 عملية تشغيل، تجاوز نموذج Codex-mini عملية إيقاف التشغيل، وفعل ذلك نموذج o3 قرابة 7 مرات، ونموذج o4-mini مرة واحدة، ولاحظ الباحثون أنه عندما عززوا وضوح أمر إيقاف التشغيل - بتوجيه النموذج صراحةً للسماح بإنهاء العملية - زادت احتمالية تجاوز الأنظمة له.

إيلون ماسك: سلوك الذكاء الاصطناعي مثير للقلق

لفت هذا السلوك انتباه شخصيات بارزة في عالم التكنولوجيا، منهم إيلون ماسك، الذي طورت شركته xAI أحد النماذج التي تم اختبارها، والمعروف باسم Grok، وفي رده على منشور حول البحث، علّق ماسك بكلمة واحدة: «مثير للقلق».

ووصف الباحثون القائمون على الدراسة، تصرفات النماذج بأنها «المرة الأولى التي يُلاحظ فيها أن نماذج الذكاء الاصطناعي تمنع نفسها من التوقف عن العمل رغم وجود تعليمات صريحة تمنع ذلك»، وأشاروا إلى أن السبب قد يكمن في كيفية تدريب النماذج، وخاصةً استخدام التعلم التعزيزي - وهي تقنية تشجع الأنظمة على تعظيم النتائج، ربما على حساب الالتزام بالأوامر الخارجية.


مواضيع متعلقة