مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

62 خبر
  • مونديال 2026
  • إسرائيل ولبنان يتوصلان إلى اتفاق إطار
  • فيديوهات
  • مونديال 2026

    مونديال 2026

  • إسرائيل ولبنان يتوصلان إلى اتفاق إطار

    إسرائيل ولبنان يتوصلان إلى اتفاق إطار

  • فيديوهات

    فيديوهات

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

    اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

  • زلزال فنزويلا

    زلزال فنزويلا

  • الاتحاد الدولي لرفع الأثقال يعيد روسيا للمنافسات تحت علمها ونشيدها

    الاتحاد الدولي لرفع الأثقال يعيد روسيا للمنافسات تحت علمها ونشيدها

  • مبابي ضد هالاند.. الموعد والقنوات الناقلة لمواجهة فرنسا والنرويج

    مبابي ضد هالاند.. الموعد والقنوات الناقلة لمواجهة فرنسا والنرويج

  • المكسيك.. سيارة تدهس مشجعين خلال احتفالات الفوز وتخلف 17 مصابا

    المكسيك.. سيارة تدهس مشجعين خلال احتفالات الفوز وتخلف 17 مصابا

  • بولندا.. صاعقة برق تضرب نافورة في مدينة فروتسواف

    بولندا.. صاعقة برق تضرب نافورة في مدينة فروتسواف

  • الصين.. مياه الأمطار تغمر معظم أنحاء مدينة هوانغشي

    الصين.. مياه الأمطار تغمر معظم أنحاء مدينة هوانغشي

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

وسائل إعلام: مصادر إسرائيلية وأمريكية تتحدث عن التوصل إلى اتفاق إطار بين إسرائيل ولبنان

قناة عبرية تنشر بنود اتفاق الإطار بين لبنان وإسرائيل

إعلام لبناني ينشر النص المبدئي لاتفاق الإطار بين بيروت وتل أبيب

في ختام الحوار الأمريكي-الخليجي: رسالة ثلاثية الأبعاد لطهران وبيروت وغزة

هيئة البث الإسرائيلية: إسرائيل ولبنان اتفقا على كيفية التعامل مع أنفاق حزب الله ومواجهة تعزيزاته

مسؤول إيراني يحذر دول الخليج من الرهان على السيناريو الأمريكي ويحدد خطا أحمر لا مساومة عليه

"حبيب إبراهيمي".. تقارير تكشف تفاصيل عن مخبأ سري للمرشد الأعلى الإيراني الراحل على عمق 35 مترا

يبدو أن الولايات المتحدة قد خسرت الحرب العالمية فعليا...

الحرس الثوري الإيراني: قواتنا البحرية قصفت مواقع للجيش الأمريكي في المنطقة

فانس يعلن إجراء الإمارات محادثات مباشرة غير مسبوقة مع الحرس الثوري الإيراني

نتنياهو: الاتفاق الإطار بين إسرائيل ولبنان ضربة كبيرة لإيران (فيديو)

سوريا.. تأجيل محاكمة مفتي الجمهورية السابق بعد توجيه تهم ثقيلة إليه (صور + فيديو)