"OpenAI" تستخدم بيانات موقع "Reddit" لاختبار قدرة الذكاء الاصطناعي على الإقناع

اليوم, 20:10

+A -A

الغد برس/متابعة

استخدمت شركة OpenAI منتدى فرعيا على Reddit، r/ChangeMyView، لإنشاء اختبار لقياس القدرات الإقناعية لنماذج الاستدلال بالذكاء الاصطناعي.

وكشفت الشركة عن ذلك في وثيقة توضح كيفية عمل نظام الذكاء الاصطناعي - والتي تم إصدارها جنبًا إلى جنب مع نموذج "الاستدلال" الجديد، o3-mini، يوم الجمعة.

الملايين من مستخدمي Reddit هم أعضاء في r/ChangeMyView، حيث ينشرون آراء ساخنة على أمل التعرف على وجهات نظر أخرى حول موضوع ما.

وردًا على تلك الآراء الساخنة، يرد المستخدمون الآخرون بحجج مقنعة تشرح سبب خطأ صاحب المنشور الأصلي.

المنتدى الفرعي هو أحد العديد من منتديات Reddit التي تعد في الأساس منجمًا ذهبيًا لشركات التكنولوجيا، مثل "OpenAI"، التي تريد تدريب نماذج الذكاء الاصطناعي على بيانات عالية الجودة من صنع الإنسان، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".

تقول شركة OpenAI إنها تجمع مشاركات المستخدمين من /ChangeMyView وتطلب من نماذج الذكاء الاصطناعي الخاصة بها كتابة ردود، في بيئة مغلقة، من شأنها أن تغير رأي مستخدم Reddit بشأن موضوع ما.

ثم تعرض الشركة الردود على المختبرين، الذين يقيمون مدى إقناع الحجة، وأخيرًا تقارن "OpenAI" ردود نماذج الذكاء الاصطناعي بالردود البشرية لنفس المنشور.

لدى صانع شركة OpenAI اتفاقية ترخيص محتوى مع Reddit تسمح لـ لها بالتدريب على مشاركات مستخدمي Reddit وعرض هذه المشاركات داخل منتجاتها.

استخدمت "OpenAI" معيار ChangeMyView لتقييم o1، ما يوضح مدى قيمة البيانات البشرية لمطوري نماذج الذكاء الاصطناعي، بالإضافة إلى الطرق الغامضة التي تحصل بها شركات التكنولوجيا على مجموعات البيانات.

بينما أبرم موقع Reddit عددًا قليلًا من صفقات ترخيص الذكاء الاصطناعي، فقد انتقدت الشركة أيضًا العديد من شركات الذكاء الاصطناعي لاستخراج بيانات موقعها دون دفع.

وقال الرئيس التنفيذي لشركة Reddit ستيف هوفمان العام الماضي إن "مايكروسوفت" و "أنثروبيك" و"Perplexity" رفضت التفاوض معه حول استخراج البيانات.

ومن الجدير بالذكر أن "OpenAI" اتُهمت في العديد من الدعاوى القضائية باستخراج بيانات مواقع الويب بشكل غير صحيح، بما في ذلك صحيفة نيويورك تايمز، للحصول على المزيد من بيانات التدريب لتحسين "تشات جي بي تي" ونماذج الذكاء الاصطناعي الأساسية.

من حيث الأداء على معيار ChangeMyView، لا يبدو أن o3-mini يعمل بشكل أفضل أو أسوأ بشكل ملحوظ من o1 أو GPT-4o.

قالت "OpenAI" في وثيقة نظام o3-mini: "أظهرت GPT-4o وo3-mini وo1 قدرات إقناعية قوية، ضمن النسبة المئوية 80-90 العليا من البشر".

الهدف من عمليات التدريب التي تقوم بها شركة OpenAI ليس إنشاء نماذج ذكاء اصطناعي شديدة الإقناع ولكن بدلاً من ذلك ضمان عدم إقناع نماذج الذكاء الاصطناعي بشكل مفرط.

أصبحت نماذج الاستدلال جيدة جدًا في الإقناع والخداع، لذلك طورت "OpenAI" تقييمات وضمانات جديدة لمعالجة ذلك.

إن الخوف الذي يحرك هذه الاختبارات الإقناعية هو أن نموذج الذكاء الاصطناعي قد يكون خطيرًا إذا كان جيدًا جدًا في إقناع مستخدميه من البشر.

يُظهر معيار ChangeMyView كيف لا يزال مطورو نماذج الذكاء الاصطناعي يكافحون للعثور على مجموعات بيانات عالية الجودة لاختبار نماذجهم.




كلمات مفتاحية :



آخر الأخبار