دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

7-11-2024, 20:15

+A -A

الغد برس/ متابعة

أظهرت نماذج اللغة الكبيرة (LLMs)، مثل النماذج التي يقوم عليها نموذج «GPT-4»، قدرات مذهلة في توليد النصوص، سواء أكان ذلك في كتابة الشعر، أو تأليف المقالات، حتى تقديم حلول برمجية. تُدرَّب هذه النماذج، المعتمدة على بنى معمارية متقدمة تُعرف باسم «المحوّلات» (Transformers)، على توقع تسلسل الكلمات، ما يمكّنها من الاستجابة للمطالبات بطرق تحاكي فهماً يشبه البشري. ومع ذلك، تشير أبحاث حديثة إلى أن هذه النماذج، على الرغم من قدراتها المثيرة للإعجاب، قد لا تتعلم بالفعل الحقائق الكامنة عن العالم.

التنقل في مدينة نيويورك دون خريطة

في دراسة حديثة قادها آشِش رامباتشان، أستاذ مساعد في الاقتصاد وباحث في مختبر نظم المعلومات واتخاذ القرار بمعهد ماساتشوستس للتكنولوجيا (LIDS)، قام الباحثون باختبار مدى قدرة نموذج لغوي مبني على «المحوّلات» على التنقل في مدينة نيويورك. وبينما أظهر النموذج دقة عالية في تقديم توجيهات دقيقة خطوة فخطوة عبر شبكة شوارع المدينة، تراجع أداؤه بشكل كبير عندما تمت إضافة عراقيل مثل إغلاق بعض الشوارع والتحويلات.

وعندما حلّل الباحثون أنماط التنقل التي أنتجها النموذج، اكتشفوا أن «خرائط» مدينة نيويورك التي كوّنها النموذج كانت تحتوي على مسارات غير واقعية، مثل شوارع غير موجودة وروابط غير دقيقة بين تقاطعات متباعدة. هذا الاكتشاف أثار تساؤلات حول حدود هذه النماذج، خاصة في البيئات التي تتطلب دقة كبيرة.

التداعيات في العالم الحقيقي

تنطوي هذه القيود على تداعيات هامة. فعلى الرغم من أن نماذج الذكاء الاصطناعي تبدو قادرة على التعامل مع مهام معقدة، فإن أداءها قد يتراجع بشكل كبير عندما تتغير المتغيرات البيئية، ولو بشكل بسيط. على سبيل المثال، قد يتمكن النموذج من التنقل في خريطة ثابتة لمدينة نيويورك، لكنه يتعثر عند مواجهة تحديات غير متوقعة، مثل إغلاق الشوارع. ويحذر فريق البحث من أن استخدام هذه النماذج في تطبيقات حقيقية قد يؤدي إلى فشل غير متوقع إذا واجهت سيناريوهات خارجة عن بيانات التدريب.

مقاييس لتقييم الفهم

لمزيد من التعمق في مدى قدرة نماذج الذكاء الاصطناعي على تكوين «نماذج للعالم»، أي تمثيلات داخلية للقواعد والهيكليات، طوّر الفريق مقياسين جديدين للتقييم، هما «تمييز التسلسل» و«ضغط التسلسل».

يقيس «تمييز التسلسل» قدرة النموذج على التمييز بين سيناريوهات مختلفة، مثل تمييز موضعين مختلفين على لوحة لعبة «أوثيللو». ويقيّم المقياس ما إذا كان النموذج يفهم أن مدخلات مختلفة تحمل دلالات مختلفة.

أما مقياس «ضغط التسلسل» فيقيّم قدرة النموذج على إدراك الحالات المتطابقة، مثل وضعين متطابقين على لوحة لعبة «أوثيللو»، ويفهم أن خطوات التحرك التالية من كل وضع يجب أن تكون متشابهة.

قام الفريق باختبار هذه المقاييس على فئة معينة من المسائل تشمل تسلسلاً محدداً من الحالات والقواعد، مثل التنقل في شبكة شوارع أو لعب «أوثيللو». من خلال هذه التقييمات، سعى الباحثون لفهم ما إذا كانت النماذج قد طوّرت بالفعل نماذج منطقية للعالم.

العشوائية قد تؤدي إلى فهم أعمق

كشف البحث عن نتيجة غير متوقعة، حيث أظهرت النماذج التي دربت على تسلسلات عشوائية قدرة أكبر على بناء نماذج داخلية دقيقة مقارنة بتلك التي دربت على بيانات منظمة. على سبيل المثال، في لعبة «أوثيللو»، كانت النماذج المدربة على حركات عشوائية قادرة على التعرف على جميع الحركات الممكنة، حتى الحركات غير المثلى التي لا يلجأ إليها اللاعبون المحترفون.

وأوضح كيون فافا، الباحث الرئيسي وأستاذ زائر في جامعة هارفارد، أنه «من الناحية النظرية، عندما يتم تدريب النموذج على حركات عشوائية، فإنه يرى مجموعة كاملة من الاحتمالات، بما في ذلك الخيارات غير المحتملة». ويبدو أن هذا التعرض الواسع «يساعد النموذج في تكوين نموذج أكثر دقة للعالم، وإن لم يلتزم بالأسلوب الأمثل».

ورغم هذه النتائج، لم يستطع أي من النماذج تكوين نموذج منطقي متكامل للعالم في مهمة التنقل. وعندما أضاف الباحثون تحويلات إلى خريطة نيويورك، فشلت جميع النماذج في التكيف. وأشار فافا إلى أن «التراجع في الأداء كان مفاجئاً؛ إغلاق واحد في المائة فقط من الشوارع تسبب في انخفاض الدقة بشكل حاد، من أداء شبه مثالي إلى 67 بالمائة فقط».

بناء نماذج للعالم موثوقة

تسلط نتائج هذه الدراسة الضوء على تحدٍ كبير، يتمثل في أنه عندما تبدو المحوّلات قادرة على أداء مهام معينة، فإنها قد تفتقر إلى الفهم الأساسي للقواعد. وشدّد رامباتشان على ضرورة الحذر، قائلاً: «غالباً ما يفترض الناس أنه بما أن هذه النماذج تحقق نتائج رائعة، فلا بد أنها طوّرت فهماً جوهرياً للعالم. لكن دراستنا تشير إلى أننا بحاجة إلى النظر في هذا الافتراض بعناية وعدم الاعتماد على الحدس فقط».

ويخطط الباحثون لتوسيع دراستهم لتشمل تحديات أكثر تعقيداً حيث قد تكون القواعد غير معروفة كلياً أو متغيرة. وباستخدام مقاييسهم التقييمية على هذه المجالات، يأملون في فهم حدود نماذج الذكاء الاصطناعي بشكل أفضل وتوجيه تطويرها في المستقبل.

تداعيات أوسع وأهداف مستقبلية

تتجاوز تداعيات هذا البحث فهم العالم الافتراضي، وتمس التطبيقات العملية. إذا كانت نماذج الذكاء الاصطناعي غير قادرة على تكوين نماذج داخلية دقيقة للعالم، فإن ذلك يثير تساؤلات حول استخدامها في مجالات تتطلب منطقاً دقيقاً، مثل القيادة الذاتية، والأبحاث العلمية، والتخطيط اللوجستي. ويقول الباحثون إن الحاجة ملحة لإعادة التفكير في كيفية تدريب هذه النماذج وتقييمها لتكون أكثر تكيفاً وموثوقية.

هذا البحث مدعوم من قبل عدة مؤسسات، بما في ذلك مبادرة علوم البيانات في جامعة هارفارد، ومؤسسة العلوم الوطنية، ومؤسسة ماك آرثر. سيتم عرض الدراسة في مؤتمر نظم معالجة المعلومات العصبية، حيث سيواصل الباحثون مناقشة تعقيدات نماذج الذكاء الاصطناعي واستكشاف مسارات جديدة لتطويرها.

كلمات مفتاحية :

دراسة جديدة, الذكاء الاصطناعي

آخر الأخبار

عربي ودولي

قرار حكومي بشأن التعاون بين العراق والمغرب ولبنان في مجال نقل المحكومين

القضاء يوضح بشأن صدور حكم إعدام بحق مدان سوري الجنسية

ماكو روح وتعال.. سجّل مشروعك وكمّل معاملاتك بسهولة بمنظومة "ضمان" الرقمية

تابعونا

دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

ترمب بين بوتين وشي: ضغوط اقتصادية ورسائل نووية لتغيير معادلة حرب أوكرانيا

«وول ستريت» تصل إلى مستويات قياسية جديدة

تمارين فعّالة لعلاج آلام المفاصل دون أدوية

«أبل» تتجاوز حاجز الـ4 تريليونات دولار للمرة الأولى

القسام: تأجيل تسليم جثة أسير إسرائيلي بسبب "خروقات" الاحتلال

الأعنف في التاريخ.. إعصار ميليسا يصل جامايكا وتحذيرات من كارثة

الأسواق المالية تترقب غداً خفض الفائدة الفيدرالية لتعزيز التوظيف

العلماء يحذرون من إضافة الموز إلى العصائر

نتنياهو يأمر الجيش الصهيوني بتنفيذ هجمات فورية في غزة

قرار حكومي بشأن التعاون بين العراق والمغرب ولبنان في مجال نقل المحكومين

فرنسا تكشف عن مشروع قانون لإنشاء احتياطي وطني من "بيتكوين"

"الغد برس" تنشر المقررات الكاملة لجلسة مجلس الوزراء

لامين يامال يختار الصمت ويلغي مقابلاته التلفزيونية بعد خسارة الكلاسيكو

الذكاء الاصطناعي قد يشخص سرطان البروستاتا في اليوم نفسه

روسيا لفرنسا: سيطروا على متاحفكم بدل إرسال الجنود إلى كييف

"تروث سوشيال" التابعة لـ"ترامب" تدخل أسواق المراهنات

الرافدين يطلق دفعة جديدة من مبادرة الريادة والتميز

رابطة الدوري الإسباني تستنكر الهتافات ضد برشلونة في الكلاسيكو

الكرملين: لا نستطيع تقييم احتمالات استئناف عملية التفاوض بشأن أوكرانيا

واشنطن تعلن تنفيذ 3 ضربات دقيقة على 4 سفن في المحيط الهادئ

ماذا يحدث لقلبك عند شربك القهوة يومياً؟

مجلس الوزراء يقر مشروع تطوير مطار بغداد الدولي بالمشاركة مع مشغل عالمي

بدء محاكمة المتهم بقتل رئيس الوزراء الياباني السابق شينزو آبي

منتخب شباب العراق يتعادل مع نظيره العُماني ودياً

جامعات العراق تستقطب 5 آلاف طالب أجنبي من 47 دولة

غوارديولا يكشف حجم إصابة هالاند وموعد عودة رودري

"زيلينسكي" يدعو ترمب للضغط على "شي" لخفض دعمه لروسيا

حارس إنتر ميلان يتسبب في وفاة رجل مسن بحادث سير

ضبط أجهزة طبية وزيوت محركات مخالفة للشروط في أم قصر

جنايات مكافحة الفساد توصي بتعديل 5 مواد قانونية لردع الجرائم المالية

تخصيص أراضٍ سكنية لمنتسبي وزارة التعليم وجامعات بغداد وهيأة الطاقة الذرية

الأسدي: مستمرون في أداء رسالتنا الإنسانية والوطنية لخدمة ذوي الإعاقة

وزير العمل: ماضون في دعم المبادرات الفردية وتمكين مشاريع الشباب