برنامج Chat-4.0 من OpenAI يتفوق على الأداء البشري في امتحان علم الأعصاب

ديسمبر 12،

حقق نموذج اللغة المتطور من OpenAI، Chat-4.0، تقدمًا ملحوظًا في مجال تقاطع الذكاء الاصطناعي والرعاية الصحية. في دراسة حديثة لإثبات المفهوم، اجتاز هذا النموذج اللغوي الكبير (LLM) امتحان علم الأعصاب السريري بنجاح، مجيبًا على 85% من الأسئلة بشكل صحيح. يشير هذا الإنجاز المذهل إلى أنه مع المزيد من التحسينات، يمكن لطلاب ماجستير القانون أن يحتلوا مكانة مرموقة في مجال علم الأعصاب السريري.

أجرى هذه الدراسة الرائدة فريق من الباحثين من مستشفى هايدلبرغ الجامعي ومركز أبحاث السرطان الألماني في هايدلبرغ. وتُبرز النتائج، التي نُشرت في 7 ديسمبر، إمكانات الذكاء الاصطناعي في إعادة صياغة الرعاية الصحية. أُجري الاختبار على الدردشة 4.0 وشمل مجموعة من الأسئلة من المجلس الأمريكي للطب النفسي وعلم الأعصاب، بالإضافة إلى مجموعة مختارة من المجلس الأوروبي لعلم الأعصاب.

لقد تفوق Chat-4.0 على سابقه، الدردشة-3.5، الذي أجاب على 1,306 أسئلة من أصل 1,956 سؤالاً بشكل صحيح، محققاً نسبة نجاح بلغت 66.8%. أما النموذج الأحدث، فقد حقق إنجازاً بإجابة صحيحة على 1,662 سؤالاً، بنسبة نجاح بلغت 85%. ولتوضيح ذلك، يبلغ متوسط ​​الدرجات البشرية 73.8%، مما يشير إلى أن Chat-4.0 تفوق على الأداء البشري. علاوة على ذلك، وبما أن 70% هي نسبة النجاح القياسية في الأوساط الأكاديمية، فمن المؤكد أن Chat-4.0 اجتاز اختبار علم الأعصاب بنجاح.

ومع ذلك، سلّطت الدراسة الضوء أيضًا على جوانب يمكن للنماذج تحسينها. على سبيل المثال، أظهر كلا النموذجين أداءً أضعف في المهام التي تتطلب "تفكيرًا عالي المستوى" مقارنةً بتلك التي تتطلب "تفكيرًا منخفض المستوى" فقط. وهذا يشير إلى أنه على الرغم من أن برامج الماجستير في القانون تُبشّر بالخير في مجال علم الأعصاب السريري، إلا أنه لا يزال هناك مجال للتحسين.

على الرغم من هذه القيود، يُبدي الباحثون المشاركون في الدراسة تفاؤلاً بشأن التطبيقات المُحتملة لبرامج الماجستير في القانون في علم الأعصاب السريري. وأوضح الدكتور فارون فينكاتاراماني، أحد مُعدّي الدراسة، لموقع كوينتيليغراف: "نعتبر دراستنا بمثابة إثباتٍ لإمكانات برامج الماجستير في القانون. لا تزال هناك حاجة إلى تطوير، وربما حتى إلى ضبطٍ دقيقٍ لها لجعلها قابلةً للتطبيق بشكلٍ صحيح في علم الأعصاب السريري".

إن الاستخدام الناجح للذكاء الاصطناعي في مهام الرعاية الصحية المهمة، مثل أبحاث السرطان التي أجرتها شركة أسترازينيكا أو مكافحة الإفراط في وصف المضادات الحيوية في هونغ كونغ، يُبرز إمكانات هذه التقنية. ويُشير الإنجاز الأخير الذي حققه برنامج Chat-4.0 في اجتياز اختبار علم الأعصاب إلى مستقبل واعد للذكاء الاصطناعي في مجال الرعاية الصحية، مُمثلاً خطوة أخرى إلى الأمام في مسيرة التقدم الطبي المُعتمد على الذكاء الاصطناعي.