Сложная языковая модель OpenAI, ChatGPT-4.0, сделал значительный шаг вперед на стыке искусственного интеллекта и здравоохранения. В недавнем исследовании, подтверждающем концепцию, эта большая языковая модель (LLM) успешно прошла клинический экзамен по неврологии, правильно ответив на 85% вопросов. Это впечатляющее достижение предполагает, что при дальнейших усовершенствованиях LLM смогут занять значительную нишу в сфере клинической неврологии.
Инновационное исследование было проведено группой исследователей из Университетской больницы Гейдельберга и Немецкого онкологического исследовательского центра в Гейдельберге. Результаты, опубликованные 7 декабря, подчеркивают потенциал ИИ в изменении здравоохранения. Тест, назначенный ChatGPT-4.0 включал набор вопросов Американского совета психиатрии и неврологии, дополненный подборкой вопросов Европейского совета неврологии.
ChatGPT-4.0 превзошел своего предшественника, ChatGPT-3.5, который правильно ответил на 1,306 из 1,956 вопросов, набрав 66.8%. Однако новая модель стала достижением, правильно ответив на 1,662 вопроса, что составляет 85% успеха. Для сравнения: средний балл человека составляет 73.8%, что указывает на то, что ChatGPT-4.0 превзошёл человеческие возможности. Более того, поскольку 70% — это стандартный проходной балл в академических кругах, можно с уверенностью сказать, что ChatGPT-4.0 успешно сдал экзамен по неврологии.
Тем не менее, исследование также выявило области, где модели могут быть улучшены. Например, обе модели продемонстрировали более низкую производительность в задачах, требующих «мышления более высокого порядка», по сравнению с теми, которые требуют только «мышления более низкого порядка». Это указывает на то, что, хотя программы LLM демонстрируют многообещающие результаты в области клинической неврологии, все еще есть возможности для совершенствования.
Несмотря на эти ограничения, исследователи, участвовавшие в исследовании, с оптимизмом смотрят на потенциальное применение LLM в клинической неврологии. Доктор Варун Венкатарамани, один из авторов исследования, объяснил Cointelegraph: «Мы рассматриваем наше исследование скорее как доказательство концепции возможностей LLM. Все еще требуется разработка и, возможно, даже конкретная доработка LLM, чтобы сделать их пригодными для клинической неврологии».
Успешное использование ИИ в важных задачах здравоохранения, таких как исследования рака AstraZeneca или борьба с чрезмерным назначением антибиотиков в Гонконге, подчеркивает потенциал этой технологии. Недавнее достижение ChatGPT-4.0 при сдаче экзамена по неврологии свидетельствует о прекрасном будущем ИИ в здравоохранении, что знаменует собой еще один шаг вперед на пути к медицинским достижениям, основанным на ИИ.