Chat-4.0 da OpenAI supera desempenho humano em exame de neurologia

12 Dezembro, 2023

O sofisticado modelo de linguagem da OpenAI, Chat-4.0, deu um passo significativo na interseção entre inteligência artificial e saúde. Em um estudo recente de prova de conceito, esse modelo de linguagem de grande porte (LLM) foi aprovado em um exame de neurologia clínica, respondendo corretamente a 85% das questões. Essa conquista impressionante sugere que, com mais refinamentos, os LLMs podem conquistar um nicho significativo no campo da neurologia clínica.

O estudo inovador foi conduzido por uma equipe de pesquisadores vindos do Hospital Universitário de Heidelberg e do Centro Alemão de Pesquisa do Câncer em Heidelberg. Os resultados, publicados em 7 de dezembro, sublinham o potencial da IA ​​na remodelação dos cuidados de saúde. O teste aplicado a Gato-4.0 incluiu um conjunto de perguntas do Conselho Americano de Psiquiatria e Neurologia, complementado por uma seleção do Conselho Europeu de Neurologia.

O Chat-4.0 superou seu antecessor, Bate-papo-3.5, que respondeu corretamente a 1,306 das 1,956 perguntas, alcançando uma pontuação de 66.8%. O modelo mais recente, no entanto, alcançou um feito ao responder corretamente a 1,662 perguntas, totalizando uma taxa de sucesso de 85%. Para colocar isso em perspectiva, a pontuação média humana é de 73.8%, indicando que o Chat-4.0 superou o desempenho humano. Além disso, sendo 70% a pontuação padrão para aprovação no meio acadêmico, é seguro afirmar que o Chat-4.0 foi aprovado no exame de neurologia.

No entanto, o estudo também destacou áreas onde os modelos poderiam melhorar. Por exemplo, ambos os modelos demonstraram um desempenho mais fraco em tarefas que exigem “pensamento de ordem superior” em comparação com aquelas que necessitam apenas de “pensamento de ordem inferior”. Isso indica que, embora os LLMs sejam promissores no campo da neurologia clínica, ainda há espaço para melhorias.

Apesar destas limitações, os investigadores envolvidos no estudo estão optimistas quanto às potenciais aplicações dos LLMs na neurologia clínica. Varun Venkataramani, um dos autores do estudo, explicou ao Cointelegraph: “Vemos nosso estudo mais como uma prova de conceito para as capacidades dos LLMs. Ainda há necessidade de desenvolvimento e provavelmente até de ajustes específicos dos LLMs para torná-los adequadamente aplicáveis ​​à neurologia clínica.”

O uso bem-sucedido da IA ​​em tarefas significativas na área da saúde, como a pesquisa sobre câncer da AstraZeneca ou o combate à prescrição excessiva de antibióticos em Hong Kong, ressalta o potencial dessa tecnologia. A recente conquista do Chat-4.0, ao ser aprovado em um exame de neurologia, sinaliza um futuro promissor para a IA na área da saúde, marcando mais um passo na jornada rumo a avanços médicos impulsionados pela IA.