Il sofisticato modello linguistico di OpenAI, Chat-4.0, ha compiuto un significativo passo avanti nell'intersezione tra intelligenza artificiale e assistenza sanitaria. In un recente studio proof-of-concept, questo ampio modello linguistico (LLM) ha superato con successo un esame di neurologia clinica, rispondendo correttamente all'85% delle domande. Questo risultato impressionante suggerisce che, con ulteriori perfezionamenti, gli LLM potrebbero ritagliarsi una nicchia significativa nel campo della neurologia clinica.
Lo studio innovativo è stato condotto da un team di ricercatori provenienti dall’Ospedale universitario di Heidelberg e dal Centro tedesco per la ricerca sul cancro di Heidelberg. I risultati, pubblicati il 7 dicembre, sottolineano il potenziale dell’intelligenza artificiale nel rimodellare l’assistenza sanitaria. Il test somministrato a Chat-4.0 includeva una serie di domande dell'American Board of Psychiatry and Neurology, integrata da una selezione dell'European Board for Neurology.
Chat-4.0 ha superato il suo predecessore, Chat-3.5, che ha risposto correttamente a 1,306 domande su 1,956, ottenendo un punteggio del 66.8%. Il modello più recente, tuttavia, ha raggiunto un traguardo importante rispondendo correttamente a 1,662 domande, con una percentuale di successo dell'85%. Per mettere in prospettiva questo dato, il punteggio medio umano si attesta al 73.8%, il che indica che Chat-4.0 ha superato le prestazioni umane. Inoltre, poiché il 70% è il punteggio standard per superare l'esame in ambito accademico, si può affermare con certezza che Chat-4.0 ha superato con successo l'esame di neurologia.
Tuttavia, lo studio ha anche evidenziato le aree in cui i modelli potrebbero migliorare. Ad esempio, entrambi i modelli hanno dimostrato prestazioni più deboli nei compiti che richiedevano “pensiero di ordine superiore” rispetto a quelli che richiedevano solo “pensiero di ordine inferiore”. Ciò indica che, sebbene gli LLM si mostrino promettenti nel campo della neurologia clinica, c'è ancora spazio per miglioramenti.
Nonostante queste limitazioni, i ricercatori coinvolti nello studio sono ottimisti riguardo alle potenziali applicazioni dei LLM nella neurologia clinica. Il dottor Varun Venkataramani, uno degli autori dello studio, ha spiegato a Cointelegraph: "Consideriamo il nostro studio più come una prova di concetto delle capacità dei LLM. C’è ancora bisogno di sviluppo e probabilmente anche di messa a punto specifica degli LLM per renderli adeguatamente applicabili alla neurologia clinica”.
L'impiego efficace dell'IA in importanti attività sanitarie, come la ricerca sul cancro di AstraZeneca o la lotta alla prescrizione eccessiva di antibiotici a Hong Kong, sottolinea il potenziale di questa tecnologia. Il recente successo di Chat-4.0 nel superare un esame di neurologia indica un futuro entusiasmante per l'IA in ambito sanitario, segnando un altro passo avanti nel percorso verso progressi medici basati sull'IA.