Ang sopistikadong modelo ng wika ng OpenAI, ang Chat-4.0, ay gumawa ng isang makabuluhang hakbang pasulong sa intersection ng artificial intelligence at healthcare. Sa isang kamakailang pag-aaral na patunay-ng-konsepto, matagumpay na nakapasa ang malaking modelo ng wika (LLM) na ito sa pagsusulit sa klinikal na neurology, na sinasagot nang tama ang 85% ng mga tanong. Ang kahanga-hangang tagumpay na ito ay nagmumungkahi na sa karagdagang mga pagpipino, ang mga LLM ay maaaring mag-ukit ng isang makabuluhang angkop na lugar sa larangan ng klinikal na neurolohiya.
Ang groundbreaking na pag-aaral ay isinagawa ng isang pangkat ng mga mananaliksik na nagmula sa University Hospital Heidelberg at sa German Cancer Research Center sa Heidelberg. Ang mga resulta, na inilathala noong Disyembre 7, ay binibigyang-diin ang potensyal ng AI sa muling paghubog ng pangangalagang pangkalusugan. Ang pagsubok na ibinibigay sa Chat-4.0 kasama ang isang hanay ng mga tanong mula sa American Board of Psychiatry and Neurology, na dinagdagan ng isang seleksyon mula sa European Board para sa Neurology.
Naungusan ng Chat-4.0 ang hinalinhan nito, Chat-3.5, na sumagot ng tama sa 1,306 sa 1,956 na tanong, na nakakuha ng markang 66.8%. Ang mas bagong modelo, gayunpaman, ay nagmarka ng tagumpay sa pamamagitan ng wastong pagsagot sa 1,662 na tanong, na umaabot sa 85% na rate ng tagumpay. Upang ilagay ito sa pananaw, ang average na marka ng tao ay nasa 73.8%, na nagpapahiwatig na ang Chat-4.0 ay nalampasan ang pagganap ng tao. Higit pa rito, sa 70% ang pagiging karaniwang marka ng pagpasa sa akademya, ligtas na sabihing matagumpay na naipasa ng Chat-4.0 ang pagsusulit sa neurology.
Gayunpaman, itinampok din ng pag-aaral ang mga lugar kung saan maaaring mapabuti ang mga modelo. Halimbawa, ang parehong mga modelo ay nagpakita ng mas mahinang pagganap sa mga gawaing nangangailangan ng "higher-order thinking" kumpara sa mga nangangailangan lamang ng "lower-order thinking." Ito ay nagpapahiwatig na habang ang mga LLM ay nagpapakita ng pangako sa larangan ng klinikal na neurology, mayroon pa ring puwang para sa pagpapabuti.
Sa kabila ng mga limitasyong ito, ang mga mananaliksik na kasangkot sa pag-aaral ay optimistiko tungkol sa mga potensyal na aplikasyon ng mga LLM sa klinikal na neurolohiya. Ipinaliwanag ni Dr. Varun Venkataramani, isa sa mga may-akda ng pag-aaral, sa Cointelegraph, “Mas nakikita namin ang aming pag-aaral bilang isang patunay-ng-konsepto para sa mga kakayahan ng mga LLM. Kailangan pa rin ang pag-unlad at marahil kahit na ang partikular na pag-aayos ng mga LLM upang maging angkop ang mga ito para sa clinical neurology."
Ang matagumpay na paggamit ng AI sa mahahalagang gawain sa pangangalagang pangkalusugan, tulad ng pananaliksik sa kanser ng AstraZeneca o paglaban sa labis na reseta ng antibiotic sa Hong Kong, ay binibigyang-diin ang potensyal ng teknolohiyang ito. Ang kamakailang tagumpay ng Chat-4.0 sa pagpasa sa isang pagsusulit sa neurology ay nagpapahiwatig ng isang kapana-panabik na hinaharap para sa AI sa pangangalagang pangkalusugan, na nagmamarka ng isa pang hakbang pasulong sa paglalakbay patungo sa mga pagsulong na medikal na hinimok ng AI.