ChatGPT 臨床決策診斷準確度達 72%

2023 年 8 月 30 日

在快速發展的醫療技術領域,人工智慧 (AI) 已成為一種有爭議但前景廣闊的工具。 人工智慧在複雜醫療場景中的應用引發了醫療保健專業人士的廣泛爭論。 最近的一項研究探討了人工智慧協助臨床決策的能力,使這項討論更加引人注目。

由研究者進行 麻省將軍布里格姆該研究評估了OpenAI Chat在基於教科書案例研究的醫療狀況診斷中的表現。令人驚訝的是,Chat在臨床決策中取得了72%的成功率,顯示其作為醫療診斷輔助工具的潛力。

隨著全球醫療保健系統面臨日益增長的成本和複雜性,人工智慧或許能提供解決方案,提高診斷的效率和準確性。 2021年,醫療保健約占美國GDP的18%,幾乎是已開發經濟體平均值的兩倍,因此對更有效診斷方法的需求顯而易見。像Chat這樣的人工智慧工具可能會徹底改變醫療保健產業,使診斷更快、更準確、更具成本效益。

這項研究是首批評估大型語言模式在廣泛臨床護理領域能力的研究之一。 Chat 的性能評估涵蓋了從最初的患者互動到診斷後護理管理的各個環節。此人工智慧模型在最終診斷中的成功率為 77%,但在鑑別診斷(涉及了解一組症狀可能指示的所有可能情況)方面的成功率較低,僅為 60%。

雖然結果令人鼓舞,但必須注意的是,人工智慧應用在現實臨床環境中的有效性可能與受控研究環境有很大差異。 批評者認為,許多人工智慧研究並沒有立足於實際的臨床需求,而且往往忽略了在現實世界的醫療保健環境中實施人工智慧的實際挑戰,例如醫療事故風險。

麻省總醫院創新孵化器的執行董事、該報告的合著者馬克·蘇奇(Marc Succi)承認這一差距。 他指出,雖然人工智慧在資訊有限的情況下在早期患者護理方面顯示出巨大潛力,但在完全融入醫療保健系統之前,它需要在鑑別診斷方面進行重大改進。

蘇西將 Chat 目前的能力比喻為一位剛畢業的醫生。然而,由於缺乏不同資歷醫師之間成功率的既定基準,量化人工智慧為醫生工作帶來的價值頗具挑戰性。

展望未來,Succi 呼籲進行更多基準研究、制定監管指導並提高診斷成功率。他認為,這對於促進 Chat 等 AI 模型在醫院的部署至關重要。 AI 在醫療保健領域的作用仍在不斷發展,雖然 Chat 的成就令人矚目,但顯然,我們對如何利用 AI 來改變醫療保健的理解才剛起步。