ChatGPT 臨床意思決定における 72% の診断精度を証明

2023 年 8 月 30 日

急速に進化する医療技術の世界で、人工知能 (AI) は物議を醸すものの、有望なツールとして浮上しています。 複雑な医療シナリオにおける AI の適用は、医療専門家の間で大きな議論を引き起こしています。 臨床上の意思決定を支援する AI の能力を調査した最近の研究により、この議論にさらに焦点が当てられるようになりました。

の研究者によって実施されました。 ブリガム大将この研究では、教科書的な症例研究に基づいて、OpenAIのChatが病状の診断にどのように役立つかを評価しました。驚くべきことに、Chatは臨床判断において72%の成功率を達成し、医療診断を支援するツールとしての可能性を示しました。

世界中の医療システムがコストと複雑性の増大に直面する中、AIは診断の効率性と精度を向上させるソリューションを提供できる可能性があります。2021年の米国GDPに占める医療費の割合は約18%と、先進国の平均の約2倍に達しており、より効果的な診断方法の必要性は明らかです。ChatのようなAIツールは、医療分野に革命をもたらし、診断をより迅速、正確、そして費用対効果の高いものにする可能性があります。

この研究は、幅広い臨床ケアにおける大規模言語モデルの能力を評価した最初の研究の一つです。Chatのパフォーマンスは、患者との最初のやり取りから診断後のケア管理まで評価されました。AIモデルは最終診断において77%の成功率を示しましたが、一連の症状から示唆される可能性のあるすべての病態を理解する鑑別診断においては、成功率は60%と低い結果となりました。

結果は有望ですが、現実の臨床現場における AI アプリケーションの有効性は、管理された研究環境とは大きく異なる可能性があることに注意することが重要です。 批評家は、AI 研究の多くは実際の臨床ニーズに基づいておらず、医療過誤のリスクなど、現実の医療現場に AI を導入する際の実際的な課題を見落としていることが多いと主張しています。

マサチューセッツ・ジェネラル・ブリガムズ・イノベーション・インキュベーターのエグゼクティブ・ディレクターであり、報告書の共著者でもあるマーク・スーッチ氏は、このギャップを認めている。 同氏は、AIは情報が限られている初期段階の患者ケアにおいて大きな可能性を示す一方、医療システムに完全に統合するには鑑別診断において大幅な改善が必要であると指摘している。

サッチ氏は、チャットの現在の能力を新卒医師の能力に例えています。しかし、様々なレベルの医師の成功率に関する確立されたベンチマークがなければ、AIが医師の業務にもたらす価値を定量化することは困難です。

今後を見据え、スッチ氏はさらなるベンチマーク研究、規制当局によるガイダンス、そして診断成功率の向上を求めています。これらは、ChatのようなAIモデルの病院への導入を促進する上で不可欠だと彼は考えています。医療におけるAIの役割はまだ進化を続けており、Chatの成果は注目に値しますが、AIをどのように活用して医療を変革できるかを理解するのは、まだ始まったばかりであることは明らかです。