빠르게 발전하는 의료 기술 세계에서 인공지능(AI)은 논란의 여지가 있지만 유망한 도구로 떠올랐습니다. 복잡한 의료 시나리오에 AI를 적용하는 것은 의료 전문가들 사이에서 상당한 논쟁을 불러일으켰습니다. 임상 의사 결정을 지원하는 AI의 능력을 조사한 최근 연구에서는 이러한 논의가 더욱 명확해졌습니다.
연구진이 실시한 매스 제너럴 브리검이 연구는 교과서 사례 연구를 기반으로 OpenAI의 Chat이 질병 진단에 얼마나 효과적인지 평가했습니다. 놀랍게도 Chat은 임상 의사 결정에서 72%의 성공률을 기록하며, 의료 진단 보조 도구로서의 잠재력을 보여주었습니다.
전 세계 의료 시스템이 비용 증가와 복잡성 증가에 직면함에 따라, AI는 진단의 효율성과 정확성을 향상시키는 해결책을 제시할 수 있습니다. 2021년 미국 GDP의 약 18%를 차지하는 의료 분야가 선진국 평균의 거의 두 배에 달하는 상황에서, 더욱 효과적인 진단 방법에 대한 필요성은 분명합니다. 챗과 같은 AI 도구는 의료 분야에 혁신을 일으켜 진단을 더욱 빠르고 정확하며 비용 효율적으로 만들어 줄 수 있습니다.
이 연구는 광범위한 임상 치료에서 대규모 언어 모델의 역량을 평가한 최초의 연구 중 하나였습니다. Chat의 성능은 초기 환자 상호작용부터 진단 후 관리까지 평가되었습니다. AI 모델은 최종 진단에서 77%의 성공률을 보였지만, 일련의 증상이 나타낼 수 있는 모든 질환을 이해하는 감별 진단에서는 60%라는 낮은 성공률을 보였습니다.
결과는 유망하지만, 실제 임상 환경에서 AI 애플리케이션의 효과는 통제된 연구 환경에 따라 크게 달라질 수 있다는 점에 유의하는 것이 중요합니다. 비평가들은 많은 AI 연구가 실제 임상적 요구에 근거하지 않으며 의료과실 위험과 같은 실제 의료 환경에서 AI를 구현하는 데 따른 실질적인 과제를 간과하는 경우가 많다고 주장합니다.
Mass General Brigham의 혁신 인큐베이터이자 보고서의 공동 저자인 Marc Succi는 이러한 격차를 인정합니다. 그는 정보가 제한적일 때 AI가 초기 단계 환자 치료에서 큰 잠재력을 보여주지만 의료 시스템에 완전히 통합되기 전에 감별 진단에서 상당한 개선이 필요하다고 지적합니다.
수치는 챗의 현재 역량을 갓 졸업한 의사의 역량에 비유합니다. 하지만 다양한 경력 단계의 의사들 간의 성공률에 대한 기준이 확립되어 있지 않기 때문에 AI가 의사의 업무에 얼마나 가치를 더하는지 정량화하기는 어렵습니다.
앞으로 Succi는 더 많은 벤치마크 연구, 규제 지침, 그리고 진단 성공률 향상을 촉구합니다. 그는 이것이 Chat과 같은 AI 모델의 병원 도입을 촉진하는 데 필수적이라고 생각합니다. 의료 분야에서 AI의 역할은 여전히 진화하고 있으며, Chat의 성과는 주목할 만하지만, AI를 활용하여 의료를 혁신하는 방법을 이해하는 것은 아직 시작 단계에 불과하다는 것이 분명합니다.