최근 한 환자가 오른쪽 어깨 통증으로 받은 MRI 검사 결과에 대해 인공지능(AI)의 2차 소견을 구해 의료 진단에 대한 새로운 관점을 제시했습니다. 병원은 견갑하근 힘줄의 'Grade III 부분층 파열(partial-thickness tear)' 진단을 내리고 즉각적인 치료를 권했지만, 환자는 이에 의문을 품고 앤트로픽(Anthropic)의 대규모 언어모델(LLM)인 Opus 4.8을 클로드 코드(Claude Code) 환경에서 활용해 수백 개의 DICOM MRI 파일을 직접 분석했습니다.
Opus 4.8은 약 266MB에 달하는 MRI 데이터를 분석한 결과, 병원과는 달리 해당 힘줄이 '온전하다(intact tendon)'고 판단했습니다. 이 환자는 또한 GPT 5.5 Pro를 통해 병원에서 시행한 충격파 치료와 트라우멜(Traumeel) 주사의 의학적 근거가 부족하다는 점을 확인하며 기존 진단에 대한 불신이 커졌습니다. 이후 인간 MRI 보고서와 ChatGPT 대화 내용을 추가로 제공하여 Opus 4.8에 중재 분석을 요청했고, 최종적으로 '경도 삽입부 건증(mild insertional tendinopathy), 명확한 부분층 또는 전층 파열 없음'이라는 결론에 가까운 결과를 얻었습니다.
이 사례는 AI가 복잡한 의료 영상 분석에 활용될 잠재력을 보여주는 동시에, 의료 전문가와 AI 중 무엇을 신뢰해야 할지에 대한 근본적인 질문을 던집니다. AI는 환자가 의료 정보를 더 깊이 이해하고 질문을 제기하는 데 도움을 줄 수 있지만, 아직은 최종 진단을 대체하기 어렵다는 한계도 명확합니다. 의료 분야에서 AI의 역할은 진단 보조 도구로서 환자의 정보 접근성을 높이고, 의료진이 놓칠 수 있는 부분을 짚어내는 데 기여할 수 있을 것입니다. 궁극적으로는 AI와 인간 전문가의 협력을 통해 더 정확하고 신뢰할 수 있는 의료 서비스를 제공하는 방향으로 나아가야 할 것입니다.