파운데이션 모델(FM)이 의료 데이터, 특히 암 진단 분야에서 강력한 잠재력을 보여주고 있습니다. 하지만 실제 임상 환경에서 발생하는 다양한 데이터 분포 변화(distribution shift)에 얼마나 잘 일반화될 수 있는지는 여전히 중요한 과제로 남아있었습니다. 최근 발표된 연구는 이러한 문제를 해결하기 위해 실제 상업용 암 데이터셋을 활용하여 FM 기반 표현의 성능과 신뢰성을 체계적으로 평가했습니다.
이 연구는 유방암(IH-BC)과 비소세포폐암(IH-NSCLC)이라는 두 가지 실제 암 코호트에서 파운데이션 모델의 성능을 분석했습니다. 특히, 조직 슬라이드 이미지(whole-slide images)와 전사체 프로파일(transcriptomic profiles)이라는 두 가지 양식(modality)의 데이터를 활용하여, 각 양식의 정보가 상호 보완적인 예측 신호를 제공함을 밝혀냈습니다. 또한, 단일 양식(unimodal) 데이터만 사용하는 것보다 여러 양식의 데이터를 융합(fusion)했을 때 진단 성능이 더욱 향상될 수 있음을 세 가지 융합 전략을 통해 입증했습니다. 연구팀은 모델의 신뢰성을 평가하기 위해 예측 불확실성을 고려하는 등각 예측(conformal prediction) 기법을 적용했으며, 이를 통해 오진이 발생하더라도 참 진단이 예측 집합 내에 포함될 가능성이 높다는 것을 확인했습니다.
이번 연구 결과는 파운데이션 모델이 실제 임상 환경의 다양한 데이터에서도 경쟁력 있는 성능을 발휘할 수 있음을 시사합니다. 특히, 여러 양식의 의료 데이터를 효과적으로 결합하는 멀티모달 융합 전략은 진단 정확도를 높이는 데 기여하며, 등각 예측을 통한 불확실성 인식 추론(uncertainty-aware inference)은 AI 기반 진단 시스템의 임상적 신뢰도를 한층 강화할 수 있습니다. 이는 의료 전문가들이 AI 시스템을 통해 보다 정확하고 신뢰할 수 있는 진단 지원을 받을 수 있는 길을 열어줄 것으로 기대됩니다.