AI 항생제 내성 예측, '왜' 작동하는지 설명한다

인공지능(AI) 기반 항생제 내성(AMR) 예측 모델은 정확도가 높지만, 예측의 생물학적 근거를 설명하기 어렵다는 한계가 있었습니다. 최근 KG-TRACE라는 새로운 신경-상징(neuro-symbolic) 프레임워크가 WHO의 돌연변이 지식 그래프를 통합하여 AI 예측의 생물학적 메커니즘을 명확히 설명하고, 임상적 신뢰도를 높이는 길을 열었습니다.

6일 전·2026.06.26·읽기 2분·Naman Garg, Sarika Jain, Sourav Yadav, Bharat K. Bhargava, Ghanapriya Singh, Abhishek Srivastava, Parimal Kar

인공지능(AI)을 활용한 항생제 내성(AMR) 예측은 전장 유전체 시퀀싱(WGS) 데이터를 기반으로 높은 정확도를 달성해왔습니다. 하지만 기존 모델들은 어떤 생물학적 경로를 통해 내성이 발현되는지, 즉 AI가 '왜' 특정 예측을 하는지에 대한 설명을 제공하지 못해 임상 현장에서의 신뢰 확보에 어려움이 있었습니다. 이러한 한계를 극복하기 위해 KG-TRACE라는 새로운 신경-상징(neuro-symbolic) 프레임워크가 개발되어 AI 예측에 생물학적 근거를 부여하는 중요한 진전을 이루었습니다.

KG-TRACE는 세계보건기구(WHO)의 돌연변이 지식 그래프(Knowledge Graph, KG)를 신경망 모델에 구조화된 생물학적 제약 조건으로 통합합니다. 기존 방식이 단순히 통계적 패턴을 학습하는 것과 달리, KG-TRACE는 유전체 특징과 RotatE 기반의 지식 그래프 임베딩을 '인식론적 신뢰 게이트(epistemic trust gate)'를 통해 융합합니다. 이 게이트는 신경망의 증거와 상징적 생물학적 지식의 가중치를 동적으로 조절하며, 이를 통해 AI 예측이 어떤 생물학적 메커니즘에 기반하는지 설명할 수 있게 됩니다. 결핵균(M. tuberculosis) 코호트 데이터에 대한 평가에서 KG-TRACE는 이소니아지드(isoniazid) 내성 예측에서 0.9760의 AUROC(곡선 아래 면적)를 달성하며 경쟁력 있는 정확도를 보였습니다. 이 모델의 핵심 가치는 예측 정확도 향상보다는 '생물학적 근거 제시'에 있습니다.

더 나아가 연구진은 신경망의 귀인(attribution)과 기존 생물학적 지식 간의 정렬도를 정량화하는 '생물학적 근거 비율(Biological Grounding Ratio, BGR)'이라는 새로운 데이터셋 수준 지표를 도입했습니다. KG-TRACE는 이소니아지드 내성 예측에서 92.5%의 상징적 커버리지(symbolic coverage)를 달성했으며, 다제내성(MDR) 동시 발생 아티팩트(artifact)를 효과적으로 식별하여 '불확실(UNCERTAIN)' 사례에 대해 실험실 후속 조치를 권고하는 플래그를 발행합니다. 이러한 신경-상징적 근거 제시(neuro-symbolic grounding)는 임상의에게 검증 가능한 감사 추적(audit trail)을 제공하여, 예측 정확도와 임상적 신뢰 사이의 간극을 메우는 중요한 역할을 할 것으로 기대됩니다. 이는 AI가 의료 분야에서 더욱 폭넓게 수용되고 활용될 수 있는 기반을 마련합니다.