인공지능(AI)을 활용한 항생제 내성(AMR) 예측은 전장 유전체 시퀀싱(WGS) 데이터를 기반으로 높은 정확도를 달성해왔습니다. 하지만 기존 모델들은 어떤 생물학적 경로를 통해 내성이 발현되는지, 즉 AI가 '왜' 특정 예측을 하는지에 대한 설명을 제공하지 못해 임상 현장에서의 신뢰 확보에 어려움이 있었습니다. 이러한 한계를 극복하기 위해 KG-TRACE라는 새로운 신경-상징(neuro-symbolic) 프레임워크가 개발되어 AI 예측에 생물학적 근거를 부여하는 중요한 진전을 이루었습니다.
KG-TRACE는 세계보건기구(WHO)의 돌연변이 지식 그래프(Knowledge Graph, KG)를 신경망 모델에 구조화된 생물학적 제약 조건으로 통합합니다. 기존 방식이 단순히 통계적 패턴을 학습하는 것과 달리, KG-TRACE는 유전체 특징과 RotatE 기반의 지식 그래프 임베딩을 '인식론적 신뢰 게이트(epistemic trust gate)'를 통해 융합합니다. 이 게이트는 신경망의 증거와 상징적 생물학적 지식의 가중치를 동적으로 조절하며, 이를 통해 AI 예측이 어떤 생물학적 메커니즘에 기반하는지 설명할 수 있게 됩니다. 결핵균(M. tuberculosis) 코호트 데이터에 대한 평가에서 KG-TRACE는 이소니아지드(isoniazid) 내성 예측에서 0.9760의 AUROC(곡선 아래 면적)를 달성하며 경쟁력 있는 정확도를 보였습니다. 이 모델의 핵심 가치는 예측 정확도 향상보다는 '생물학적 근거 제시'에 있습니다.
더 나아가 연구진은 신경망의 귀인(attribution)과 기존 생물학적 지식 간의 정렬도를 정량화하는 '생물학적 근거 비율(Biological Grounding Ratio, BGR)'이라는 새로운 데이터셋 수준 지표를 도입했습니다. KG-TRACE는 이소니아지드 내성 예측에서 92.5%의 상징적 커버리지(symbolic coverage)를 달성했으며, 다제내성(MDR) 동시 발생 아티팩트(artifact)를 효과적으로 식별하여 '불확실(UNCERTAIN)' 사례에 대해 실험실 후속 조치를 권고하는 플래그를 발행합니다. 이러한 신경-상징적 근거 제시(neuro-symbolic grounding)는 임상의에게 검증 가능한 감사 추적(audit trail)을 제공하여, 예측 정확도와 임상적 신뢰 사이의 간극을 메우는 중요한 역할을 할 것으로 기대됩니다. 이는 AI가 의료 분야에서 더욱 폭넓게 수용되고 활용될 수 있는 기반을 마련합니다.
