최근 발표된 연구에 따르면, 확산 언어 모델(Diffusion Language Model)이 방사선 보고서 초안 작성에 있어 기존 자동회귀(Autoregressive, AR) 모델보다 뛰어난 성능과 유연성을 제공하는 것으로 나타났습니다. 텍스트를 왼쪽에서 오른쪽으로 순차적으로 생성하는 AR 모델과 달리, 확산 모델은 토큰 캔버스를 양방향으로 노이즈 제거하며 텍스트를 생성하는 방식으로, 의료 분야의 복잡한 문서 작성에 새로운 가능성을 제시하고 있습니다.
연구팀은 전문가 혼합(mixture-of-experts) 확산 언어 모델인 DiffusionGemma-26B를 개발하고, 동일한 크기의 AR 모델인 Gemma-4-26B와 의료 시각 질의응답 데이터셋에서 성능을 비교했습니다. 그 결과, DiffusionGemma-26B는 모든 벤치마크에서 AR 모델과 동등하거나 더 나은 성능을 보였으며, 디코딩 속도 또한 3.5~4.4배 더 빨랐습니다. 특히, 확산 모델은 AR 모델에는 없는 '어떤 순서로든 채우기(any-order infill)'라는 고유한 기능을 제공합니다. 이는 방사선 전문의가 보고서의 특정 부분을 수정하거나 비어있는 부분에 텍스트를 채워 넣을 때 모델이 양방향으로 텍스트를 생성하여 자연스럽게 완성해주는 기능으로, 의료 보고서 작성의 비효율성을 크게 개선할 수 있습니다.
이러한 확산 모델의 발전은 의료 문서 작성의 효율성과 정확성을 높이는 데 중요한 의미를 가집니다. 의료 보고서는 종종 간결하거나 의료진 및 기관마다 일관성이 부족한 경우가 많아 수정과 보완이 빈번하게 발생합니다. 확산 모델의 '어떤 순서로든 채우기' 기능은 이러한 현실적인 요구사항을 충족시키며, 의료진이 더욱 빠르고 정확하게 보고서를 완성할 수 있도록 돕습니다. 이는 궁극적으로 의료 서비스의 질을 향상하고 의료진의 업무 부담을 줄이는 데 기여할 것으로 기대됩니다.
