기존의 다중 에이전트 시스템(Multi-agent systems, MAS)은 투표, 합의 프로토콜, 토론 등을 통해 에이전트 간의 의견 불일치(disagreement)를 줄이는 데 초점을 맞춰 설계되었습니다. 그러나 최근 아카이브(arXiv)에 발표된 미하우 바베르(Michał Wawer)와 야로스와프 A. 후지악(Jarosław A. Chudziak)의 연구에 따르면, 이러한 합의 지향적 접근 방식은 가치 판단이 중요한 작업에서는 전략적으로 불충분하다고 지적합니다. 단순한 오류가 아닌 '진정한 규범적 불확실성'에서 비롯된 이견은 오히려 중요한 지식 신호가 될 수 있다는 것입니다.
연구팀은 인간-AI 협업 콘텐츠 중재(content moderation)에 대한 이전 연구를 기반으로, 추론 과정의 불일치를 지식 표현 계층으로 추상화하는 새로운 프레임워크를 제안했습니다. 이 프레임워크는 에이전트의 명시적인 추론 과정과 이진 결정을 분석하여, 추론 유사성과 결론 일치 여부에 따라 네 가지 불일치 상태(수렴적 합의, 발산적 합의, 수렴적 불일치, 발산적 불일치)를 구분합니다. 이러한 상태를 통해 시스템은 불일치를 단순한 문제로 치부하지 않고, 전략적인 라우팅 규칙(routing rules)을 지원하여 대규모 언어모델(LLM)의 서브-심볼릭(sub-symbolic) 추론과 심볼릭(symbolic) 지식 표현을 연결하는 다중 에이전트 전략적 추론의 다리를 놓습니다.
이 연구는 AI 시스템이 복잡한 사회적, 윤리적 판단을 내려야 하는 영역에서 중요한 시사점을 제공합니다. 예를 들어, 콘텐츠 중재와 같이 정답이 명확하지 않고 다양한 관점이 존재하는 작업에서, AI가 단순히 다수결에 따르거나 오류를 회피하는 것을 넘어, 이견의 본질을 이해하고 이를 의사결정 과정에 적극적으로 반영할 수 있게 됩니다. 이는 AI의 신뢰성과 투명성을 높이고, 인간과 AI의 협업을 더욱 정교하게 만들어 궁극적으로 더 나은 결과물을 도출하는 데 기여할 것으로 기대됩니다.