최근 연구에 따르면, 여러 대규모 언어모델(LLM) 에이전트가 서로 의견을 주고받으며 답을 수정하는 '다중 에이전트 토론(Multi-Agent LLM Deliberation)' 방식이 추론 정확도를 높이는 데 효과적임이 확인되었습니다. 하지만 이러한 방식이 왜, 그리고 어떻게 작동하는지에 대한 명확한 모델링은 부족했습니다. 이번 아카이브(arXiv) 논문은 이 과정을 인간의 의사결정 방식에 비유하며, 각 LLM 에이전트가 외부 의견과 별개로 자신만의 '숨겨진 내면의 닻(Hidden Anchor)'을 가지고 있음을 밝혀냈습니다.
연구진은 다중 에이전트 토론을 폐쇄 루프 동적 시스템으로 모델링하고, 각 에이전트가 이 '내면의 닻'이라는 숨겨진 내부 신념을 가지고 지속적으로 자신의 의견을 유지하려는 경향이 있음을 보여주었습니다. 이 닻은 토론 과정만으로도 복원될 수 있으며, 고전적인 합의 규칙으로는 설명할 수 없는 현상을 설명합니다. 특히, 에이전트의 정답에 대한 확신이 초기 모든 에이전트의 의견 범위를 넘어설 수 있다는 점, 즉 '초기 신념의 볼록 껍질(Convex Hull)'을 벗어나는 현상이 이 닻의 존재로 설명됩니다. 이는 마치 인간이 집단 의견에 영향을 받으면서도 자신의 고유한 신념을 유지하는 것과 유사합니다.
이 연구는 LLM의 다중 에이전트 시스템이 단순한 의견 수렴을 넘어, 초기 정보의 한계를 뛰어넘는 새로운 통찰이나 더 정확한 결론에 도달할 수 있는 잠재력을 가지고 있음을 시사합니다. '내면의 닻'의 존재와 그 영향력을 이해하는 것은 LLM의 추론 능력을 더욱 정교하게 설계하고, 복잡한 문제 해결에 활용하는 데 중요한 기반이 될 것입니다. 이는 LLM 기반의 협업 시스템이나 의사결정 도구 개발에 새로운 방향을 제시하며, 인공지능의 '집단 지성' 구현에 대한 이해를 심화시키는 데 기여할 것으로 기대됩니다.