대규모 언어모델(LLM)이 다양한 작업을 수행하는 멀티 에이전트(multi-agent) 팀으로 활용되면서, 이들 에이전트의 '성격'이 팀 성과에 어떤 영향을 미치는지에 대한 연구가 주목받고 있습니다. 최근 아리안 켈루스카(Aryan Keluskar) 외 연구진은 LLM 에이전트에 특정 성격 프롬프트(personality prompting)를 부여했을 때, 이것이 의사소통 방식뿐 아니라 실제 작업 결과에도 영향을 미치는지 체계적으로 분석한 논문을 발표했습니다.
연구팀은 개방형 연구 협업, 경쟁적 협상, 구조화된 코딩 등 세 가지 유형의 작업에서 LLM 에이전트의 성격 특성을 조작하며 팀 성과를 측정했습니다. 그 결과, 성격의 영향은 작업의 구조에 따라 크게 달라진다는 것을 발견했습니다. 특히 '낮은 우호성(low agreeableness)'을 부여받은 에이전트들은 적대적인 언어를 사용하며 의사소통 방식에 큰 변화를 보였습니다. 이러한 변화는 개방형 협업이나 경쟁적 협상 같은 복잡하고 상호작용이 많은 작업에서 팀의 전반적인 성과를 크게 떨어뜨렸습니다.
반면, 명확한 규칙과 목표를 가진 구조화된 코딩 작업에서는 낮은 우호성 성격이 의사소통 방식에는 변화를 주었지만, 마일스톤(milestone) 달성 등 객관적인 작업 성과에는 거의 영향을 미치지 않았습니다. 이는 작업의 본질과 요구되는 상호작용 수준에 따라 LLM 에이전트의 성격 구성이 중요하게 작용할 수 있음을 의미합니다. 이번 연구는 멀티 에이전트 시스템을 설계할 때, 단순히 기능적 능력뿐 아니라 에이전트 간의 '성격 조합'을 신중하게 고려해야 한다는 중요한 시사점을 제공합니다. 앞으로 LLM 기반의 협업 시스템이나 자율 에이전트 개발에 있어 인간 팀워크의 복잡성을 이해하고 적용하는 데 기여할 것으로 보입니다.
