대규모 언어모델(LLM)을 활용한 다중 에이전트 시스템(MAS)은 여러 에이전트가 각자의 역할을 수행하며 협력하는 방식으로 작동합니다. 하지만 이들 에이전트가 서로 자유로운 형식의 자연어로 소통할 경우, 불필요한 정보 교환으로 인해 토큰 사용량이 급증하고, 이는 곧 추론(inference) 비용 증가와 시스템 성능 저하로 이어지는 문제가 있었습니다.
최근 발표된 연구 논문은 이러한 비효율성을 해결하기 위해 에이전트 간 통신 전략을 분석하고, 'PACT(Protocolized Action-state Communication and Transmission)'라는 새로운 프로토콜을 제안했습니다. PACT는 에이전트의 원시 출력을 하위 에이전트가 필요로 하는 '액션 중심 정보'를 담은 간결한 '액션-상태 기록(action-state record)'으로 압축하여 공유합니다. 이는 마치 공개된 상태 업데이트 문제처럼 작동하여, 공유되는 이력(shared history)에 불필요한 정보가 쌓이는 것을 방지합니다. 연구팀은 다양한 MAS 토폴로지에서 PACT가 토큰 사용량을 크게 줄이면서도 작업 성능을 유지하거나 오히려 향상시키는 것을 확인했습니다. 예를 들어, PACT를 적용했을 때 OpenHands의 문제 해결률은 유지하면서 토큰 사용량을 10% 절감했으며, SWE-agent에서는 입력 토큰을 절반으로 줄이면서도 해결률에 영향을 주지 않았습니다.
이 연구 결과는 LLM 기반 다중 에이전트 시스템의 개발 및 운영 비용 효율성을 크게 개선할 수 있다는 점에서 중요한 의미를 가집니다. 특히, 토큰 사용량은 LLM 서비스의 핵심 비용 요소이므로, PACT와 같은 효율적인 통신 전략은 더 복잡하고 정교한 에이전트 시스템을 경제적으로 구축할 수 있는 기반을 마련합니다. 이는 곧 AI 에이전트 기술의 상용화와 확산을 가속화하고, 개발자들이 비용 부담 없이 혁신적인 에이전트 기반 애플리케이션을 만들 수 있는 기회를 제공할 것으로 기대됩니다.