최근 LLM 기반 에이전트의 활용이 늘면서, 복잡한 작업을 여러 에이전트가 협력하여 처리하는 방식이 주목받고 있습니다. 이러한 흐름 속에서 'Sub-Agent MCP'라는 새로운 오픈소스 프레임워크가 등장했습니다. 이 프레임워크는 상위 LLM(Parent LLM)이 특정 작업을 전문 하위 에이전트(Sub-Agent)에게 위임하고, 이 하위 에이전트들이 각자의 역할에 맞춰 최적화된 LLM과 도구를 활용하여 작업을 수행하도록 오케스트레이션하는 역할을 합니다.
Sub-Agent MCP는 파이썬(Python)으로 구현된 서버로, 상위 LLM과 하나 이상의 전문 하위 에이전트 사이에 위치합니다. 상위 LLM은 이 서버에 연결하여 YAML 파일에 정의된 각 에이전트의 이름(예: '연구원' 에이전트)을 도구처럼 호출하며 작업을 위임합니다. 각 하위 에이전트는 자체적인 LLM(OpenAI 호환 모델), 시스템 프롬프트(System Prompt), 그리고 파일 시스템 접근이나 검색과 같은 추가적인 하위 MCP 서버(Downstream MCP Servers) 연결을 가질 수 있습니다. 이를 통해 상위 LLM은 모든 도구 스키마를 직접 관리할 필요 없이 가벼운 상태를 유지하고, 각 하위 에이전트는 자신의 역할에 필요한 도구와 컨텍스트만 보게 되어 효율성이 극대화됩니다.
이러한 에이전트 위임 및 오케스트레이션 방식은 여러 가지 중요한 이점을 제공합니다. 첫째, 컨텍스트 과부하(Context Bloat)를 방지하여 LLM의 비용을 절감하고 성능을 향상시킵니다. 상위 LLM이 모든 도구와 정보를 직접 처리하는 대신, 필요한 부분만 하위 에이전트에게 전달하기 때문입니다. 둘째, 역할별 맞춤 설정(Per-role Configuration)이 가능해 각 에이전트의 특성과 목적에 따라 다른 모델, 프롬프트, 도구 접근 권한 등을 유연하게 구성할 수 있습니다. 마지막으로, Pydantic 검증을 통한 YAML 설정, 구조화된 로깅, 도커(Docker) 지원 등 프로덕션 환경에 적합한 기능들을 제공하여 실제 서비스에 적용하기 용이하다는 점도 큰 장점입니다. 이는 복잡한 AI 에이전트 시스템을 구축하려는 개발자들에게 강력한 도구가 될 것입니다.