에이전트 자율성 수준

인공지능(AI) 에이전트의 역할이 단순한 프롬프트 입력 방식을 넘어, 시스템의 '운영 설계'라는 복합적인 영역으로 확장되고 있습니다. 이는 AI 에이전트가 특정 작업을 얼마나 자율적으로 수행할지 결정하고, 그 결과를 어떻게 검증할 것인지에 대한 체계적인 접근 방식이 필요하다는 의미입니다. 더 이상 개별 프롬프트에 집중하기보다, 에이전트들이 유기적으로 협력하며 목표를 달성하도록 전체적인 시스템을 설계하는 것이 중요해지고 있습니다.

에이전트의 자율성은 크게 두 가지 축으로 나눌 수 있습니다. 하나는 '에이전시(agency)'로, 단일 에이전트가 얼마나 독립적으로 제안하고, 작업을 수행하며, 목표를 달성하는지를 의미합니다. 다른 하나는 '오케스트레이션(orchestration)'으로, 여러 에이전트가 동시에 얼마나 잘 조율되어 복잡한 작업을 처리하는지를 나타냅니다. 앤트로픽(Anthropic)의 클로드 코드(Claude Code) 분석에 따르면, 약 23만 5천 명의 사용자 데이터를 통해 사람은 계획 결정의 약 70%를 담당하고, 클로드(Claude)는 실행의 약 80%를 맡는 양상이 나타났습니다. 이는 사람이 큰 그림을 그리고 AI가 세부 실행을 담당하는 협업 모델이 효과적임을 시사합니다.

에이전트의 자율성 수준은 '제안만 하는 보조(Assist)' 단계부터 '예외 상황에서만 사람이 개입하는 관리(Managed-by-exception orchestration)' 단계까지 0에서 5단계로 구분됩니다. 상위 단계로 갈수록 목표, 범위, 검증 방식, 권한, 예산 등이 명확하게 정의되어야 합니다. 예를 들어, '목표 지향적 자율성(Goal-driven autonomy)' 단계에서는 에이전트가 특정 목표 달성을 위해 스스로 계획하고 실행하며 테스트하지만, 이때 목표는 반드시 자동화된 방식으로 측정 가능해야 합니다. 또한, 여러 에이전트가 병렬로 작업하는 '병렬 위임(Parallel delegation)' 단계에서는 에이전트 간의 작업 분해와 격리가 핵심이며, '예외 관리 오케스트레이션(Managed-by-exception orchestration)' 단계에서는 매니저 에이전트가 전체 작업을 분배하고 모니터링하며, 사람은 문제가 발생할 때만 개입하는 공장(factory) 모델에 가까워집니다.

이러한 변화는 AI 에이전트가 단순한 도구를 넘어, 복잡한 소프트웨어 개발 및 운영 환경에서 핵심적인 역할을 수행할 잠재력을 보여줍니다. 엔지니어는 위험 수준과 되돌릴 수 있는 정도에 따라 에이전트의 자율성을 신중하게 조정해야 합니다. 즉, 낮은 위험의 명확한 작업에는 높은 자율성을 부여하고, 중요한 결정이나 대규모 코드 리팩토링과 같은 고위험 작업에는 더 많은 사람의 개입과 검증을 두는 것입니다. 궁극적으로는 AI 에이전트의 높은 자율성이 사람을 완전히 배제하는 것이 아니라, 사람이 매 단계를 직접 수행하는 방식에서 벗어나 전체적인 방향을 설정하고 중요한 의사결정에 집중할 수 있도록 돕는 방향으로 진화해야 합니다.

AI 에이전트의 자율성을 효과적으로 활용하기 위해서는 실행 전에 '계약(contract)'을 명확히 정의하는 것이 필수적입니다. 이 계약에는 에이전트가 달성해야 할 목표, 작업 범위, 사용 가능한 도구와 권한, 정지 조건, 완료를 증명할 증거, 에스컬레이션(문제 발생 시 개입 주체), 그리고 예산(시간, 노력, 토큰 한도) 등이 포함되어야 합니다. 이러한 사전 정의는 에이전트의 행동을 예측 가능하게 만들고, 발생할 수 있는 오류나 예상치 못한 결과를 최소화하는 데 기여합니다. 또한, 자율성 수준별로 추적 가능한 지표를 설정하여 에이전트의 성능과 신뢰도를 지속적으로 관리하는 것이 중요합니다. 이는 AI 에이전트가 실제 비즈니스 환경에서 안전하고 효율적으로 작동하기 위한 핵심 요소가 될 것입니다.