개발자들이 코드 작성보다 코드 리뷰에 더 많은 시간을 할애하는 현실에서, AI 에이전트가 코드를 짜고 다른 AI 에이전트가 이를 검토하며 수정하는 새로운 개발 자동화 도구 '데브루프(Devloop)'가 등장했습니다. 이 도구는 개발자가 명세(spec)를 작성하고 최종 풀 리퀘스트(PR)를 승인하는 단계에만 집중할 수 있도록 지원하며, 반복적인 코딩 및 리뷰 과정을 AI에 맡겨 개발 생산성을 극대화합니다.
데브루프는 코덱스(Codex)와 클로드 코드(Claude Code) 같은 대규모 언어모델(LLM) 기반 코딩 에이전트를 활용합니다. 특히, 한 모델이 코드를 작성하고 다른 모델이 이를 비판적으로 검토하는 '적대적(adversarial)' 방식을 채택하여, AI가 자신의 결과물을 편애하는 문제를 해결합니다. 예를 들어, 코덱스가 코드를 구현하면 클로드 코드가 명세 및 보안, 유지보수성, 정확성 등 엔지니어링 기준에 따라 이를 검토하고, 문제가 발견되면 수정 지시와 함께 코딩 에이전트에게 다시 전달하는 방식으로 루프(loop)를 반복합니다. 이 과정은 모든 승인 기준이 충족되거나 최대 반복 횟수에 도달할 때까지 자동으로 진행됩니다.
이러한 접근 방식은 개발자가 단순하고 반복적인 코딩 및 리뷰 작업에서 벗어나 더 높은 수준의 문제 해결과 설계에 집중할 수 있게 합니다. 특히, 명확한 명세 작성이 가능한 대규모 또는 다단계 작업에 유용하며, AI 에이전트가 자율적으로 코드를 개선하고 버그를 수정하는 동안 개발자는 다른 업무에 몰두할 수 있습니다. 데브루프는 개발 워크플로우를 혁신하여 소프트웨어 개발 속도를 높이고 인적 오류를 줄이는 데 기여할 잠재력을 가지고 있습니다.