최근 한 개발자가 AI 에이전트(agent)와 워크플로우(workflow)의 핵심 개념을 시각적으로 설명하는 웹 기반 도구를 공개했습니다. 이 도구는 복잡한 AI 시스템이 어떻게 작동하는지, 특히 대규모 언어모델(LLM) 기반의 에이전트가 목표를 달성하기 위해 어떤 과정을 거치는지, 그리고 워크플로우가 어떻게 고정된 단계를 따르는지를 명확하게 보여줍니다. 이는 AI 개발자와 학습자 모두에게 추상적인 개념을 구체적으로 이해하는 데 큰 도움이 될 것으로 기대됩니다.
에이전트는 특정 작업을 해결하기 위해 반복적인 루프(loop)를 통해 작동합니다. 입력(input)을 읽고, 생각(think)하고, 도구 호출(tool call)을 생성하며, 시스템(harness)이 이를 실행(act)합니다. 이 실행 결과는 다음 입력이 되어 에이전트가 작업을 완료할 때까지 이 과정이 반복됩니다. 여기서 도구(tool)는 모델이 호출할 수 있는 함수이며, 트레이스(trace)는 모든 단계의 기록을 의미합니다. 반면, 워크플로우는 코드로 정해진 고정된 파이프라인(fixed pipeline)입니다. 각 단계는 결정론적 로직을 실행하거나 모델을 한 번 호출한 후 다음 단계로 넘어갑니다. 에이전트처럼 반복적인 루프나 도구 선택 없이, 모델은 정해진 한 슬롯을 채우고 나머지는 시스템이 주도합니다. 이는 예측 가능하고 비용 효율적이지만, 자율성이 없다는 단점이 있습니다.
이러한 시각화 도구는 AI 시스템 설계 및 디버깅에 있어 중요한 의미를 가집니다. 에이전트의 자율성과 유연성, 워크플로우의 예측 가능성과 효율성이라는 두 가지 접근 방식의 장단점을 명확히 이해함으로써, 개발자들은 특정 목적에 맞는 최적의 시스템을 구축할 수 있습니다. 예를 들어, RAG(검색 증강 생성) 파이프라인은 워크플로우의 한 형태로, 문서를 검색하여 모델의 컨텍스트에 넣고 답변을 생성하는 방식으로 작동합니다. 이처럼 AI 에이전트와 워크플로우의 작동 원리를 시각적으로 파악하는 것은 AI 기술의 발전과 활용을 가속화하는 데 기여할 것입니다.