인공지능(AI) 기반 다중 에이전트(LLM-MA) 시스템이 소프트웨어 개발 주기의 다양한 단계, 즉 요구사항 분석, 코드 생성, 테스트 등에 점차 활용되고 있습니다. 하지만 이러한 시스템의 실제 운영 효율성과 자원 소모량에 대한 이해는 부족하여 예측 불가능한 비용 문제와 환경적 영향으로 인해 실질적인 도입에 걸림돌이 되어 왔습니다. 최근 발표된 연구 논문 '토크노믹스(Tokenomics): 에이전트 기반 소프트웨어 엔지니어링에서 토큰 사용량 정량화'는 이 문제를 해결하기 위해 LLM-MA 시스템의 토큰 소비 패턴을 분석했습니다.
이 연구는 챗데브(ChatDev) 프레임워크와 GPT-5 추론 모델을 사용하여 수행된 30가지 소프트웨어 개발 작업의 실행 추적 데이터를 분석했습니다. 연구팀은 소프트웨어 개발 생명 주기(SDLC)를 설계, 코딩, 코드 완성, 코드 리뷰, 테스트, 문서화의 여섯 단계로 구분하고, 각 단계에서 발생하는 토큰(입력, 출력, 추론)의 분포를 정량화했습니다. 그 결과, 반복적인 코드 리뷰(Code Review) 단계가 전체 토큰 소비의 평균 59.4%를 차지하며 가장 많은 토큰을 소모하는 것으로 나타났습니다. 또한, 입력 토큰(Input Tokens)이 평균 53.9%로 가장 큰 비중을 차지했는데, 이는 에이전트 간 협업 과정에서 상당한 비효율성이 존재할 수 있음을 시사합니다.
이러한 결과는 에이전트 기반 소프트웨어 엔지니어링의 주요 비용이 초기 코드 생성보다는 자동화된 코드 개선 및 검증 과정에 있음을 명확히 보여줍니다. 이는 개발자들이 AI 에이전트 시스템을 도입할 때 예상 비용을 보다 정확하게 예측하고, 워크플로우를 최적화하는 데 중요한 지침이 될 수 있습니다. 또한, 향후 연구는 토큰 효율적인 에이전트 협업 프로토콜 개발에 집중해야 함을 시사하며, AI 소프트웨어 개발의 실용성과 경제성을 높이는 데 기여할 것으로 기대됩니다.
