최근 AI 코딩 에이전트 사용이 증가하면서 개발 비용 부담이 커지고 있습니다. 특히 앤트로픽(Anthropic)의 클로드 오푸스(Claude Opus)와 같은 고성능 모델은 뛰어난 코딩 능력을 제공하지만, 토크나이저(tokenizer) 변경 등으로 인해 비용이 급증하는 문제가 발생하고 있습니다. 이러한 문제에 대응하기 위해 위브(Weave) 팀은 요청의 성격에 따라 가장 적합한 대규모 언어모델(LLM)을 자동으로 선택해주는 '모델 라우터(Model Router)'를 개발하여 공개했습니다.
위브의 모델 라우터는 클로드 코드(Claude Code), 코덱스(Codex), 커서(Cursor) 등 주요 AI 코딩 에이전트에 플러그인 형태로 연동됩니다. 이 라우터는 들어오는 모든 요청을 분석하여, 온디바이스 임베더(on-device embedder)를 활용해 가장 적절한 모델을 실시간으로 결정합니다. 예를 들어, 복잡한 코딩 작업에는 오푸스(Opus)와 같은 고성능 모델을 사용하고, 간단한 작업에는 비용 효율적인 모델을 할당하는 식입니다. 앤트로픽 메시지(Anthropic Messages), 오픈AI 챗 컴플리션(OpenAI Chat Completions), 제미니(Gemini) 네이티브 API를 모두 지원하며, 딥시크(DeepSeek), 키미(Kimi), 라마(Llama) 등 오픈소스 모델도 오픈라우터(OpenRouter)를 통해 연동할 수 있습니다. 사용자는 API 키를 로컬에 암호화하여 보관할 수 있어 보안성도 높습니다.
이 모델 라우터는 AI 개발 비용 최적화에 중요한 역할을 할 것으로 기대됩니다. 개발자들은 더 이상 모든 작업에 비싼 고성능 모델을 고정적으로 사용할 필요 없이, 작업의 복잡도에 따라 유연하게 모델을 선택함으로써 전체 AI 개발 비용을 효과적으로 관리할 수 있게 됩니다. 이는 특히 스타트업이나 개인 개발자에게 큰 이점으로 작용하여, AI 기반 개발의 진입 장벽을 낮추고 혁신을 가속화하는 데 기여할 수 있습니다. 또한, 다양한 모델 API를 단일 엔드포인트(endpoint)로 통합하여 개발 편의성을 높이는 효과도 있습니다.