AI 에이전트 게이트웨이 엣지(Edgee)가 대규모 언어모델(LLM) 사용의 핵심 과제인 비용 효율성을 해결하기 위해 '터보 모델(Turbo Models)'을 새롭게 선보였습니다. 이 서비스는 LLM 제공자에게 전달되는 토큰을 압축하여 비용을 최대 50%까지 절감하는 것이 특징입니다. 개발자들은 기존 코드를 변경할 필요 없이 몇 분 만에 설정하여 바로 사용할 수 있어, LLM 운영 비용 절감과 효율성 향상에 크게 기여할 것으로 기대됩니다.
엣지 터보 모델은 클로드 코드(Claude Code)와 같은 주요 LLM 환경에서 GLM 5.1, 키미 K2.7 코드(Kimi K2.7 Code), 미니맥스 M2.7(MiniMax M2.7) 등 최신 오픈소스 모델들을 활용할 수 있도록 지원합니다. 월 29달러의 고정 요금으로 최대 4배 빠른 속도(초당 최대 200토큰)를 제공하며, 이는 특히 대량의 토큰을 처리해야 하는 AI 애플리케이션 개발자들에게 매력적인 요소입니다. 엣지는 이미 토큰 압축 기술로 비용 절감 효과를 입증해왔으며, 이번 터보 모델 출시는 이러한 역량을 더욱 확장한 것입니다.
이번 엣지의 새로운 서비스는 LLM 활용이 증가하면서 발생하는 높은 운영 비용 문제에 대한 실질적인 해결책을 제시합니다. 특히 스타트업이나 1인 개발자처럼 자원 제약이 있는 경우, LLM 사용 비용은 큰 부담이 될 수 있습니다. 엣지는 이러한 비용 장벽을 낮춤으로써 더 많은 개발자가 혁신적인 AI 애플리케이션을 구축하고 실험할 수 있는 기회를 제공합니다. 또한, 다양한 오픈소스 모델을 주요 LLM 환경에서 통합적으로 사용할 수 있게 함으로써 개발 유연성을 높이고, 특정 LLM 제공자에 대한 종속성을 줄이는 효과도 가져올 것으로 보입니다.
