중국 AI 스타트업 딥시크(DeepSeek)가 최근 새로운 대규모 언어모델(LLM)인 '딥시크-V2(DeepSeek-V2)'를 공개하며 인공지능(AI) 업계에 파격적인 가격 정책을 제시했습니다. 이 모델은 기존의 강력한 모델들과 유사하거나 더 뛰어난 성능을 보이면서도, 추론(inference) 비용을 100만 토큰(token)당 1달러(입력) 및 2달러(출력)로 책정해 오픈AI(OpenAI)의 GPT-4 터보(Turbo) 대비 최대 99% 저렴한 수준을 자랑합니다.
딥시크-V2는 Mixture-of-Experts(MoE) 아키텍처를 기반으로 하며, 총 2,360억 개의 파라미터(parameter) 중 210억 개만 활성화하여 효율성을 극대화했습니다. 이는 기존 모델들이 전체 파라미터를 사용하는 방식과 달리, 특정 작업에 필요한 부분만 활성화함으로써 연산량을 줄이고 비용을 절감하는 방식입니다. 딥시크는 이 모델을 통해 개발자들이 고성능 AI를 훨씬 낮은 비용으로 활용할 수 있도록 지원하며, AI 서비스의 대중화를 가속화하겠다는 전략을 내비쳤습니다.
딥시크의 이러한 움직임은 AI 개발 및 운영 비용에 대한 업계의 인식을 전환시키는 중요한 계기가 될 것으로 보입니다. 특히 스타트업과 중소기업들은 고가의 AI 모델 사용에 부담을 느껴왔는데, 딥시크의 저렴한 모델은 이들에게 새로운 기회를 제공할 수 있습니다. 이는 AI 시장의 진입 장벽을 낮추고, 더 많은 개발자들이 혁신적인 AI 애플리케이션을 만들 수 있도록 독려하며, 궁극적으로 AI 기술의 확산과 발전에 긍정적인 영향을 미칠 것으로 기대됩니다.