AI 추론 비용 혁신: GPU 넘어 AI CPU 시대 오나

생성형 AI 경쟁이 모델 개발에서 운영 효율성으로 전환되면서, 이스라엘 스타트업 네오로직(NeoLogic)이 GPU의 대안으로 AI 서버 CPU 개발에 집중하고 있습니다. 이들은 비바테크 2026에서 차세대 AI CPU를 선보이며 저비용, 저전력 AI 추론(inference)을 통해 데이터센터의 미래를 바꾸겠다는 목표를 제시했습니다.

방금 전·2026.07.02·읽기 2분·유인춘 기자

생성형 인공지능(AI) 경쟁의 초점이 대규모 언어모델(LLM) 개발에서 이제는 이 모델들을 얼마나 효율적으로 운영할 수 있는지로 이동하고 있습니다. 특히 AI 추론(inference) 단계에서 발생하는 막대한 비용과 전력 소비는 AI 기술의 대중화를 가로막는 주요 장벽으로 인식되고 있습니다. 이러한 변화 속에서 이스라엘의 AI 반도체 스타트업 네오로직(NeoLogic)이 기존 GPU 중심의 데이터센터 구조를 보완할 새로운 해법을 제시하며 주목받고 있습니다.

네오로직은 최근 프랑스 파리에서 열린 비바테크 2026(VivaTech 2026)에 참가하여 차세대 AI 서버 중앙처리장치(CPU) 개발 현황을 공개했습니다. 이들은 GPU가 AI 학습(training)에는 강력하지만, 추론 단계에서는 비효율적인 측면이 있다고 지적하며, AI 추론에 특화된 CPU를 통해 비용과 전력을 획기적으로 절감할 수 있다고 강조했습니다. 네오로직은 글로벌 클라우드 서비스 기업들과 협력하여 자사의 AI CPU를 데이터센터에 통합하는 방안을 모색 중입니다.

이러한 움직임은 AI 서비스의 확산과 상업화에 매우 중요한 의미를 가집니다. AI 추론 비용이 낮아지면 더 많은 기업과 개발자가 AI 모델을 실제 서비스에 적용할 수 있게 되어 AI 기술의 접근성이 크게 향상될 것입니다. 이는 결국 AI의 대중화를 가속화하고, 새로운 AI 기반 서비스 모델의 등장을 촉진할 잠재력을 가지고 있습니다. 네오로직의 시도는 AI 인프라 시장에 새로운 경쟁 구도를 형성하며, 장기적으로는 AI 데이터센터 아키텍처의 표준을 바꿀 수도 있을 것으로 예상됩니다.