AI 칩 스타트업 세레브라스(Cerebras)가 대규모 언어모델(LLM) 처리에서 엔비디아(Nvidia)보다 압도적으로 빠른 하드웨어 성능을 자랑하지만, 시장에서 고전을 면치 못하고 있습니다. 세레브라스의 웨이퍼 스케일 엔진(Wafer-Scale Engine, WSE)은 단일 칩으로 LLM을 훈련하고 추론하는 데 있어 엔비디아의 GPU 클러스터보다 훨씬 효율적이라는 평가를 받습니다. 그러나 이러한 하드웨어 우위에도 불구하고, 엔비디아가 구축한 강력한 소프트웨어 생태계가 세레브라스의 발목을 잡고 있습니다.
세레브라스는 최근 1조 1천억 개의 매개변수를 가진 LLM을 훈련하는 데 엔비디아의 4,096개 H100 GPU 클러스터보다 2배 빠른 속도를 기록했다고 발표했습니다. 이는 단일 칩으로 대규모 모델을 처리할 수 있는 세레브라스 WSE의 독보적인 아키텍처 덕분입니다. 반면 엔비디아는 CUDA(쿠다)라는 독점적인 병렬 컴퓨팅 플랫폼과 프로그래밍 모델을 통해 AI 개발자들에게 표준화된 개발 환경을 제공하며, 사실상의 업계 표준으로 자리 잡았습니다. 이로 인해 수많은 AI 연구자와 개발자들이 CUDA 기반으로 코드를 작성하고 라이브러리를 활용하고 있으며, 다른 하드웨어 플랫폼으로 전환하는 데 막대한 시간과 비용이 소요됩니다.
이러한 상황은 엔비디아가 단순한 하드웨어 공급업체를 넘어 AI 인프라의 핵심 소프트웨어 계층을 장악하고 있음을 보여줍니다. 세레브라스와 같은 혁신적인 하드웨어 기업들은 엔비디아의 강력한 소프트웨어 생태계라는 거대한 진입 장벽에 직면해 있습니다. 이는 AI 칩 시장에서 하드웨어 성능만큼이나 소프트웨어 호환성과 개발자 생태계 구축이 중요하다는 점을 시사하며, 새로운 칩 기업들이 시장에 안착하기 위해서는 기술 혁신을 넘어선 전략적 접근이 필요함을 보여줍니다.