AI 칩 스타트업 세레브라스(Cerebras)가 자사의 웨이퍼 스케일 엔진(WSE) 칩을 활용해 대규모 언어모델(LLM) 학습에서 엔비디아(NVIDIA) GPU 대비 놀라운 원시 속도(raw speed)를 시연했습니다. 단일 칩으로 수십만 개의 코어를 통합하여 메모리 대역폭과 지연 시간 문제를 해결하며, 이론적으로는 엔비디아의 수천 개 GPU 클러스터보다 효율적인 성능을 낼 수 있습니다. 하지만 이러한 하드웨어의 압도적인 성능에도 불구하고, 세레브라스는 여전히 AI 칩 시장의 지배자인 엔비디아의 거대한 소프트웨어 생태계라는 함정에 빠져 시장 확장에 어려움을 겪고 있습니다.
세레브라스의 웨이퍼 스케일 엔진은 단일 칩에 2조 6천억 개의 트랜지스터와 85만 개의 AI 코어를 집적하여, 기존 GPU 클러스터에서 발생하는 통신 오버헤드 없이 대규모 모델을 효율적으로 학습시킬 수 있습니다. 이는 특히 LLM과 같이 방대한 데이터를 처리해야 하는 작업에서 큰 이점을 제공합니다. 실제로 세레브라스는 특정 LLM 벤치마크에서 엔비디아의 최신 GPU 클러스터보다 훨씬 빠른 학습 속도를 달성했다고 주장합니다. 그러나 문제는 이러한 하드웨어의 잠재력을 최대한 활용하기 위한 소프트웨어 스택, 즉 쿠다(CUDA)와 같은 개발 도구, 라이브러리, 프레임워크 지원이 엔비디아만큼 강력하지 않다는 점입니다.
엔비디아는 수십 년간 축적된 쿠다(CUDA) 플랫폼을 통해 개발자들이 GPU를 쉽게 활용할 수 있도록 광범위한 소프트웨어 생태계를 구축했습니다. 대부분의 AI 연구자와 개발자들은 엔비디아 GPU와 쿠다에 익숙하며, 새로운 하드웨어 플랫폼으로 전환하는 데 드는 비용과 노력이 매우 큽니다. 세레브라스의 하드웨어는 분명한 기술적 우위를 가지고 있지만, 소프트웨어 호환성 및 개발 편의성 부족은 잠재 고객들이 선뜻 세레브라스 플랫폼을 선택하기 어렵게 만듭니다. 결국, AI 시대의 하드웨어 경쟁은 단순히 칩의 성능을 넘어, 개발자들이 쉽게 접근하고 활용할 수 있는 소프트웨어 생태계를 누가 더 잘 구축하느냐에 달려 있음을 보여주는 중요한 사례입니다.