AMD가 대규모 언어모델(LLM) 서비스 시장에서 엔비디아(NVIDIA)와의 격차를 줄이기 위한 중요한 발걸음을 내디뎠습니다. 새로운 소프트웨어 스택인 'ATOMesh'를 발표하며, 자사의 인스팅트(Instinct) 가속기에서 LLM 추론(inference)의 확장성과 효율성을 대폭 향상시켰다고 밝혔습니다. 이는 AI 모델을 실제 서비스에 적용할 때 발생하는 비용과 복잡성을 줄이는 데 초점을 맞추고 있습니다.
ATOMesh는 특히 여러 GPU에 걸쳐 LLM을 효율적으로 분산 처리하는 데 중점을 둡니다. 대규모 LLM은 단일 GPU의 메모리에 모두 올리기 어렵기 때문에, 모델 병렬화(model parallelism)와 파이프라인 병렬화(pipeline parallelism) 같은 기술이 필수적입니다. ATOMesh는 이러한 복잡한 병렬화 작업을 최적화하여, AMD 인스팅트 MI300X와 같은 가속기 클러스터에서 LLM 추론 성능을 극대화합니다. 이를 통해 기업들은 더 적은 하드웨어로 더 많은 사용자에게 LLM 서비스를 제공할 수 있게 됩니다.
이번 ATOMesh 출시는 AI 가속기 시장에서 AMD의 입지를 강화하는 중요한 전환점이 될 수 있습니다. 현재 LLM 개발 및 배포는 엔비디아 GPU에 크게 의존하고 있으며, 이는 공급 부족과 높은 비용으로 이어지고 있습니다. AMD가 ATOMesh를 통해 자사 하드웨어의 LLM 서비스 효율성을 입증한다면, 기업들은 엔비디아 외에 또 다른 강력한 대안을 얻게 될 것입니다. 이는 장기적으로 AI 인프라 비용을 낮추고, LLM 기술의 대중화를 가속화하는 데 기여할 것으로 기대됩니다.