AI 모델 경량화 및 최적화 전문기업 노타(NOTA)가 LG AI연구원의 초거대 인공지능(AI) 모델 '엑사원(EXAONE) 236B'를 국산 AI 반도체 환경에 성공적으로 최적화했습니다. 이번 성과는 모델 크기를 대폭 줄이면서도 원본에 가까운 성능을 유지했다는 점에서 주목받고 있으며, 국내 기술로 AI 인프라를 구축하는 '소버린 AI(Sovereign AI)'의 가능성을 보여주는 중요한 사례로 평가됩니다.
노타는 퓨리오사AI의 데이터센터용 신경망처리장치(NPU)에서 LG AI연구원의 엑사원 236B 모델 최적화를 완료했습니다. 엑사원 236B는 약 2,360억 개의 파라미터(매개변수)를 가진 대규모 언어모델(LLM)로, 이를 국산 NPU에 맞춰 최적화하는 과정에서 모델 크기를 71%나 줄이는 데 성공했습니다. 그럼에도 불구하고 원본 모델 대비 99.2%에 달하는 높은 성능을 유지하여 기술력을 입증했습니다. 이는 AI 모델을 효율적으로 운영하는 데 필수적인 경량화(quantization) 및 최적화 기술이 뒷받침되었기에 가능했습니다.
이번 최적화 성공은 국내 AI 반도체와 대규모 언어모델(LLM)을 결합하여 독자적인 AI 인프라를 구축할 수 있다는 점에서 큰 의미를 가집니다. 특정 국가나 기업에 의존하지 않고 자체적인 AI 역량을 확보하려는 '소버린 AI' 전략의 핵심적인 부분으로, 국내 기업들이 AI 기술 주권을 확보하고 글로벌 경쟁력을 강화하는 데 기여할 것입니다. 또한, 경량화된 모델은 AI 반도체의 효율성을 극대화하여 운영 비용 절감과 전력 효율 향상에도 긍정적인 영향을 미칠 것으로 기대됩니다.