Z ai가 개발한 대규모 언어모델(LLM) GLM-5.2가 인공지능 분석(Artificial Analysis)의 인텔리전스 지수(Intelligence Index)에서 오픈 가중치(open weights) 모델 중 1위를 차지하며 AI 커뮤니티의 이목을 집중시키고 있습니다. 이 모델은 51점을 기록하며 미니맥스-M3(MiniMax-M3)와 딥시크 V4 프로(DeepSeek V4 Pro) 등 경쟁 모델들을 앞섰습니다. 이는 오픈소스 AI 모델의 성능이 상업용 모델에 근접하고 있음을 보여주는 중요한 지표입니다.
GLM-5.2는 GLM-5.1과 동일한 744B의 전체 매개변수(parameters)와 40B의 활성 매개변수를 유지하면서도, 인텔리전스 지수 v4.1에서 11점이나 높은 성능을 보였습니다. 특히 과학적 추론(scientific reasoning) 평가에서 CritPt 16점, HLE 12점 상승 등 두드러진 개선을 이루었으며, AA-LCR, tau3 뱅킹, SciCode 등 다양한 평가 항목에서도 점수가 올랐습니다. 또한, 실제 에이전트 성능을 측정하는 GDPval-AA v2에서는 1524점을 기록, 미니맥스-M3(1418점)와 딥시크 V4 프로(1328점)를 제치고 GPT-5.5(xhigh reasoning)와 거의 동등한 수준에 도달했습니다. 1M 토큰의 확장된 컨텍스트 윈도우(context window)와 MIT 라이선스(license)를 제공하며, 다양한 서드파티 제공업체를 통해 접근 가능합니다.
GLM-5.2의 등장은 오픈소스 AI 모델이 단순한 연구용 도구를 넘어 실제 상업적 활용 가능성을 높이고 있음을 시사합니다. 특히 인텔리전스 대 작업당 비용(Intelligence vs Cost per Task) 파레토 프론티어(Pareto Frontier)에 위치하며, 지능 수준 대비 가장 낮은 비용을 제공한다는 점은 개발자와 기업에게 매력적인 선택지가 될 수 있습니다. 비록 작업당 출력 토큰(output tokens) 사용량이 다소 높지만, 향상된 추론 능력과 에이전트 성능은 복잡한 문제 해결이 필요한 분야에서 큰 가치를 발휘할 것으로 기대됩니다. 이는 AI 기술 접근성을 높이고 혁신을 가속화하는 데 기여할 것입니다.
