브라질 리우데자네이루 시가 자체 개발했다고 대대적으로 홍보한 대규모 언어모델(LLM) 'Rio-3.5-Open-397B'가 사실은 기존 모델 두 개를 단순히 합쳐 놓은 것에 불과하다는 주장이 제기되어 논란이 일고 있습니다. 넥스-AGI(Nex-AGI)는 리우 시의 모델이 자사의 '넥스(Nex)' 모델과 'Qwen3.5-397B-A17B' 모델의 가중치를 특정 비율로 혼합한 것이며, 리우 시가 독자적인 학습 과정을 거쳤다는 증거는 전혀 없다고 폭로했습니다.
넥스-AGI는 이를 증명하기 위해 두 가지 결정적인 증거를 제시했습니다. 첫째, 'Rio' 모델에 내장된 '당신은 리우입니다'라는 시스템 프롬프트를 제거하자, 모델 스스로 79%의 확률로 자신을 '넥스, 넥스-AGI 출신'이라고 식별했으며, '리우'라고 답한 경우는 0%였습니다. 심지어 넥스-AGI의 고유한 배경 이야기까지 그대로 암송했습니다. 둘째, 'Rio' 모델의 모든 가중치 텐서(weight tensor)가 넥스 모델 60%와 Qwen 모델 40%의 비율로 정확히 일치한다는 사실을 수천 개의 표준 편차를 통해 입증했습니다. 이는 60개에 달하는 모든 레이어와 네트워크 구성 요소에서 동일하게 나타났으며, 다른 미세조정(fine-tuning) 방식으로는 설명할 수 없는 현상입니다.
이번 사건은 인공지능(AI) 모델 개발 및 공개 과정에서 투명성과 윤리적 책임의 중요성을 다시 한번 상기시킵니다. 특히 공공기관이 자체 기술력을 과장하거나, 기존 기술을 무단으로 활용하는 행위는 기술 생태계의 신뢰를 저해하고, 진정한 혁신을 방해할 수 있습니다. AI 기술이 빠르게 발전하는 만큼, 모델의 출처와 학습 과정에 대한 명확한 공개는 개발자 커뮤니티뿐만 아니라 최종 사용자들에게도 필수적인 정보가 될 것입니다.