브라질 리우데자네이루 시가 최근 '자체 개발'했다고 대대적으로 홍보한 대규모 언어모델(LLM) 'Rio-3.5-Open-397B'가 실제로는 기존 오픈소스 모델들을 단순 병합한 것에 불과하다는 의혹이 제기되어 논란이 되고 있습니다. 시 정부 산하 IT 기업 IplanRIO는 이 모델이 Qwen3.5를 미세조정한 자체 개발 모델이며, 벤치마크에서 다른 공개 모델들을 능가한다고 주장했습니다. 하지만 깃허브(GitHub)에 공개된 모델의 가중치를 분석한 결과, 이는 'Nex-N2-Pro' 모델 약 60%와 'Qwen3.5-397B-A17B' 모델 약 40%를 직접 선형 결합한 것으로 나타났습니다.
이번 논란은 모델의 README 파일에 처음에는 'Nex-N2-Pro'와 'Qwen3.5-397B-A17B'의 병합으로 만들어졌다고 명시되었으나, 이후 '자체 개발'이라는 주장이 나오면서 불거졌습니다. 특히, 시스템 프롬프트를 제거하고 120개의 정체성 질문을 보낸 테스트에서 'Rio' 모델은 'I am Nex, from Nex-AGI'와 같은 'Nex' 모델의 응답을 70% 이상 재현하며 자체 학습의 증거를 전혀 보여주지 못했습니다. 가중치 분석 전문가들은 'Rio' 모델의 모든 가중치 텐서(tensor)가 'Nex'와 'Qwen'의 0.6/0.4 혼합과 수천 표준편차 수준으로 일치하며, 이는 다른 미세조정으로는 설명될 수 없다고 지적했습니다. 현재 허깅페이스(HuggingFace) 페이지에는 모델 병합이라고 명시되어 있지만, 이는 논란 이후 수정된 것으로 보입니다.
이 사건은 단순히 기술적인 문제뿐만 아니라 공공자금 사용의 투명성과 오픈소스 AI 생태계의 신뢰 문제로 확대되고 있습니다. 리우데자네이루 시 정부는 이 모델 훈련에 공공자금이 사용되지 않았다고 해명했지만, '자체 개발'이라는 허위 주장이 세금 낭비 또는 사기일 수 있다는 비판을 피하기 어렵습니다. 또한, 다른 공개 가중치 모델을 기반으로 한 모델을 '자체 개발'로 리브랜딩하는 행위는 오픈소스 AI 개발에 대한 신뢰를 해치며, 모델 공개 시 더 나은 출처 추적과 투명성 기준이 필요하다는 목소리가 커지고 있습니다. 이러한 모델 병합 기술 자체는 이미 잘 알려져 있고 개인도 시도할 수 있는 수준이지만, 정부 기관의 윤리적 책임은 더욱 강조되어야 할 것입니다.