yozm.tech
피드로 돌아가기
news.hada.ioHOTAI 재작성

리우데자네이루의 “자체 개발” LLM이 기존 모델의 병합으로 보임

브라질 리우데자네이루 시가 '자체 개발'했다고 발표한 대규모 언어모델(LLM) 'Rio-3.5-Open-397B'가 실제로는 기존 오픈소스 모델 두 개를 단순 병합한 것으로 드러나 논란입니다. 시는 자체 학습을 주장했으나, 가중치 분석 결과 'Nex-N2-Pro'와 'Qwen3.5-397B-A17B'의 선형 결합임이 밝혀졌습니다. 이는 공공자금 사용의 투명성 문제와 오픈소스 AI 생태계의 신뢰를 저해할 수 있다는 지적을 받고 있습니다.

4시간 전·2026.06.15·읽기 1·neo https://news.hada.io/user/neo

브라질 리우데자네이루 시가 최근 '자체 개발'했다고 대대적으로 홍보한 대규모 언어모델(LLM) 'Rio-3.5-Open-397B'가 실제로는 기존 오픈소스 모델들을 단순 병합한 것에 불과하다는 의혹이 제기되어 논란이 되고 있습니다. 시 정부 산하 IT 기업 IplanRIO는 이 모델이 Qwen3.5를 미세조정한 자체 개발 모델이며, 벤치마크에서 다른 공개 모델들을 능가한다고 주장했습니다. 하지만 깃허브(GitHub)에 공개된 모델의 가중치를 분석한 결과, 이는 'Nex-N2-Pro' 모델 약 60%와 'Qwen3.5-397B-A17B' 모델 약 40%를 직접 선형 결합한 것으로 나타났습니다.

이번 논란은 모델의 README 파일에 처음에는 'Nex-N2-Pro'와 'Qwen3.5-397B-A17B'의 병합으로 만들어졌다고 명시되었으나, 이후 '자체 개발'이라는 주장이 나오면서 불거졌습니다. 특히, 시스템 프롬프트를 제거하고 120개의 정체성 질문을 보낸 테스트에서 'Rio' 모델은 'I am Nex, from Nex-AGI'와 같은 'Nex' 모델의 응답을 70% 이상 재현하며 자체 학습의 증거를 전혀 보여주지 못했습니다. 가중치 분석 전문가들은 'Rio' 모델의 모든 가중치 텐서(tensor)가 'Nex'와 'Qwen'의 0.6/0.4 혼합과 수천 표준편차 수준으로 일치하며, 이는 다른 미세조정으로는 설명될 수 없다고 지적했습니다. 현재 허깅페이스(HuggingFace) 페이지에는 모델 병합이라고 명시되어 있지만, 이는 논란 이후 수정된 것으로 보입니다.

이 사건은 단순히 기술적인 문제뿐만 아니라 공공자금 사용의 투명성과 오픈소스 AI 생태계의 신뢰 문제로 확대되고 있습니다. 리우데자네이루 시 정부는 이 모델 훈련에 공공자금이 사용되지 않았다고 해명했지만, '자체 개발'이라는 허위 주장이 세금 낭비 또는 사기일 수 있다는 비판을 피하기 어렵습니다. 또한, 다른 공개 가중치 모델을 기반으로 한 모델을 '자체 개발'로 리브랜딩하는 행위는 오픈소스 AI 개발에 대한 신뢰를 해치며, 모델 공개 시 더 나은 출처 추적과 투명성 기준이 필요하다는 목소리가 커지고 있습니다. 이러한 모델 병합 기술 자체는 이미 잘 알려져 있고 개인도 시도할 수 있는 수준이지만, 정부 기관의 윤리적 책임은 더욱 강조되어야 할 것입니다.

1인 창업자를 위한 기회 분석
AI 분석 · 참고용이며 검증이 필요합니다
3/10
약한 신호
3점인가

명확한 문제(투명성, 신뢰성)가 있지만, 이를 해결하는 서비스의 시장 규모나 1인 창업자의 수익성이 아직 불확실합니다.

문제 / 미충족 수요

오픈소스 LLM을 활용하여 특정 목적에 맞는 모델을 만들 때, 기술적 투명성과 출처 표기, 그리고 실제 성능 검증에 대한 신뢰성 문제가 발생할 수 있습니다.

한국 시장
국내 있음한국에서도 오픈소스 LLM 활용이 늘어나면서 유사한 투명성 및 신뢰성 문제가 발생할 수 있습니다.
수익 모델

B2B SaaS 구독 · 돈 내는 주체: LLM을 개발하거나 활용하는 기업, 연구기관, 정부 기관

1인 실현 가능성
4/5

모델 가중치 분석 및 투명성 검증 도구는 1인 개발자가 충분히 시도해볼 수 있는 기술적 난이도입니다.

진입 지점 (Wedge)

오픈소스 LLM 기반 모델의 투명한 출처 추적 및 성능 검증 도구 개발

이번 주 첫 실험

기존 오픈소스 LLM 병합 및 미세조정 사례들을 수집하고, 각 모델의 가중치 분석을 통해 출처를 추적하는 PoC(개념 증명) 스크립트 작성

Original source
이 글은 news.hada.io의 기사를 yozm.tech가 한국어로 재작성한 버전입니다.
원문 보기