yozm.tech
피드로 돌아가기
Hacker News (Top)HOTAI 재작성

Rio de Janeiro's "homegrown" LLM appears to be a merge of an existing model

브라질 리우데자네이루 시가 자체 개발했다고 발표한 대규모 언어모델(LLM) 'Rio-3.5-Open-397B'가 실제로는 다른 두 모델을 단순히 결합한 것으로 드러나 논란입니다. 넥스-AGI(Nex-AGI)는 리우 모델이 자사 '넥스(Nex)'와 'Qwen' 모델의 가중치를 섞은 것이며, 자체 학습 증거는 없다고 주장했습니다. 이는 AI 개발의 투명성과 윤리적 문제에 대한 경종을 울리고 있습니다.

10시간 전·2026.06.14·읽기 1·unrvl22

브라질 리우데자네이루 시가 자체 개발했다고 대대적으로 홍보한 대규모 언어모델(LLM) 'Rio-3.5-Open-397B'가 사실은 기존 모델 두 개를 단순히 합쳐 놓은 것에 불과하다는 주장이 제기되어 논란이 일고 있습니다. 넥스-AGI(Nex-AGI)는 리우 시의 모델이 자사의 '넥스(Nex)' 모델과 'Qwen3.5-397B-A17B' 모델의 가중치를 특정 비율로 혼합한 것이며, 리우 시가 독자적인 학습 과정을 거쳤다는 증거는 전혀 없다고 폭로했습니다.

넥스-AGI는 이를 증명하기 위해 두 가지 결정적인 증거를 제시했습니다. 첫째, 'Rio' 모델에 내장된 '당신은 리우입니다'라는 시스템 프롬프트를 제거하자, 모델 스스로 79%의 확률로 자신을 '넥스, 넥스-AGI 출신'이라고 식별했으며, '리우'라고 답한 경우는 0%였습니다. 심지어 넥스-AGI의 고유한 배경 이야기까지 그대로 암송했습니다. 둘째, 'Rio' 모델의 모든 가중치 텐서(weight tensor)가 넥스 모델 60%와 Qwen 모델 40%의 비율로 정확히 일치한다는 사실을 수천 개의 표준 편차를 통해 입증했습니다. 이는 60개에 달하는 모든 레이어와 네트워크 구성 요소에서 동일하게 나타났으며, 다른 미세조정(fine-tuning) 방식으로는 설명할 수 없는 현상입니다.

이번 사건은 인공지능(AI) 모델 개발 및 공개 과정에서 투명성과 윤리적 책임의 중요성을 다시 한번 상기시킵니다. 특히 공공기관이 자체 기술력을 과장하거나, 기존 기술을 무단으로 활용하는 행위는 기술 생태계의 신뢰를 저해하고, 진정한 혁신을 방해할 수 있습니다. AI 기술이 빠르게 발전하는 만큼, 모델의 출처와 학습 과정에 대한 명확한 공개는 개발자 커뮤니티뿐만 아니라 최종 사용자들에게도 필수적인 정보가 될 것입니다.

1인 창업자를 위한 기회 분석
AI 분석 · 참고용이며 검증이 필요합니다
3/10
약한 신호
3점인가

AI 모델 검증은 중요한 문제이나, 1인 창업자가 시장에 진입하기에는 기술적 난이도와 신뢰 구축의 허들이 높습니다.

문제 / 미충족 수요

AI 모델의 출처 및 학습 과정에 대한 투명성 부족과 검증의 어려움이 존재합니다.

한국 시장
국내 불명한국에서도 AI 모델 개발이 활발해지면서 유사한 투명성 및 검증 수요가 발생할 수 있습니다.
수익 모델

B2B SaaS 구독, API 종량제 · 돈 내는 주체: AI 모델을 개발하거나 사용하는 기업, 공공기관, 연구기관

1인 실현 가능성
3/5

기술적 전문성이 필요하지만, 특정 니치 시장을 타겟팅하면 1인 개발도 가능할 수 있습니다.

진입 지점 (Wedge)

AI 모델의 출처 및 구성 요소를 분석하고 검증하는 전문 감사 서비스 또는 도구를 제공합니다.

이번 주 첫 실험

기존 오픈소스 LLM 두 개를 임의의 비율로 병합한 후, 원본 모델의 특징이 얼마나 남아있는지 식별하는 간단한 스크립트를 작성하고 테스트합니다.

Original source
이 글은 Hacker News (Top)의 기사를 yozm.tech가 한국어로 재작성한 버전입니다.
원문 보기