미국 정부가 국가 안보를 명목으로 인공지능(AI) 스타트업 앤트로픽(Anthropic)의 최신 대규모 언어모델(LLM)인 Fable 5와 Mythos 5에 대한 접근을 전면 중단하라는 지시를 내렸습니다. 이 지시는 미국 내외를 막론하고 모든 외국인에게 적용되며, 심지어 앤트로픽의 외국인 직원도 포함됩니다. 앤트로픽은 이 지시를 오늘 오후 5시 21분(ET)에 받았으며, 즉시 모든 고객에 대한 Fable 5 및 Mythos 5 접근을 비활성화했다고 밝혔습니다.
앤트로픽은 정부의 지시에 따르면서도, 해당 조치에 대한 이의를 제기했습니다. 정부는 Fable 5의 '탈옥(jailbreak)' 방법이 발견되었다고 주장했지만, 앤트로픽은 시연된 탈옥 기술이 기존에 알려진 경미한 취약점 몇 가지를 식별하는 데 사용되었을 뿐이라고 설명했습니다. 또한, 이러한 취약점은 다른 공개된 모델에서도 쉽게 발견될 수 있으며, Fable 5의 안전장치(safeguards)는 수천 시간의 레드팀(red-team) 테스트를 거쳐 업계 최고 수준임을 강조했습니다. 앤트로픽은 완벽한 탈옥 방지는 현재 어떤 모델에서도 불가능하며, 자사는 심층 방어(defense in depth) 전략을 통해 위험을 관리하고 있다고 덧붙였습니다.
이번 사태는 첨단 AI 모델의 안전성, 규제 당국의 개입 범위, 그리고 기술 기업의 자율성 사이의 복잡한 균형 문제를 다시 한번 수면 위로 끌어올렸습니다. 앤트로픽은 단지 경미한 탈옥 가능성 때문에 상업적으로 배포된 모델의 접근을 중단시키는 것은 부당하며, 이러한 기준이 업계 전반에 적용된다면 모든 선도적인 모델 배포가 중단될 것이라고 비판했습니다. 투명하고 공정하며 기술적 사실에 기반한 정부의 규제 프로세스가 필요하다는 점을 강조하며, 앤트로픽은 이번 조치가 오해에서 비롯된 것이며 조속히 접근을 복구하기 위해 노력하겠다고 밝혔습니다.
