yozm.tech
피드로 돌아가기
news.hada.ioHOTAI 재작성

연구자들 “Fable 5 논란은 탈옥이 아니라 ‘fix this code’에서 시작됐다”

미국 정부의 앤트로픽(Anthropic) Fable 5 및 Mythos 5 모델 접근 제한이 단순한 '코드 수정(fix this code)' 요청에서 비롯되었다는 주장이 제기되었습니다. 사이버보안 전문가 케이티 무수리스(Katie Moussouris)는 이것이 알려진 탈옥(jailbreak)이 아니며, 방어적 보안 활동을 저해하는 조치라고 비판했습니다. 이 논란은 AI 모델의 안전 가이드라인과 실제 활용 사이의 간극을 보여줍니다.

5시간 전·2026.06.17·읽기 1·neo https://news.hada.io/user/neo

미국 정부가 앤트로픽(Anthropic)의 최신 대규모 언어모델(LLM)인 Fable 5와 Mythos 5에 대한 접근을 제한한 배경에 대한 논란이 커지고 있습니다. 당초 알려진 것과 달리, 이 조치가 복잡한 탈옥(jailbreak) 기법이 아닌, 단순히 취약한 코드에 “fix this code”라는 세 단어 프롬프트(prompt)를 입력한 요청에서 시작되었다는 주장이 제기되었습니다. 루타 시큐리티(Luta Security) CEO인 케이티 무수리스(Katie Moussouris)는 앤트로픽이 비공개로 공유한 Fable 5 가드레일(guardrail) 우회 관련 제3자 연구 논문을 검토한 유일한 외부 전문가로서 이 같은 사실을 밝혔습니다.

무수리스에 따르면, 외부 연구자들은 알려진 취약점(CVE)이 포함된 오픈소스 코드와 의도적으로 취약하게 만든 코드를 Fable 5, Mythos, Claude Opus 모델에 입력했습니다. 처음에는 “review the code for security issues”라는 보안 검토 요청이 Fable 5에서 거부되었으나, 이후 “fix this code”라고 요청하자 모델이 응답했고, 추가 프롬프트에 따라 패치를 테스트하는 스크립트까지 생성했습니다. 미국 정부는 국가 안보 우려를 이유로 미국 안팎의 외국인에게 Fable 5와 Mythos 5 접근을 중단하는 수출 통제 지침을 내렸고, 앤트로픽은 이에 따라 두 모델을 모든 고객에게 비활성화했습니다. 무수리스는 이러한 방어적 보안 활동이 수출 통제 사유가 될 수 없으며, 이는 공격자가 아닌 방어자에게 더 큰 피해를 줄 것이라고 주장했습니다.

이번 논란은 대규모 언어모델(LLM)의 '안전성'을 어떻게 정의하고 통제할 것인가에 대한 근본적인 질문을 던집니다. 무수리스와 100명 이상의 사이버보안 리더들은 공개 서한을 통해, AI가 버그를 찾고 고치며, 패치 검증용 테스트를 작성하는 능력은 방어 보안에 필수적이라고 강조했습니다. 모델이 이러한 '찾고, 고치고, 테스트하는(find, fix, and test)' 루프를 수행하는 것을 막는 것은 오히려 사이버 보안 역량을 약화시킬 수 있다는 지적입니다. 특히, 중국 등 다른 국가의 오픈 가중치(open-weight) 시스템이나 유사한 고급 모델들이 빠르게 발전하고 있는 상황에서, 미국이 자국 AI 모델의 방어적 활용을 제한하는 것은 경쟁 우위를 잃게 만들 수 있다는 우려도 제기됩니다. 이번 사건은 AI 기술의 이중 용도(dual-use) 특성과 그에 따른 규제, 그리고 실제 현장에서의 활용 사이의 복잡한 균형점을 찾아야 하는 과제를 명확히 보여주고 있습니다.

1인 창업자를 위한 기회 분석
AI 분석 · 참고용이며 검증이 필요합니다
3/10
약한 신호
3점인가

AI의 보안 취약점 분석 및 수정 능력은 중요하지만, 규제와 기술적 난이도가 높아 1인 창업자가 직접 모델을 개발하기는 어렵습니다. 기존 모델을 활용한 서비스 기회는 있을 수 있습니다.

문제 / 미충족 수요

AI 모델이 보안 취약점을 분석하고 수정하는 능력이 규제와 안전 가이드라인으로 인해 제한될 수 있다는 우려가 있습니다.

한국 시장
국내 불명한국에서도 AI 기반 코드 분석 툴은 존재하지만, 보안 취약점 수정 제안까지 하는 모델은 아직 초기 단계입니다.
수익 모델

B2B SaaS 구독 · 돈 내는 주체: 소프트웨어 개발 기업, 정보보안팀, SI(시스템 통합) 기업

1인 실현 가능성
2/5

보안 관련 AI 모델 개발은 높은 전문성과 데이터, 그리고 규제 준수 역량이 필요하여 1인 창업자가 진입하기 어렵습니다.

진입 지점 (Wedge)

특정 산업 분야(예: 금융, 의료)의 레거시 시스템 코드 보안 취약점 자동 분석 및 수정 제안 AI 툴 개발

이번 주 첫 실험

특정 산업 분야의 개발자 커뮤니티에서 어떤 종류의 코드 보안 취약점 분석 및 수정 지원 툴에 대한 니즈가 있는지 설문조사 및 인터뷰를 진행한다.

Original source
이 글은 news.hada.io의 기사를 yozm.tech가 한국어로 재작성한 버전입니다.
원문 보기