앤트로픽(Anthropic)이 자사의 최상위 AI 모델인 미토스(Mythos)의 첫 번째 공개 버전인 '클로드 페이블 5(Claude Fable 5)'를 일반에 공개했습니다. 이 모델은 소프트웨어 엔지니어링, 지식 작업, 비전(vision) 분야에서 탁월한 성능을 자랑하지만, 사이버 보안, 생물학, 화학 등 고위험 영역에서는 안전 장치(guardrails)를 통해 응답을 차단하고 이전 모델인 클로드 오푸스 4.8(Claude Opus 4.8)로 전환되도록 설계되었습니다.
페이블 5는 앤트로픽의 클로드 API와 기업용(Enterprise) 요금제를 통해 이용할 수 있으며, 구독 플랜에는 단계적으로 적용될 예정입니다. 특히, 이 모델은 높은 성능만큼이나 안전에 대한 앤트로픽의 엄격한 접근 방식을 보여줍니다. 앤트로픽은 모델 출시 전 1,000시간 이상의 버그 바운티(bug bounty)와 외부 레드팀(red-teaming) 테스트를 통해 탈옥(jailbreak) 시도를 면밀히 검증했으며, 모든 트래픽에 대해 30일간의 데이터 보존 정책을 의무화하여 새로운 공격에 대응하고 오탐(false positives)을 줄이는 데 활용할 것이라고 밝혔습니다. 이는 AI 업계에서 강력한 모델 접근에 대한 새로운 안전 표준을 제시할 수 있습니다.
페이블 5의 출시는 앤트로픽이 공개 시장 진입을 준비하는 중요한 시점에 이루어졌으며, AI 시스템의 급속한 발전과 재귀적 자기 개선(RSI) 가능성에 대한 앤트로픽의 경고와도 맥락을 같이 합니다. 강력한 AI 모델이 잘못 사용될 경우 발생할 수 있는 위험을 최소화하려는 노력이 반영된 것입니다. 분석 기업 헥스(Hex)의 테스트에서 복잡한 분석 작업 벤치마크에서 90%를 달성하며 뛰어난 판단력과 미묘한 차이에 대한 이해를 입증했고, 바이브 코딩 플랫폼 베이스44(Base44)는 페이블이 '원샷으로 전체 앱을 완성'하는 능력과 뛰어난 도구 호출(tool-calling) 능력을 가졌다고 평가했습니다. 다만, 페이블 5의 높은 가격(입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러)은 광범위한 사용에 제약이 될 수 있지만, 라쿠텐(Rakuten)과 같은 일부 기업은 '스스로 작업을 성찰하고 검증하는 능력'이 높은 자율 운영을 가능하게 하여 비용 이상의 가치를 제공한다고 보고 있습니다. 이는 고성능 AI 모델의 도입이 가져올 수 있는 생산성 혁신과 함께, 안전 및 비용 효율성이라는 두 가지 중요한 과제를 동시에 던지고 있습니다.