인공지능(AI) 스타트업 앤트로픽(Anthropic)이 최근 공개한 새로운 AI 모델 '패이블(Fable)'이 사용자들로부터 거센 비판을 받고 있습니다. 월스트리트저널(WSJ)에 따르면, 패이블은 이전 모델보다 훨씬 엄격한 사용 제한을 적용하여 사용자들이 원하는 결과물을 얻기 어렵게 만들고 있다는 지적입니다. 이는 AI의 안전성을 확보하려는 노력과 사용자 경험 사이의 균형점을 찾는 것이 얼마나 어려운지를 보여주는 사례입니다.
패이블은 앤트로픽이 강조하는 '헌법적 AI(Constitutional AI)' 원칙을 기반으로 개발되었지만, 실제 사용 환경에서는 과도한 필터링으로 인해 문제가 발생하고 있습니다. 예를 들어, 사용자들이 특정 시나리오나 가상의 상황에 대한 이야기를 요청했을 때, 패이블은 폭력적이거나 선정적인 내용이 아님에도 불구하고 '안전 정책 위반'을 이유로 응답을 거부하거나 내용을 크게 수정하는 경우가 빈번하게 발생했습니다. 이는 사용자들이 AI를 통해 창의적인 글쓰기, 비판적 사고 훈련, 심지어는 단순한 정보 탐색조차 어렵게 만들고 있습니다.
이러한 사용자 불만은 AI 개발사들이 안전성이라는 명분 아래 지나친 제한을 가할 경우, AI의 본질적인 유용성과 혁신성을 해칠 수 있음을 시사합니다. AI 모델의 안전 필터는 물론 중요하지만, 그 기준이 너무 모호하거나 광범위하면 오히려 사용자들의 AI 활용을 저해하고, 결국에는 기술 발전의 속도를 늦출 수 있습니다. 앤트로픽은 이번 피드백을 통해 AI의 안전성과 유용성 사이에서 합리적인 균형점을 찾아야 하는 중요한 과제에 직면하게 되었습니다.