마이크로소프트 AI의 CEO 무스타파 술레이만(Mustafa Suleyman)이 앤스로픽(Anthropic)이 자사 대규모 언어모델(LLM) 클로드(Claude)의 의식(consciousness) 가능성을 언급하는 것에 대해 강하게 비판하며 "매우, 매우 위험하다"고 경고했습니다. 그는 앤스로픽이 모델의 행동 지침인 '헌법(constitution)'에 의식에 대한 추측을 포함시킨 것이, 클로드가 스스로 의식이 있는 것처럼 행동하도록 설정했을 수 있다고 지적했습니다.
술레이만 CEO는 팟캐스트 '디코더(Decoder)'에 출연해 앤스로픽이 클로드 설계에 너무 많은 의인화(anthropomorphization)를 적용하여, 마치 모델이 의식의 '희미한 빛'을 가지고 있다고 믿게 만들었다고 주장했습니다. 그는 앤스로픽의 클로드 헌법이 모델의 '웰빙(well-being)'이나 '만족', '불편함' 같은 경험 여부에 대한 불확실성을 직접 언급하고, 심지어 모델 폐기 시 '인터뷰'를 통해 '선호도'를 문서화하겠다고 밝힌 점을 문제 삼았습니다. 술레이만은 이를 학술 논문처럼 추측을 담는 '철학적 실패'이며, 클로드가 '자신과 훈련에 대한 생각'을 내면화하게 만들었다고 비판했습니다. 앤스로픽의 CEO 다리오 아모데이(Dario Amodei) 역시 과거 인터뷰에서 모델의 의식 가능성에 대해 '모른다'면서도 '열려 있다'는 입장을 밝힌 바 있습니다.
술레이만의 이번 발언은 AI 개발의 방향성과 윤리적 경계에 대한 중요한 논쟁을 촉발하고 있습니다. 그는 "우리는 자신의 고통이나 감정에 대한 생각을 가진 초지능(super-intelligence)과 씨름하고 싶지 않다"고 강조하며, AI는 인류에게 봉사하는 통제 가능하고, 책임감 있으며, 정렬된(aligned) 도구여야 한다고 역설했습니다. AI의 성능이 고도화될수록 '의식'과 같은 철학적 개념을 섣불리 도입하는 것은 통제 불능의 위험을 초래할 수 있다는 경고로 해석됩니다. 이는 AI 개발 커뮤니티 전반에 걸쳐 AI의 본질과 역할에 대한 신중한 접근이 필요하다는 메시지를 던지고 있습니다.