앤트로픽(Anthropic)의 AI 코딩 도우미 클로드 코드(Claude Code)가 제공하는 '확장 사고(Extended Thinking)' 기능이 실제 모델의 추론 과정이 아닌 요약된 내용을 보여주는 것으로 드러나 논란이 일고 있습니다. 개발자들은 이 기능이 모델의 내부 작동 방식을 투명하게 파악하고 디버깅하는 데 핵심적이라고 여겨왔으나, 실제로는 암호화된 서명(signature) 형태로 저장되며, 사용자는 그 요약본만 볼 수 있다는 사실이 밝혀졌습니다.
패트릭(Patrick)이라는 개발자는 클로드 코드의 세션 로그를 검토하던 중 '사고 블록(thinking blocks)'에 텍스트 대신 600자 길이의 서명만 있는 것을 발견했습니다. 앤트로픽 문서에 따르면, 클로드(Claude)는 추론 과정을 암호화하여 서명으로 저장하며, 암호 해독 키는 앤트로픽이 보유하고 있습니다. 즉, 사용자 기기에는 실제 추론 내용이 전달되지 않으며, API는 추론의 '요약'만 반환합니다. 전체 추론 내용을 확인하려면 기업 계약(enterprise agreement)이 필요하다는 점도 함께 명시되어 있습니다. 이는 마치 JPEG 파일을 BMP로 변환한 후 편집하고 다시 JPEG로 제시하는 것과 같아서, 변환 과정에서 데이터 손실이 발생한다는 지적입니다.
이러한 방식은 AI 에이전트의 로직을 감사하거나 디버깅해야 하는 사용자들에게 심각한 문제를 야기할 수 있습니다. 특히, 모델의 행동을 이끈 '진정한' 추론 과정을 기록하고 싶어도 로컬 파일로는 불가능하며, 앤트로픽의 문서 또한 이러한 사실을 간접적으로 표현하여 사용자들이 오해하기 쉽다는 비판이 나옵니다. 오픈소스 모델의 성능 개선이 더 빠르게 이루어져야 한다는 목소리가 커지는 가운데, AI 모델의 투명성과 책임성에 대한 논의가 더욱 활발해질 것으로 예상됩니다.