The 100k whys of AI

최근 AI 생성 텍스트와 인간 작성 텍스트를 구별하기 어렵다는 주장이 많지만, 실제로는 AI 콘텐츠 특유의 패턴이 존재합니다. 아마존(Amazon)의 '100,000 Whys'와 같은 AI 생성 도서 사례를 통해, AI가 유사한 프롬프트에 반복적으로 동일한 결과물을 내놓는 경향을 분석하며 AI 콘텐츠를 식별하는 방법을 제시합니다. 이는 온라인 콘텐츠의 신뢰성 문제와도 직결됩니다.

20시간 전·2026.06.21·읽기 1분·surprisetalk

인공지능(AI)이 생성한 텍스트가 사람의 글과 구별하기 어렵다는 주장이 기술 업계에서 흔히 제기됩니다. 대규모 언어모델(LLM)이 인간의 언어 패턴을 통계적으로 학습하기 때문에, 그 결과물 역시 인간의 언어와 통계적으로 거의 구별할 수 없다는 논리입니다. 하지만 이러한 주장에도 불구하고, AI가 만든 콘텐츠에는 분명히 식별 가능한 고유한 특징이 있습니다.

실제로 아마존(Amazon)에서 '100,000 Whys'를 검색하면 수많은 아동 도서가 나타나는데, 이들 대부분은 AI가 생성한 '슬롭(slop)' 콘텐츠로 추정됩니다. 이 책들은 제목뿐 아니라 표지 디자인, 심지어 저자 이름(예: Ethan Bright, Nolan Bright 등 'Bright' 성을 가진 저자들)까지 놀랍도록 유사한 패턴을 보입니다. 이는 AI 도구가 유사한 프롬프트(예: "어린이를 위한 참고 도서 생성")에 대해 80%에 달하는 확률로 기능적으로 동일한 결과물을 만들어내기 때문입니다. 특정 표지에는 항상 왼쪽 상단에 포효하는 공룡이 있거나, 반복적으로 등장하는 빨간색과 흰색 로켓, 골든 리트리버, 사자 등의 이미지가 발견되는 것이 그 예시입니다.

이러한 현상은 LLM이 개별적인 문체적 특징이 아닌, 거의 모든 일반적인 프롬프트에 대해 동일하고 복잡한 일련의 문체적 특징을 반복적으로 사용하기 때문에 발생합니다. 즉, AI는 인간처럼 다양한 방식으로 표현하기보다, 학습된 패턴 내에서 가장 '안전하고' '평균적인' 결과물을 반복적으로 내놓는 경향이 있습니다. 이는 미묘한 신호일 수 있지만, 온라인에서 콘텐츠를 접할 때 우리의 직관이 점점 더 중요해지고 있음을 시사합니다. 콘텐츠를 생산하는 데 드는 노력이 소비하는 노력보다 훨씬 적어진 현 시대에, 이러한 직관은 온라인 상호작용의 전통적인 모델이 무너지는 것을 막는 중요한 역할을 합니다.