온라인 도서 아카이브인 안나의 아카이브(Anna's Archive)가 구글 북스(Google Books)에 있는 방대한 도서 스캔 데이터 또는 이와 유사한 규모의 희귀 도서 컬렉션을 확보하기 위해 20만 달러(약 2억 7천만 원)의 현상금을 내걸었습니다. 이는 디지털 시대에 지식의 접근성을 극대화하려는 움직임의 일환으로, 현재 구글 북스가 검색 결과에서 제한적인 스니펫(미리보기)만 제공하는 상황에 대한 대응입니다.
안나의 아카이브는 단순히 구글 북스 데이터에만 국한하지 않고, 인공지능(AI) 기업들이 수집한 희귀 도서 컬렉션 등 비슷한 규모의 대량 데이터를 확보하는 데도 현상금을 지급할 의향이 있다고 밝혔습니다. 특히, 이미지 없이 OCR(광학 문자 인식) 처리된 텍스트만 확보해도 현상금의 절반을 지급할 수 있으며, 구글 내부 접근 권한이 있는 사람도 대상에 포함됩니다. 이들은 확장 가능한 방법을 찾았다면 완성본이 아니더라도 프로토타입 단계에서 먼저 연락해달라고 요청하며, 데이터 전달 방식으로는 SFTP와 같은 대량 전송 방법을 제안했습니다. 현재 안나의 아카이브가 보유한 공개 도메인 및 저작자 공개 자료는 약 300TB 규모로 알려져 있습니다.
이러한 현상금 제시는 지식의 자유로운 공유와 접근이라는 아카이브의 철학을 보여주는 동시에, 저작권 보호와 디지털 콘텐츠 유통 모델에 대한 근본적인 질문을 던집니다. 많은 사용자들이 지식 접근의 어려움을 토로하며 안나의 아카이브나 Z-Library 같은 플랫폼의 필요성을 공감하고 있지만, 저작권자의 정당한 보상 문제와 불법 복제 논란은 여전히 해결되지 않은 과제입니다. 특히 AI 학습 데이터로 활용되는 방대한 디지털 텍스트의 출처와 저작권 문제는 뉴욕타임스(NYT)가 오픈AI(OpenAI)를 상대로 소송을 제기한 사례처럼 갈등의 주요 원인이 되고 있습니다. 이번 현상금은 디지털 시대에 지식의 가치와 접근성에 대한 논의를 더욱 심화시킬 것으로 보입니다.