최근 그레이스노트(Gracenote)의 새로운 보고서에 따르면, 대규모 언어모델(LLM)이 영화 및 TV 프로그램 관련 정보 생성 시 심각한 '환각(hallucination)' 문제를 겪고 있는 것으로 나타났습니다. 테스트된 영화 및 TV 제목 5개 중 거의 1개꼴로 LLM이 모든 세부 정보를 완전히 지어내는 현상이 발견되어, LLM의 정보 신뢰성에 대한 우려가 커지고 있습니다.
이번 연구는 LLM이 엔터테인먼트 콘텐츠에 대한 질문에 얼마나 정확하게 답변하는지 평가하기 위해 진행되었습니다. 그 결과, LLM은 약 20%의 사례에서 존재하지 않는 줄거리, 출연진, 제작진 등 모든 세부 사항을 완전히 허구로 만들어냈습니다. 이는 단순히 일부 정보가 틀린 수준을 넘어, 사실과 무관한 내용을 마치 진짜인 것처럼 제시하는 심각한 오류로, 특히 엔터테인먼트 산업에서 LLM을 활용하려는 시도에 큰 걸림돌이 될 수 있습니다. 그레이스노트는 닐슨(Nielsen) 산하의 콘텐츠 메타데이터 전문 기업으로, 방대한 엔터테인먼트 데이터를 보유하고 있습니다.
이러한 LLM의 환각 현상은 정보의 정확성이 생명인 뉴스, 교육, 고객 서비스 등 다양한 분야에서 LLM을 도입하려는 기업들에게 중요한 경고등이 됩니다. 특히 엔터테인먼트 분야에서는 잘못된 정보가 사용자 경험을 저해하고, 심지어 저작권 문제나 명예훼손 등 법적 문제로 이어질 가능성도 있습니다. 따라서 LLM 개발 및 활용 시에는 반드시 신뢰할 수 있는 최신 데이터로 모델을 학습시키고, 생성된 정보에 대한 철저한 검증 프로세스를 마련하는 것이 필수적입니다. 이는 LLM의 잠재력을 최대한 활용하면서도 그 한계를 명확히 인지하고 극복해야 할 과제임을 보여줍니다.