대규모 언어모델(LLM)이 다양한 분야에서 혁신을 가져오고 있지만, 개방형 질문에 대해 반복적으로 유사한 답변을 내놓는 '인공 집단지성 효과(artificial hivemind effect)' 또는 모드 붕괴(mode collapse)라는 한계를 가지고 있습니다. 이러한 현상은 LLM의 창의적 잠재력을 저해하는 주요 원인으로 지목되어 왔습니다. 최근 새뮤얼 샤피로(Samuel Schapiro) 연구팀은 이 문제를 해결하고 LLM의 발산적 사고(divergent thinking) 능력을 향상시키는 새로운 데이터 없는(data-free) 방법론인 '크리에이티비티뉴로(CreativityNeuro)'를 발표했습니다.
크리에이티비티뉴로(CreativityNeuro)는 대조적 가중치 조향(contrastive weight steering) 방식을 통해 LLM의 가중치(weight)를 직접 조절합니다. 이 방법은 추가적인 학습 데이터나 모델 재훈련, 경사 기반 미세조정(gradient-based fine-tuning) 없이도 작동한다는 점에서 효율적입니다. 연구팀은 이 기술을 다양한 창의성 평가 도구에 적용했는데, 어휘 공간 창의성 테스트인 발산 연상 과제(Divergent Association Task, DAT)에서 인간의 백분위 점수를 최대 14점 향상시키는 결과를 보였습니다. 또한, 720명의 대규모 인간 평가를 거친 대체 용도 테스트(Alternative Uses Test, AUT)와 과제 과제(Task Task)에서도 독창성(originality), 놀라움(surprise), 전반적인 창의성(creativity)이 크게 개선되었음을 입증했습니다. 특히, 모든 테스트에서 모드 붕괴(mode collapse) 현상이 현저히 줄어들었음이 확인되었습니다.
이 연구는 LLM이 단순히 정보를 요약하거나 생성하는 것을 넘어, 진정으로 창의적이고 독창적인 아이디어를 만들어낼 수 있는 가능성을 제시합니다. 기존의 활성화 조향(activation steering) 방식이 특정 작업에만 효과적이었던 것과 달리, 가중치 공간 조향(weight-space steering) 방식인 크리에이티비티뉴로(CreativityNeuro)는 더 길고 개방적인 작업에서도 일반화된 성능 향상을 보여주었습니다. 이는 LLM이 예술, 디자인, 콘텐츠 창작 등 창의성이 요구되는 분야에서 더욱 강력한 도구로 활용될 수 있음을 의미하며, 사용자들에게 더욱 다양하고 예측 불가능한 결과물을 제공하여 LLM 경험을 풍부하게 만들 것으로 기대됩니다.
