인도의 한 교수가 15년간의 연구 끝에 산스크리트어 시(슬로카)를 정확한 운율(미터)에 맞춰 낭송하는 인공지능 음성 합성(TTS) 모델 '바그헤누(Vagdhenu)'를 개발하고 오픈소스로 공개했습니다. 이는 세계 최초로 운율을 인지하는 산스크리트어 낭송 TTS로, 대규모 AI 연구소나 거대 자본 없이 개인의 헌신적인 노력으로 이루어졌다는 점에서 주목받고 있습니다.
바그헤누는 산스크리트어 시의 복잡한 운율 규칙인 '브루타(vrutta)'를 이해하고 적용하여, 마치 사람이 낭송하듯 자연스럽고 정확한 발음과 억양으로 음성을 생성합니다. 개발자는 모델 가중치, 학습 스크립트, 그리고 직접 수집한 방대한 학습 데이터까지 모두 공개하여 누구나 이 기술을 활용하고 발전시킬 수 있도록 했습니다. 이는 고대 언어의 디지털 보존과 접근성 향상에 크게 기여할 잠재력을 가지고 있습니다.
이 프로젝트는 인류의 가장 오래된 지식 전통 중 하나인 산스크리트어의 가치를 현대 기술로 보존하고 확산하려는 개인의 강한 신념에서 출발했습니다. 바그헤누의 등장은 산스크리트어 학습자, 연구자, 그리고 고대 문헌에 관심 있는 일반 대중에게 새로운 학습 및 접근 방식을 제공할 것입니다. 또한, 소규모 팀이나 개인 연구자도 열정과 전문성을 바탕으로 의미 있는 AI 기술을 개발할 수 있음을 보여주는 고무적인 사례로 평가됩니다.