일본의 AI 스타트업 사카나 AI(Sakana AI)가 여러 대규모 언어모델(LLM)을 유기적으로 결합하여 단일 모델의 성능을 뛰어넘는 '후구(Fugu)' 아키텍처를 선보였습니다. 이 혁신적인 접근 방식은 앙트로픽(Anthropic)의 '페이블(Fable)'과 '미토스(Mythos)' 벤치마크에서 인상적인 결과를 달성하며, 기존의 거대 단일 모델 중심 개발 방식에 새로운 대안을 제시했습니다.
사카나 AI의 후구는 마치 오케스트라 지휘자처럼 여러 개의 전문화된 소형 LLM들을 조율하여 복잡한 작업을 수행합니다. 예를 들어, 특정 질문에 대해 한 모델은 사실을 검색하고 다른 모델은 문맥을 이해하며, 또 다른 모델은 최종 답변을 생성하는 식으로 협력하는 방식입니다. 이러한 모듈화된 접근 방식은 각 모델의 강점을 활용하고 약점을 보완하며, 전체 시스템의 효율성과 유연성을 크게 향상시킬 수 있습니다. 특히, 앙트로픽의 벤치마크는 복잡한 추론과 다단계 문제 해결 능력을 평가하는데, 후구가 이 부분에서 뛰어난 성과를 보였다는 점은 주목할 만합니다.
이러한 모델 조합 방식은 AI 개발에 있어 중요한 의미를 가집니다. 기존에는 더 크고 강력한 단일 모델을 만드는 데 막대한 자원과 시간이 소요되었지만, 후구와 같은 접근 방식은 이미 존재하는 다양한 소형 모델들을 효율적으로 재구성하여 고성능 AI를 구축할 수 있는 길을 열어줍니다. 이는 스타트업이나 연구 기관 등 자원 제약이 있는 곳에서도 혁신적인 AI 시스템을 개발할 수 있는 기회를 제공하며, AI 기술의 민주화에도 기여할 수 있습니다. 또한, 특정 작업에 최적화된 모델들을 조합함으로써, 범용 LLM이 가지는 비효율성을 줄이고 더욱 정교하고 비용 효율적인 AI 솔루션 개발을 가능하게 할 것으로 기대됩니다.