오픈라우터(OpenRouter)가 여러 대규모 언어모델(LLM)의 강점을 결합해 단일 모델의 한계를 뛰어넘는 '퓨전 API'(Fusion API)를 선보였습니다. 이 API는 하나의 프롬프트를 여러 '전문가 모델'(panel model)이 병렬로 분석한 뒤, '심판 모델'(judge model)이 이들의 결과를 종합해 최종 답변을 생성하는 '멀티 모델 심의'(multi-model deliberation) 방식을 채택합니다. 이는 개별 모델의 성능을 단순히 합치는 것을 넘어, 서로 다른 관점과 강점을 가진 모델들이 협력하여 더 정교하고 신뢰성 높은 결과물을 만들어내는 데 초점을 맞춥니다.
퓨전 API의 작동 방식은 이렇습니다. 먼저 사용자의 프롬프트가 여러 전문가 모델에게 동시에 전달됩니다. 이 전문가 모델들은 웹 검색(web search)이나 웹 페치(web fetch) 기능을 활용해 정보를 수집하며 프롬프트를 분석합니다. 이후 심판 모델은 각 전문가 모델의 응답을 받아 합의점(consensus), 모순(contradictions), 부분적 일치(partial coverage), 고유한 통찰(unique insights), 사각지대(blind spots) 등으로 구조화하여 분석합니다. 이 구조화된 분석을 바탕으로 심판 모델이 최종 답변을 작성하게 됩니다. 오픈라우터는 최고 품질을 위한 'Quality 프리셋'과 비용 효율성을 위한 'Budget 프리셋'을 제공하며, 사용자가 직접 패널 모델과 심판 모델을 완전히 재정의(override)할 수도 있습니다. 비용은 단일 모델 호출이 아닌, 실행된 모든 개별 모델의 완성(completion) 비용을 합산하는 방식으로 책정됩니다.
이러한 멀티 모델 심의 방식은 특히 리서치, 전문가 비평, 또는 오답으로 인한 비용이 추가 완성 비용을 초과하는 상황에 적합합니다. 예를 들어, DRACO 벤치마크의 딥 리서치 과제 100개 측정에서 퓨전 API를 사용한 패널이 개별 모델 단독 성능을 일관되게 능가하는 결과를 보였습니다. 심지어 같은 모델을 자기 자신과 융합(예: Opus 4.8을 2번 사용)했을 때도 단독 사용 대비 성능이 크게 향상되어, 여러 모델의 결과를 종합하는 과정 자체의 효과가 입증되었습니다. 이는 단일 모델의 한계를 극복하고 더 높은 수준의 정확도와 신뢰성을 요구하는 복잡한 AI 애플리케이션 개발에 새로운 가능성을 제시하며, AI의 활용 범위를 넓히는 중요한 진전으로 평가됩니다.