엔비디아(NVIDIA)가 장기 실행 AI 에이전트(long-running agents)의 성능을 혁신적으로 개선할 수 있는 새로운 오픈 모델 '네모트론 3 울트라(Nemotron 3 Ultra)'를 공개했습니다. 이 모델은 AI 에이전트의 추론(inference) 속도를 최대 5배 빠르게 만들고, 복잡한 에이전트 작업의 비용을 최대 30%까지 절감할 수 있다고 엔비디아는 밝혔습니다.
네모트론 3 울트라는 5,500억 개 매개변수(parameter)를 가진 MoE(Mixture-of-Experts) 구조의 최첨단 개방형 모델입니다. 특히 코딩이나 심층 연구와 같이 복잡한 작업에서 뛰어난 성능을 발휘하도록 설계되었습니다. 장기 실행 에이전트는 계획 수립, 도구 사용, 오류 복구, 다음 행동 결정 등 여러 단계에 걸쳐 작업을 수행하는데, 네모트론 3 울트라는 이러한 복잡한 과정 전반에서 효율성을 극대화합니다.
이번 출시는 AI 에이전트의 실용성과 접근성을 크게 높일 것으로 기대됩니다. 추론 속도 향상과 비용 절감은 개발자들이 더욱 정교하고 자율적인 AI 에이전트를 구축하는 데 중요한 기반이 됩니다. 이는 궁극적으로 AI가 실제 비즈니스 환경이나 개인 작업 흐름에 통합되는 속도를 가속화하며, 복잡한 문제를 해결하는 AI의 역량을 한 단계 끌어올리는 계기가 될 것입니다.