최근 인공지능(AI) 분야에서 AI 에이전트가 스스로 심층 연구를 수행하고 진화하는 능력이 인공 일반 지능(AGI)을 향한 핵심 과제로 떠오르고 있습니다. 기존 AI 시스템은 정적인 매개변수 기반의 연구 능력에 갇혀 개방형 환경에서 정보를 자율적으로 탐색하고 통합하는 데 한계가 있었습니다. 또한, 에이전트 진화 방식은 주로 명확한 정답이 있는 검증 가능한 작업에서만 유효성이 입증되어, 복잡하고 정답이 없는 개방형 연구 과제에는 적용하기 어려웠습니다.
이러한 간극을 메우기 위해 홍밍 피아오(Hongming Piao) 외 6명의 연구진은 '하이브리드 개방형 3단계 진화(Hybrid Open-Ended Tri-Evolution, HOTE)' 프레임워크를 제안했습니다. HOTE는 하이브리드 모드 강화 학습(hybrid-mode reinforcement learning)을 활용하여 '제안자(proposer)', '해결사(solver)', '평가자(judge)'라는 세 가지 AI 모듈이 웹 규모 지식(web-scale knowledge)을 기반으로 협력적으로 진화하도록 설계되었습니다. 제안자는 연구 과제를 제시하고, 해결사는 이를 풀며, 평가자는 해결사의 결과를 검증하는 방식으로 끊임없이 상호작용하며 학습합니다. 연구진은 8B(80억) 매개변수 모델을 HOTE 방식으로 훈련시킨 결과, 기존의 가장 강력한 8B~32B 규모의 정적 오픈 모델들과 최신 심층 연구 훈련 방법론들을 시간 효율성 측면에서 능가하는 성능을 보였다고 밝혔습니다. 특히, 이 세 가지 모듈의 진화가 모두 필수적임을 실험을 통해 입증했습니다.
HOTE 프레임워크는 AI 에이전트가 단순히 주어진 정보를 처리하는 것을 넘어, 스스로 질문을 던지고, 답을 찾고, 그 답을 평가하는 자율적인 연구 능력을 갖추게 한다는 점에서 큰 의미를 가집니다. 이는 AI가 인간의 개입 없이도 복잡한 문제를 해결하고 새로운 지식을 탐색할 수 있는 잠재력을 보여주며, 궁극적으로 AGI 구현에 한 걸음 더 다가서는 중요한 진전입니다. 앞으로 HOTE와 같은 자율 진화형 AI 시스템은 과학 연구, 기술 개발 등 다양한 분야에서 혁신적인 변화를 가져올 것으로 기대됩니다.