네이버랩스 유럽(NAVER LABS Europe)이 자율주행 로봇의 핵심 두뇌 역할을 하는 범용 인코더 '디바인(DIVINE)'을 공개했습니다. 디바인은 로봇이 주변 환경을 인식하고 다양한 작업을 수행하는 데 필요한 여러 인공지능(AI) 기능을 하나의 모델로 통합한 기술입니다. 이는 기존 로봇들이 위치 추정, 깊이 계산, 사람 인식 등 각 작업마다 별도의 AI 인코더를 사용하며 발생했던 비효율성을 크게 개선했습니다.
기존 자율주행 로봇은 카메라나 라이다(LiDAR) 같은 센서 데이터를 처리하기 위해 다수의 인코더를 사용했습니다. 이 인코더들은 같은 입력 데이터를 중복 처리하는 경우가 많아 메모리 사용량과 연산량이 과도하게 늘어나는 문제가 있었습니다. 네이버랩스 유럽은 '다중 교사 증류(multi-teacher distillation)' 방식을 활용해, 각 분야에 특화된 여러 '교사' 모델의 핵심 지식만을 추출하여 하나의 '학생' 모델인 디바인에 이식했습니다. 그 결과, 디바인은 2D 이미지 이해, 3D 공간 재구성, 사람 인식 등 다양한 시각 AI 기능을 단일 모델로 지원하며, 인코더 메모리 사용량을 약 90% 줄이고 인코딩 처리 속도를 최대 12배 빠르게 만들었습니다. 로봇 시스템 전체의 메모리 사용량은 약 62% 감소하고 처리 속도는 최대 4배 향상되는 효과를 가져왔습니다.
이러한 경량화와 효율성 증대는 로봇 산업에 중요한 의미를 가집니다. 기존에는 방대한 연산량 때문에 로봇 AI 모델이 주로 서버나 고성능 컴퓨팅 장비에서 구동되었지만, 디바인은 적은 메모리와 연산량으로 로봇에 직접 탑재하는 온보드(on-board) 환경에서의 활용도를 높입니다. 이는 로봇의 독립적인 판단 및 실행 능력을 강화하고, 클라우드 연결 없이도 실시간으로 복잡한 환경에 대응할 수 있게 합니다. 또한, 새로운 AI 기능을 추가하기 쉽게 설계되어 로봇 교체 없이 소프트웨어 업데이트만으로 성능을 지속적으로 향상시킬 수 있어, 피지컬 AI(Physical AI)의 상용화와 대중화를 앞당기는 데 크게 기여할 것으로 전망됩니다.
