지난 4월, 지구 관측 위성이 지상 분석가의 도움 없이 스스로 원하는 것을 찾아내는 역사적인 이정표를 세웠습니다. 이는 우주에서 비전-언어 모델(VLM)이 처음으로 활용된 사례로, 인공지능(AI)이 우주 기반 센서의 역량과 가치를 근본적으로 변화시킬 수 있음을 시사합니다. 기존에는 위성이 방대한 데이터를 지구로 전송하면, 지상 분석가들이 머신러닝 알고리즘이나 육안으로 이를 검토해야 했습니다.
이번 시연은 우주 인프라 기업 로프트 오비탈(Loft Orbital)이 제작한 얌-9(Yam-9) 위성에서 이루어졌습니다. NASA 제트추진연구소(JPL)가 개발한 소프트웨어 패키지가 구글 딥마인드(Google DeepMind)의 젬마 3(Gemma 3) VLM을 활용해 자연어 질의에 따라 관심 영역을 식별했습니다. 젬마 3는 엣지 컴퓨팅(edge computing)에 최적화되어 제한된 하드웨어에서도 구동 가능하며, 대규모 언어모델(LLM)의 문맥 이해 능력과 이미지 분석 능력을 결합하여 ‘자연 환경과 인간 개발이 만나는 지점’이나 ‘철도 허브 주변 인프라’ 등을 성공적으로 분류했습니다. 이 위성에는 우주 컴퓨팅에 사용되는 엔비디아 젯슨 오린 AGX(Nvidia Jetson Orrin AGX) GPU가 탑재되었습니다.
이번 기술 시연은 두 가지 중요한 의미를 가집니다. 단기적으로는 위성에서 초기 데이터 분류(data triage)를 수행하여 지상 분석가들이 처리해야 할 원시 데이터의 양을 크게 줄여 우주 센서의 유용성을 높일 수 있습니다. 장기적으로는 더 큰 규모의 AI 인프라를 우주에 구축할 수 있다는 가능성을 입증한 것입니다. 로프트 오비탈의 AI 책임자인 폴 라세르(Paul Lasserre)는 “이는 우주에서 상시 감시 및 순찰 계층을 가능하게 한다”며, “VLM을 통해 ‘이 국경을 감시하고 의심스러운 것이 있으면 알려달라’는 식의 논리를 위성과 주고받을 수 있다”고 설명했습니다. 이러한 발전은 미래에 우주 비행사들을 위한 디지털 비서 개발에도 영감을 주었습니다.