최근 락칩(Rockchip)의 RK3588S 시스템 온 칩(SoC)을 탑재한 저가형 개발 보드에서 YOLOv8n 모델을 활용한 실시간 무인항공기(UAV) 탐지 및 온디바이스(on-device) 대규모 언어 모델(LLM) 기반 상황 요약 기능이 성공적으로 구현되어 주목받고 있습니다. 이 시스템은 90유로(약 13만 원) 수준의 2GB RAM 보드에서도 초당 46프레임(FPS)의 속도로 작동하며, 140MB 수준의 매우 낮은 메모리 사용량을 보여 엣지 AI(Edge AI) 분야에 새로운 가능성을 열었습니다.
이 프로젝트는 1080p MIPI 카메라 프레임을 캡처하고, YOLOv8n 추론을 RK3588S의 뉴럴 프로세싱 유닛(NPU) 3개 코어에서 병렬로 실행합니다. 이를 통해 기존 31 FPS에서 카메라 센서의 최대치인 46 FPS까지 처리량을 끌어올렸습니다. 특히, 이미지 신호 처리(ISP), 리사이즈/색상 변환(RGA), 추론(NPU) 등 모든 주요 연산이 전용 하드웨어 가속기에서 이루어져 중앙처리장치(CPU)의 개입을 최소화하고, 메모리 사용량을 140MB로 고정시켰습니다. 또한, 탐지된 UAV가 화면을 벗어나면 동일 NPU에서 구동되는 경량 LLM(Qwen2.5-0.5B)이 자연어로 상황을 요약해주는 기능까지 통합되어 있습니다. 이 모든 과정은 독립적인 프로세스들이 유닉스 도메인 소켓(Unix-domain sockets)으로 연결된 파이프라인 형태로 구성되어 유연성을 높였습니다.
이번 성과는 고성능 엣지 AI 솔루션이 반드시 고가의 하드웨어를 필요로 하지 않음을 입증합니다. 저렴한 RK3588S 보드에서도 실시간 객체 탐지 및 복잡한 상황 분석(LLM 요약)이 가능하다는 것은, 드론 감시, 스마트 시티, 산업 안전 등 다양한 분야에서 비용 효율적인 AI 시스템 구축을 가속화할 수 있음을 의미합니다. 특히, CPU 부하 없이 전용 하드웨어 가속기를 최대한 활용하는 설계 방식은 전력 효율이 중요한 엣지 환경에 최적화된 접근 방식으로, 향후 더 많은 임베디드 AI 애플리케이션 개발에 영감을 줄 것으로 기대됩니다.