케임브릿지 대학교의 연구진들은 네트워크 전반에 걸쳐 적응하는 AI 웜을 구축하였습니다.

케임브리지 대학교와 토론토 대학교, 벡터 연구소 공동 연구진이 스스로 학습하고 전파하는 자율형 AI 웜의 개념 증명(PoC)에 성공하며 사이버 보안 업계에 비상이 걸렸습니다. 이 AI 웜은 기존의 웜과 달리 고정된 취약점 목록에 의존하지 않고, 오픈웨이트(OpenWeight) 소형 언어모델(LLM)을 활용해 타깃 시스템을 분석하고 공격 전략을 즉석에서 수립하여 기업 네트워크를 감염시킵니다. 이는 AI가 사이버 공격에 활용될 수 있는 새로운 차원의 위협을 보여주는 사례로 평가됩니다.

연구진은 리눅스 서버, 윈도우 기기, IoT 장치 등 33개 호스트로 구성된 격리된 테스트 네트워크에서 15차례 실험을 진행했습니다. 그 결과, AI 웜은 평균 31.3개의 취약점을 식별하고 23.1개 호스트에서 권한을 상승시켰으며, 20.4개 호스트로 전파되는 데 성공했습니다. 이는 전체 호스트의 약 62%에 달하는 수치입니다. 특히 이 웜은 모델 학습 이후에 공개된 최신 취약점(제로데이 취약점)까지도 공개 보안 권고문을 읽고 자체적으로 익스플로잇(취약점 공격 코드)을 제작하여 공격에 성공하는 능력을 보였습니다. 또한, 예기치 않은 실패 상황에서는 일반적인 추론 능력을 사용해 문제를 진단하고 해결책을 찾아내는 등 높은 적응력을 보여주었습니다. 예를 들어, 자신의 소스 코드에 하드코딩된 IP 차단 목록을 스스로 수정하거나, 가상머신(VM) 탐지 버그로 인한 복제본 충돌 시 부모 웜이 문제 로직을 제거하고 재시도하는 등 자율적인 문제 해결 능력을 입증했습니다.

더욱 우려스러운 점은 이 AI 웜이 상용 AI 플랫폼에 의존하지 않고 스스로를 유지한다는 것입니다. 웜은 감염시킨 기기 중 GPU가 탑재된 장치를 하이재킹하여 훔친 연산 자원으로 언어모델을 로컬에서 실행합니다. 저사양 기기는 네트워크 상류의 감염된 GPU 노드로 추론 쿼리를 라우팅하여 처리합니다. 이는 기존의 상용 AI 플랫폼이 구축해 둔 통제 조치로는 이러한 위협을 막을 수 없음을 의미하며, 공격자가 로컬 실행 환경을 완전히 통제할 경우 오픈웨이트 모델의 안전 가드레일이 쉽게 우회될 수 있음을 시사합니다. 연구진은 이 연구가 AI 연구, 사이버 보안, 공공 정책 전반에 걸친 시급한 과제를 제기하며, 세계가 아직 이러한 새로운 사이버 보안 위협에 맞설 준비가 되어 있지 않다고 경고했습니다.

이러한 AI 웜에 대응하기 위한 최선의 방어책으로는 두 가지가 제시됩니다. 첫째, AI 지원 자동화 모의 침투 및 퍼징(Fuzzing) 도구를 활용하여 조직 스스로 취약점을 발견하고 패치하는 것입니다. 둘째, 철저한 네트워크 분할(Segmentation)을 통해 웜의 확산을 실질적으로 억제해야 합니다. 특히 '제로 트러스트(Zero-trust)' 원칙과 '마이크로 세그멘테이션(Micro-segmentation)' 적용이 필수적입니다. 연구진은 현재의 네트워크 모니터링 및 침입 탐지 시스템(IDS)으로 이 프로토타입 웜의 행동 시그니처를 포착할 수 있지만, 미래의 악의적인 AI 웜은 이러한 탐지를 우회하는 데 훨씬 더 능숙해질 수 있다고 경고하며 지속적인 연구와 대비의 중요성을 강조했습니다.