최근 발표된 연구에 따르면, GRAPE(Guided Parameter-Space Evolution)라는 새로운 훈련 프레임워크가 인공신경망(neural network)의 적대적 강건성(adversarial robustness)을 획기적으로 향상시키는 것으로 나타났습니다. 이 기술은 AI 모델이 악의적인 입력(adversarial examples)에도 불구하고 정확한 예측을 유지하도록 돕는데, 기존 훈련 방식의 한계를 극복하며 더 효율적이고 강력한 모델을 구축할 가능성을 제시합니다.
대부분의 적대적 훈련(Adversarial Training, AT) 방법은 처음부터 고정된 매개변수 공간(parameter space)에서 모델을 훈련합니다. 하지만 GRAPE는 매개변수가 최적화되는 순서가 최종 결과에 영향을 미칠 수 있다는 질문에서 출발했습니다. 이 프레임워크는 '매개변수 공간 안정화'와 '점진적 숨겨진 확장'을 결합하여, 현재 노출된 공간에서 강건한 최적화를 안정화하고, 새로운 최적화 가능한 차원을 점진적으로 해제합니다. 특히, '적대적 스펙트럼 활용 점수(adversarial spectral utilization score)'를 활용해 새로 해제된 용량을 고압력 모듈(high-pressure modules)로 유도하는 것이 특징입니다. CIFAR-10 데이터셋의 표준 $\ell_\infty$ 위협 모델에서, GRAPE는 ResNet-18 기반의 PGD-20 강건성(robust accuracy)을 51.70%에서 56.94%로 개선했으며, 이는 약 1.009배의 유사한 계산 비용(FLOPs ratio)으로 매개변수(parameter count)를 약 21.4% 줄인 결과입니다.
이러한 결과는 AI 모델 학습을 점진적인 매개변수 공간 노출 및 진화 과정으로 접근하는 것이 고정된 구조의 적대적 훈련보다 우수할 수 있음을 시사합니다. GRAPE는 동일한 최종 아키텍처(ResNet-18)를 사용한 순차적 성장(sequential grow) 변형에서도 56.52%의 PGD-20 강건성을 달성하여, 성능 향상이 단순히 아키텍처 차이 때문이 아니라 매개변수 공간 노출 경로 때문임을 입증했습니다. 이는 AI 모델의 강건성을 높이면서도 모델 크기를 줄일 수 있어, 자원 제약이 있는 환경(예: 엣지 디바이스)에서의 AI 배포를 더욱 용이하게 할 것입니다. 궁극적으로 AI 시스템의 신뢰성과 보안을 강화하는 동시에 효율성을 증대시키는 중요한 발판이 될 것으로 기대됩니다.