미국 상무부가 최근 인구조사국(Census Bureau)과 경제분석국(Bureau of Economic Analysis)이 발행하는 모든 통계 제품에서 '노이즈 주입(noise infusion)' 기법을 금지하는 명령을 내렸습니다. 이 조치는 특히 데이터 프라이버시 보호의 최신 기술로 각광받던 차등 프라이버시(differential privacy)의 사용을 사실상 막는 것으로 해석되며, 통계 데이터의 미래에 대한 큰 논란을 불러일으키고 있습니다.
차등 프라이버시는 원본 데이터의 민감한 정보를 보호하면서도 유용한 통계를 공개하기 위해 과학자들이 개발한 기술 중 하나입니다. 이는 주로 기여도 제한(contribution bounding)과 신중하게 조정된 노이즈 주입을 결합하여 개별 기록을 재구성하기 어렵게 만듭니다. 미국 인구조사국은 1990년부터 2010년까지 스와핑(swapping) 기법을 사용했지만, 이 방식이 개인 정보 재구성에 취약하다는 사실을 인지한 후 2020년 인구조사부터 차등 프라이버시를 도입했습니다. 당시 이 기술은 새로 발견된 프라이버시 제약 조건 하에서 가장 많은 유용성을 보존하면서도 공격을 완화하는 최적의 선택으로 평가받았습니다.
하지만 차등 프라이버시 도입 후 통계 데이터의 정확도가 낮아지고 노이즈가 투명하게 드러나면서, 인구학자 및 사회 과학자들 사이에서는 데이터의 유용성이 저하되었다는 불만이 제기되었습니다. 일부에서는 인구조사 데이터를 이용해 개인 기록을 재구성하거나 선거구 획정(gerrymandering)에 활용하는 관행이 있었는데, 차등 프라이버시로 인해 이러한 작업이 어려워진 것도 불만의 원인이었습니다. 이번 상무부의 명령은 노이즈 주입을 더 이상 허용 가능한 공개 회피(disclosure avoidance) 기술로 보지 않으며, 대신 데이터의 정밀도를 낮추는 조악화(coarsening)나 특정 기준 미달 데이터를 삭제하는 억제(suppression)를 우선하도록 지시하고 있습니다. 이는 통계 데이터의 유용성과 개인 정보 보호 사이의 균형을 맞추는 데 있어 심각한 후퇴를 의미하며, 향후 통계 데이터의 품질과 신뢰성에 큰 영향을 미칠 것으로 보입니다.