최근 브라이트 데이터(Bright Data)라는 회사가 자사 SDK(소프트웨어 개발 키트)를 통해 스마트폰과 스마트 TV를 주거용 프록시(residential proxy) 출구 노드로 활용하고 있다는 사실이 밝혀졌습니다. 이 SDK는 사용자 동의를 받아 기기의 유휴 리소스와 IP 주소를 활용해 고객의 웹 스크래핑 트래픽을 라우팅합니다. 이는 클라우드플레어(Cloudflare) 등 웹 보안 서비스가 데이터센터 IP의 대량 요청을 차단하는 상황에서, AI 기업들이 필요한 데이터를 우회적으로 수집하는 새로운 방법으로 부상하고 있습니다.
특히 스마트 TV는 이러한 프록시 네트워크에 이상적인 기기로 꼽힙니다. 휴대폰과 달리 항상 전원에 연결되어 있고 Wi-Fi에 상시 접속되어 있으며, 24시간 대기 상태로 작동하기 때문입니다. 또한, 사용자의 적극적인 주의를 덜 받는 경향이 있어 ‘방치 가능성’이 높습니다. 브라이트 데이터는 플레이웍스(PlayWorks), 클라우드TV(CloudTV), 롱비전 미디어(Longvision Media) 등 다수의 CTV(Connected TV) 관련 파트너사를 통해 수억 가구에 달하는 TV에 SDK를 배포한 것으로 확인되었습니다. 이들은 월 200GB에 달하는 대역폭을 사용할 수 있도록 설정되어 있으며, 사용자 동의 과정이 리모컨으로 법률 문서를 스크롤하기 어렵거나 실제 트래픽 라우팅 사실을 명확히 전달하지 못하는 등 불투명하다는 지적을 받고 있습니다.
이러한 주거용 프록시 활용은 AI 시대의 데이터 수집 방식에 대한 중요한 질문을 던집니다. AI 모델 학습을 위한 방대한 웹 데이터가 필요한 상황에서, 기업들은 웹 스크래핑 제한을 우회하기 위해 다양한 방법을 모색하고 있습니다. 하지만 개인의 기기를 활용하는 방식은 사용자 동의의 진정성, 개인정보 보호, 그리고 네트워크 자원 오용 가능성 등 윤리적, 법적 문제를 야기할 수 있습니다. 이미 FBI가 불법 주거용 프록시 네트워크에 대한 경고를 발령한 바 있으며, 합법적인 동의 기반 서비스라 할지라도 투명성과 책임감 있는 운영이 더욱 중요해질 것입니다.