2021년, 인기 온라인 커뮤니티 레딧(Reddit)에서 일시적인 시스템 오류가 발생하여 평소 '자동 제거(Removed: Auto)'로만 표시되던 스팸 게시물 제거의 구체적인 사유와 내부 판단 데이터가 서드파티 앱 '릴레이 포 레딧(Relay for reddit)'을 통해 외부로 노출되는 사건이 있었습니다. 이 오류는 약 한 시간 동안 지속되었으며, 당시 스크린샷으로 기록된 정보들을 통해 레딧의 정교한 안티스팸 시스템의 내부 작동 방식이 상세히 드러났습니다.
노출된 데이터에는 '도메인(domain)', '스패밋(spammit)', '차단 사용자(banned user)', '섀도밴(shadowban)', 그리고 가장 많은 내부 정보를 담고 있던 '스패머라이(spamurai)' 등 다양한 제거 사유가 포함되었습니다. 특히 '스패머라이'는 계정 나이, 카르마(karma), 신고 수, 이메일 도메인, 사용자 에이전트(User-Agent), TLS 지문, 리퍼러(referrer) 등 상세한 사용자 및 접속 환경 데이터를 기반으로 스팸을 판단하는 것으로 밝혀졌습니다. 또한, 구글 퍼스펙티브(Google Perspective) API의 스팸 점수가 레딧의 제거 로그 값과 거의 일치하는 것으로 확인되어, 레딧이 외부 AI 도구를 적극 활용하고 있음이 드러났습니다. 흥미롭게도, 짧은 문자 추가나 키릴 문자 치환 등 미묘한 텍스트 변경만으로 퍼스펙티브 API의 스팸 점수가 크게 변동하는 사례도 포착되어, 스팸 필터 우회 가능성도 함께 제시되었습니다.
이번 노출은 레딧의 안티스팸 시스템이 파이썬 2.7 기반 검사, 루아(Lua) 규칙 기반의 REV1/REV2, 스누론(Snooron), 그리고 OCR 및 이미지 분류 도구가 혼합된 다세대 시스템임을 보여주었습니다. 중재자 승인(moderator approval)이 스팸 필터 학습에 반영되어 오탐(false positive)을 줄이는 데 기여한다는 점도 확인되었습니다. 2026년에는 퍼스펙티브 API의 스팸 속성 지원이 종료되고 대규모 언어모델(LLM) 기반 스팸 탐지로의 전환이 예상되는 만큼, 이번에 드러난 정보의 공개 위험은 낮아졌다고 레딧은 판단하고 있습니다. 이러한 변화는 앞으로 스팸 탐지 기술이 더욱 고도화되고 복잡해질 것임을 시사하며, 스팸 방어와 우회 기술 간의 끊임없는 경쟁이 계속될 것임을 보여줍니다.