데이터 기반 의사결정에서 인과 관계를 파악하는 것은 매우 중요합니다. 하지만 현실에서는 민감한 개인 정보 보호 규제나 통신 제약 때문에 여러 기관에 흩어진 데이터를 한곳에 모아 분석하기 어려운 경우가 많습니다. 이러한 문제를 해결하기 위해 연합 학습(Federated Learning, FL) 기술을 활용하여 원본 데이터를 공유하지 않고도 협력적으로 인과 관계를 분석하는 연합 인과 발견(FCD) 및 추론(FCI) 분야가 빠르게 성장하고 있습니다.
최근 arXiv에 발표된 "연합 인과 발견 및 추론에 대한 조사(A Survey on Federated Causal Discovery and Inference)" 논문은 이 분야의 포괄적인 개요를 제공합니다. 이 연구는 FCD 솔루션의 세 가지 핵심 설계 결정, 즉 구조 학습 방식, 데이터 분할 방식, 그리고 각 참여자가 얻는 구조적 지식에 기반하여 방법론적 패러다임, 연합 토폴로지, 구조적 범위의 세 가지 축으로 FCD를 분류합니다. 또한, 시간 역학, 데이터 이질성, 결측 데이터, 변수 집합 불일치 등 실제 적용 시 고려해야 할 주요 측면들도 심층적으로 다룹니다. FCI의 경우, 평균 치료 효과(ATE)와 개별/조건부 치료 효과(ITE/CATE) 같은 추정 대상과 고전적인 가중치 방법부터 최신 딥 생성 아키텍처에 이르는 추정 전략별로 분류하여 설명합니다.
이 논문은 기존 연구들이 FCD와 FCI를 별개의 영역으로 다루었던 것과 달리, 이 둘을 통합된 연합 인과 추론 파이프라인의 상호 보완적인 단계로 정립합니다. FCD가 FCI에서 유효한 효과 추정을 위한 구조적 지식을 제공하는 방식으로 연결되는 것입니다. 이러한 접근 방식은 개인 정보 보호, 통신 효율성, 이론적 보장, 그리고 다양한 응용 분야에서의 공통된 관심사를 강조하며, 미래 연구를 위한 미해결 과제들을 제시합니다. 이 연구는 분산된 환경에서 데이터의 잠재력을 최대한 활용하여 더 정확하고 신뢰할 수 있는 의사결정을 가능하게 하는 중요한 발판을 마련하고 있습니다.
