사람의 이동 경로 데이터는 교통 시스템 최적화, 도시 계획 수립, 전염병 확산 예측 등 다양한 분야에서 핵심적인 역할을 합니다. 하지만 이러한 대규모 이동 데이터를 수집하는 것은 높은 비용이 들고 개인 정보 보호 문제로 인해 제약이 많습니다. 이에 따라 실제와 유사한 합성 이동 경로를 생성하는 기술의 중요성이 커지고 있으며, 최근 'TrajGenAgent'라는 새로운 연구가 대규모 언어모델(LLM)을 활용해 이 문제를 해결하는 혁신적인 접근 방식을 제시했습니다.
TrajGenAgent는 '오케스트레이터-워커(orchestrator-worker)'라는 2단계 계층적 LLM 에이전트 프레임워크를 사용합니다. 먼저 LLM이 과거 데이터를 기반으로 개인별, 요일별 활동 체인(activity chain)을 생성합니다. 이는 문맥 내 학습(in-context learning)을 통해 이루어지며, 별도의 모델 미세조정(fine-tuning) 없이도 작동합니다. 이어서 결정론적 워크플로우가 각 활동을 구체적인 방문으로 변환하는데, 개인화된 관심 지점(POI) 검색, 거리 기반 위치 선택, 운동학적 이동 시간 예측, 그리고 LLM 기반의 지속 시간 추정 등 여러 단계를 거쳐 실제와 같은 이동 경로를 완성합니다. 기존 LLM 기반 생성기는 프롬프트 엔지니어링(prompt engineering)에 의존해 시공간 정확도가 떨어지거나, 미세조정으로 높은 비용과 일반 추론 능력 약화라는 단점이 있었지만, TrajGenAgent는 이러한 한계를 극복합니다.
이 기술은 단순히 시공간 통계를 넘어 행동 및 의미론적 타당성까지 평가하는 새로운 이상 감지(anomaly detection) 기반 평가 프레임워크를 도입하여, 생성된 경로의 현실성을 더욱 정교하게 검증합니다. 벤치마크 및 대규모 시뮬레이션 데이터셋 실험 결과, TrajGenAgent는 기존 신경망 및 LLM 기반 모델 대비 시공간 충실도, 의미론적 일관성, 그리고 개인별 행동 현실성 측면에서 우수한 성능을 보였습니다. 모델 파라미터 업데이트 없이 이러한 성과를 달성했다는 점은 주목할 만합니다. 이 기술은 실제 이동 데이터 수집의 어려움을 해소하고, 다양한 시뮬레이션 및 분석 환경에서 고품질의 합성 데이터를 제공함으로써 교통, 도시 계획, 물류, 비상 관리 등 여러 분야의 의사 결정 과정을 크게 개선할 잠재력을 가지고 있습니다.