화학 반응 네트워크를 정확하게 밝히는 것은 신약 개발, 신소재 연구 등 다양한 과학 분야에서 매우 중요합니다. 하지만 실제 화학 반응은 복잡하고 데이터는 부족하며 노이즈가 많아, 어떤 반응 경로가 실제로 일어나는지, 그리고 각 반응의 속도 상수는 얼마인지 알아내는 것이 매우 어려웠습니다. 특히 이산적인 반응 경로(topology)와 연속적인 반응 속도(kinetic parameters)가 서로 밀접하게 연결되어 있어 기존 모델로는 한계가 있었습니다.
최근 연구팀은 이러한 문제를 해결하기 위해 'PC-MCMC-CIGP'라는 새로운 회색 상자(gray-box) 워크플로우를 제안했습니다. 이 방법은 스파이크-앤-슬랩(spike-and-slab) 토폴로지 샘플링을 통해 가능한 반응 경로를 탐색하고, 물리적 보존 법칙과 열역학적 제약을 엄격하게 적용하여 비현실적인 경로를 걸러냅니다. 여기에 화학 정보 기반 가우시안 프로세스(CIGP) 잔차 모델을 결합하여 반응 속도 매개변수를 정밀하게 보정하고, 불확실성을 고려한 실험 설계를 통해 최적의 다음 실험 조건을 제안합니다. 이 통합된 접근 방식은 기존의 MCMC(Markov Chain Monte Carlo)나 GP(Gaussian Process) 모델 단독으로는 불가능했던 정확성과 효율성을 제공합니다.
실험 결과, PC-MCMC-CIGP는 H2 + Br2 벤치마크에서 기존 방법들이 잘못된 현상학적(phenomenological) 모델을 제시할 때도 실제적인 라디칼(radical) 경로를 정확히 구별해냈습니다. 또한 스티렌 에폭시화(styrene epoxidation) 반응에서는 CIGP 최적화 루프를 통해 최종 수율을 기존 GP-BO(Gaussian Process Bayesian Optimization) 기준 대비 12.5% 향상시키는 성과를 보였습니다. 이는 새로운 화학 반응을 발견하고 최적화하는 과정에서 시간과 비용을 크게 절감할 수 있음을 의미하며, AI가 복잡한 화학 연구에 실질적인 도움을 줄 수 있음을 입증한 것입니다.
