화학 반응 네트워크를 매핑하는 것은 촉매 작용부터 연소, 생명의 기원에 이르기까지 화학의 기본 언어입니다. 하지만 기존의 밀도범함수이론(DFT) 같은 전통적인 방법은 수만 개의 전이 상태(TS)를 찾아 특성화해야 하므로 엄청나게 느리고, 반응물과 생성물을 미리 알아야 하는 제약이 있었습니다. 이러한 비효율성을 해결하기 위해 머신러닝(ML) 기반의 새로운 접근 방식인 '리액션아틀라스(ReactionAtlas)'가 등장했습니다.
리액션아틀라스는 수작업 규칙 없이 소수의 초기 분자(seed molecule)만으로 반응 네트워크를 '원점부터(ab origine)' 구축합니다. 이 시스템은 머신러닝 기반의 생성 모델을 활용해 운동학적으로 샘플링된 후보 화합물에서 반응을 제안하고, DFT로 학습된 머신러닝 힘장(MLFF)이 이를 유효한 전이 상태(TS)로 필터링합니다. 이렇게 생성된 생성물은 새로운 초기 분자로 다시 탐색에 투입되는 방식입니다. 예를 들어, 8개의 초기 생명체 이전(pre-biotic) 분자(CH₂O, H₂O, OH⁻ 등)에서 시작하여 약 12,000개의 화합물 사이에서 약 47,000개의 반응을 발견했습니다. MLFF 전이 상태는 PBE0 참조값과 85%의 경우 0.5 Å RMSD 이내로 일치하며, 쉽게 PBE0 수준으로 끌어올릴 수 있어 높은 정확도를 자랑합니다.
이는 C₄H₈O₄까지의 소규모 탄수화물 화학을 전례 없는 규모와 정확도로 매핑할 수 있게 함으로써, 기존에 잘 연구된 포르모스(formose) 순환을 포함한 많은 반응 경로에 대한 새로운 통찰력을 제공합니다. 특히 생명의 화학적 기원에 중요한 포르모스 화학의 대체 반응 경로를 설정할 수 있게 해줍니다. 이 기술은 화학자들이 복잡한 반응 경로를 더 빠르고 효율적으로 이해하고 탐색할 수 있도록 돕는 강력한 도구가 될 것이며, 신약 개발, 신소재 발견, 에너지 저장 기술 등 다양한 분야에서 혁신을 가속화할 잠재력을 가지고 있습니다.