

Reaction pathway prediction

Quantum chemical modeling
Electron flow matching for generative reaction mechanism prediction obeying conservation laws
arXiv preprint
Joonyoung F. Joung†, Mun Hong Fong†, Nicholas Casetti, Jordan P. Liles, Ne S. Dassanayake, Connor W. Coley*
이 연구에서는 유기 반응 예측을 물질 보존과 전자 보존 법칙을 엄격히 만족하는 전자 재분포 문제로 재정의하고, 이를 기반으로 한 생성형 딥러닝 모델 FlowER (Flow matching for Electron Redistribution)을 제안하였다. FlowER는 반응 시스템을 bond-electron(BE) matrix로 표현하고, 전자의 흐름을 연속적인 벡터장으로 모델링하여 reactant에서 product까지의 전이 과정을 flow matching 기법으로 학습한다. 이를 통해 반응 중 원자나 전자가 생성·소멸되는 기존 sequence-to-sequence 모델의 한계를 극복하고, 반응 중간체, 부산물, 조건 의존적인 경로까지 포함하는 다중 메커니즘 경로를 생성할 수 있다. FlowER는 140만 개의 elementary step으로 구성된 전문가 기반 메커니즘 데이터셋으로 학습되었고, 주요 반응 유형에 대해 높은 예측 정확도를 보이며, 약간의 fine-tuning만으로도 학습되지 않은 반응 유형에 대해 높은 generalization 성능을 나타낸다. 특히 top-1 step accuracy 기준으로는 기존 모델 대비 높은 정확도를 보였고, 전체 경로 예측에서도 top-k 범위 내에서 더 넓은 메커니즘 탐색 능력을 확인하였다. 또한 BE matrix 기반 표현은 양자화학 계산과 연계되어 반응 경로의 열역학적 타당성을 평가할 수 있게 해준다. 본 연구는 물리적으로 해석 가능한 반응 메커니즘 생성과 예측을 가능하게 하는 데이터 기반 반응 예측의 새로운 패러다임을 제시한다.