top of page


Reaction pathway prediction

Experimental dataset
Reproducing Reaction Mechanisms with Machine-Learning Models Trained on a Large-Scale Mechanistic Dataset
Angew. Chem. Int. Ed., 63 (43), e202411296 (2024)
Joonyoung F. Joung, Mun Hong Fong, Jihye Roh, Zhengkai Tu, John Bradshaw, Connor W. Coley*
이 연구에서는 유기 반응 메커니즘 예측을 위한 머신러닝 모델을 학습시키기 위해, 특허 데이터 기반의 반응 데이터를 바탕으로 전문가 설계 반응 템플릿을 활용해 반응 중간체와 일련의 elementary step을 보완한 대규모 메커니즘 데이터셋(총 580만 step, 130만 overall reactions)을 구축하였다. 이 데이터셋을 바탕으로 WLDN, Transformer, Graph2SMILES 세 가지 모델을 학습시켜, 전체 반응 결과가 아닌 메커니즘 단위의 예측을 수행하였고, 주요 생성물뿐 아니라 촉매, 시약, 부산물의 역할까지 재현 가능함을 보였다. 특히 Graph2SMILES는 top-1 accuracy와 sequence rank 기준에서 가장 우수한 성능을 나타냈으며, 반응 조건이나 시약의 유무에 따라 생기는 반응성 차이를 모델이 학습함을 확인하였다. 또한 SNAr, Suzuki, Grignard, Wittig 등 다양한 반응에 대해 중간체 및 부산물 예측이 가능하며, 이를 통해 예상치 못한 불순물 형성 경로도 추론할 수 있음을 보였다.
bottom of page