

Reaction pathway prediction

Higher-level Strategies for Computer-Aided Retrosynthesis
ChemRxiv preprint
Jihye Roh, Joonyoung F. Joung, Kevin Yu, Zhengkai Tu, G. Logan Bartholomew, Omar A. Santiago-Reyes, Mun Hong Fong, Richmond Sarpong, Sarah E. Reisman, Connor W. Coley*
이 연구에서는 기존의 컴퓨터 기반 유기합성 설계 도구들이 각 반응 단계의 전자 이동이나 작용기 변환까지 포함한 전술적 수준(tactical level)의 정보를 모두 고려하면서 탐색 공간이 지나치게 커지는 한계를 극복하고자, 전체 반응경로를 더 상위 수준에서 전략적으로 분해하는 higher-level retrosynthesis 프레임워크를 제안하였다. 이 방법은 최종 생성물에 남지 않는 부분 구조(예: leaving group, protecting group)를 추상화하여, 실질적인 skeleton-building 전략에 집중하는 새로운 반응 표현과 탐색 알고리즘을 제시한다. 약 140만 개 반응에서 추출된 상위 수준의 반응 데이터셋을 구축하고, 이를 기반으로 single-step 모델과 Monte Carlo Tree Search 기반의 multistep 탐색을 수행한 결과, 기존 모델보다 더 짧은 경로와 높은 성공률로 합성경로를 제시할 수 있었으며, 복잡한 천연물 및 의약품(narlaprevir, pinolidoxin, pendolmycin)에 대해서도 문헌과 유사한 경로를 자동으로 제안할 수 있음을 입증하였다. 본 연구는 화학자가 먼저 전략을 구상하고 이후에 전술을 구체화하는 사고방식에 부합하는 새로운 CASP 접근법을 제시하며, 구조 추상화와 전략 중심의 검색이 복잡 분자의 합성 계획을 더욱 효율적이고 유연하게 만들어 줄 수 있음을 보여준다.