跳到主要內容區塊

臺大工學院簡訊

學術成果

陳隆奕、李奕霈:Enhancing chemical synthesis: a two-stage deep neural network for predicting feasible reaction conditions, Journal of Cheminformatics, 16 (1), 11 (Jan 2024)
  • 發布單位:工學院

  在化學合成中,選擇適當的反應條件對於提高產率至關重要。本研究提出了一種創新的深度學習模型,用於預測化學反應的最佳試劑、溶劑及反應溫度。我們的方法結合了多標籤分類模型(multilabel classification)與排序模型(ranking model),根據預測的產率評估反應條件的優劣,並推薦最合適的選項。此外,針對數據較少記錄的低產率反應,本研究引入困難負樣本抽樣(hard negative sampling),生成可能被錯誤分類的合成數據,以強化模型對決策邊界的學習,特別是在複雜或數據稀少的情境下。

 

  如圖一所示,我們首先利用候選生成模型預測可能的試劑與溶劑,隨後透過排序模型根據預測產率進一步篩選最佳反應條件。實驗結果顯示,在測試案例中,模型能夠在73% 的情境下於前 10 筆推薦中包含正確的試劑與溶劑組合,並且在89% 的測試反應中成功預測反應溫度,誤差範圍在 ±20°C 內。值得注意的是,該模型不僅能夠準確預測已知的反應條件,還能提供資料集中未記錄的潛在替代選項,展現其在化學合成研究中的應用潛力。

 

  本研究提出了一種高效的機器學習策略,能夠提升化學合成規劃的準確性與靈活性,為電腦輔助合成設計(CASP)及反應工程提供新的解決方案,並有望加速新材料與藥物的開發。(化工系李奕霈教授提供)

 

 

 

圖一、雙階段深度學習模型架構。本研究提出的反應條件推薦系統包含兩個步驟:(a) 候選生成模型,利用多標籤分類神經網路篩選可能的試劑與溶劑;(b) 排序模型,根據產率評分選擇最適合的反應條件,並進一步預測反應溫度。透過困難負樣本抽樣,模型能夠有效分辨不適合的反應條件,進一步提升預測準確度。