一般而言,一種藥物研發(fā)周期在 10 年以上,研發(fā)投入在數(shù)十億美金,并且呈現(xiàn)逐年上升的趨勢。近年來,深度學習 (deep learning, dl) 技術(shù)在語音識別、圖像識別等領(lǐng)域取得重大突破,迅速成為學術(shù)界和工業(yè)界的研究熱點。
深度學習是人工智能的一個分支,它是一種利用神經(jīng)網(wǎng)絡(luò)進行學習的技術(shù)。深度學習技術(shù)在生物醫(yī)學領(lǐng)域已經(jīng)取得重要進展,目前研究人員已經(jīng)開發(fā)了一系列基于深度學習的疾病診斷、蛋白質(zhì)設(shè)計、醫(yī)學圖像識別的應用策略。制藥工業(yè)界目前也開始重視深度學習技術(shù),希望利用其加速藥物研發(fā)并降低成本。
![AI 深度學習+藥物研發(fā),讓新藥不再遙不可及 | MedChemExpress]()
此前的研究表明,深度學習技術(shù)在優(yōu)化化學合成路線、預測藥物的藥代動力學性質(zhì)、預測藥物的作用靶點以及生成新型分子等方面具有優(yōu)勢。
![AI 深度學習+藥物研發(fā),讓新藥不再遙不可及 | MedChemExpress-1]()
圖 1. 虛擬篩選在藥物開發(fā)流程中的地位[1]。
▐ 虛擬篩選:化合物-靶蛋白的親和力
深度學習可以通過訓練大量的已知化合物-靶蛋白相互作用數(shù)據(jù)來學習化合物和靶蛋白之間的內(nèi)在關(guān)系。這種訓練過程使得深度學習模型能夠自動提取和利用化合物和靶蛋白的特征,以及它們之間的相互作用模式。
yelena guttman 等人基于 deepchem 框架,構(gòu)建了一個 cyp3a4 抑制劑預測模型。先基于 lipinski 五原則對庫中化合物進行排除,再基于此模型對 foodb 庫中 68,900 個化合物進行 cyp3a4 抑制活性預測,順利得到了兩種新的 cyp3a4 抑制劑。
![AI 深度學習+藥物研發(fā),讓新藥不再遙不可及 | MedChemExpress-2]()
圖 2. 基于 deepchem 的 cyp3a4 抑制劑預測[2]。
在 knime 分析平臺 4.0.314 中創(chuàng)建了一個工作流來準備和分析虛擬篩選。
▐ 預測化合物的 admet 性質(zhì)
自 lipinski 類藥五原則提出以來,對先導化合物的 admet (吸收、分布、代謝、排泄和毒性) 性質(zhì)進行早期預測也變得越來越重要。許多研究表明,通過對大量已知化合物的 admet 數(shù)據(jù)進行訓練和學習,自動識別和提取化合物特征與性質(zhì)之間的關(guān)系,訓練好的深度學習模型可以用來預測新化合物的性質(zhì),從而加速藥物發(fā)現(xiàn)和開發(fā)的進程。
liu 等人利用定向消息傳遞網(wǎng)絡(luò) (directed message passing neural networks, d-mpnn,又稱 chemprop) 對 foodb 庫中化合物進行了 nrf2 激動活性預測及毒性分析,順利得到了nicotiflorin這一兼具 nrf2 激動活性和安全性的藥物,并且在體內(nèi)外實驗中得到了驗證[3]。
![AI 深度學習+藥物研發(fā),讓新藥不再遙不可及 | MedChemExpress-3]()
![AI 深度學習+藥物研發(fā),讓新藥不再遙不可及 | MedChemExpress-4]()
圖 3. 利用深度學習算法評估藥物安全性[3]。
▐ 優(yōu)化化學合成路線
近年來,人們已經(jīng)看到人工智能 (ai) 開始為化學合成帶來革命性的變化。然而,由于缺乏合適的化學反應表示方式和反應數(shù)據(jù)的稀缺性,限制了人工智能在反應預測中的廣泛應用。深度學習可以通過對大量的化學合成數(shù)據(jù)進行訓練和學習,自動識別和提取合成路線的特征和模式,用來預測新的合成路線的效率和選擇性,從而加速新藥的開發(fā)和生產(chǎn)。
![AI 深度學習+藥物研發(fā),讓新藥不再遙不可及 | MedChemExpress-5]()
圖 4. 深度學習在預測化學反應合成路線上的應用[4]。
schwaller 等人結(jié)合了深度學習網(wǎng)絡(luò)和符號人工智能來規(guī)劃化學合成路線。他們開發(fā)了一個名為“moleculenet”的框架,該框架能夠預測反應是否可能成功,并使用這些預測來規(guī)劃出從起始原料到目標分子的合成路徑[5]。
![AI 深度學習+藥物研發(fā),讓新藥不再遙不可及 | MedChemExpress-6]()
深度學習在虛擬篩選領(lǐng)域中的應用,主要是通過神經(jīng)網(wǎng)絡(luò)來預測化合物的活性或性質(zhì),從而在虛擬環(huán)境中篩選出有潛力的候選藥物或材料。
以下是一些常見的深度學習算法在虛擬篩選中的應用:
卷積神經(jīng)網(wǎng)絡(luò) (cnn):cnn 特別適合處理圖像數(shù)據(jù),如分子結(jié)構(gòu)圖。通過識別和提取分子中的特征,如原子和化學鍵的類型和位置,cnn 可以預測分子的性質(zhì)和活性。
循環(huán)神經(jīng)網(wǎng)絡(luò) (rnn):對于處理序列數(shù)據(jù) (如化學分子序列) 的虛擬篩選任務,rnn 特別有用。rnn 可以捕捉分子序列中的長期依賴關(guān)系,從而更準確地預測分子的性質(zhì)。
生成對抗網(wǎng)絡(luò) (gan):gan 可以生成新的分子結(jié)構(gòu),這在進行虛擬篩選時非常有用。通過訓練 gan,可以生成具有所需性質(zhì)的分子,從而大大減少實驗的必要性。
圖神經(jīng)網(wǎng)絡(luò) (gnn):gnn 特別適合處理圖結(jié)構(gòu)數(shù)據(jù),如分子圖。gnn 可以捕捉分子中原子和化學鍵之間的關(guān)系,從而更準確地預測分子的性質(zhì)。
transformer:對于處理長序列數(shù)據(jù)的虛擬篩選任務,如多步化學反應預測,transformer 是一個很好的選擇。transformer 可以捕捉序列中的長期依賴關(guān)系,從而更準確地預測分子的性質(zhì)。
![AI 深度學習+藥物研發(fā),讓新藥不再遙不可及 | MedChemExpress-7]()
今天,小 m 給大家介紹了深度學習在藥物研發(fā)領(lǐng)域的應用方向及常見算法,作為一種新興的技術(shù),ai / 深度學習技術(shù)在新藥研發(fā)領(lǐng)域已初見成效,相信隨著科學的進步,ai 助力藥物篩選一定會在生物醫(yī)藥領(lǐng)域有著更加深遠的影響。
mce 的所有產(chǎn)品僅用作科學研究或藥證申報,我們不為任何個人用途提供產(chǎn)品和服務。
參考文獻:
[1] rifaioglu as, et al. recent applications of deep learning and machine intelligence on in silico drug discovery: methods, tools and databases. brief bioinform. 2019 sep ;20(5):1878-1912.
[2] guttman y, kerem z. dietary inhibitors of cyp3a4 are revealed using virtual screening by using a new deep-learning classifier. j agric food chem. 2022 mar ;70(8):2752-2761.
[3] liu s, et al. virtual screening of nrf2 dietary-derived agonists and safety by a new deep-learning model and verified in vitro and in vivo. j agric food chem. 2023 may ;71(21):8038-8049.
[4] li b, et al. a deep learning framework for accurate reaction prediction and its application on high-throughput experimentation data. j cheminform. 2023 aug;15(1):72.
[5] segler mhs, et al. planning chemical syntheses with deep neural networks and symbolic ai. nature. 2018 mar ;555(7698):604-610. |