| 1 | 1/1 | 返回列表 |
| 查看: 1310 | 回復(fù): 0 | |||
[交流]
使用MolAICal的深度學(xué)習(xí)模型和經(jīng)典算法程序進(jìn)行GCGR的從頭藥物設(shè)計(jì)
|
|
使用MolAICal的深度學(xué)習(xí)模型和經(jīng)典算法程序進(jìn)行GCGR的從頭藥物設(shè)計(jì) 更多教程(含英文教程)請(qǐng)見(jiàn)如下: MolAICal官方主頁(yè):https://molaical.github.io MolAICal 文章介紹:https://doi.org/10.1093/bib/bbaa161 MolAICal中文博客:https://molaical.github.io/cntutorial.html MolAICal blogspot:https://qblab.blogspot.com 1. 簡(jiǎn)介 胰高血糖素受體(GCGR)是2型糖尿病的一個(gè)受體靶點(diǎn)。本教程使用人工智能的方法從頭設(shè)計(jì)GCGR的藥物分子,介紹了MolAICal 的標(biāo)準(zhǔn)操作流程。本教程能夠幫助藥理學(xué)家、化學(xué)家以及其他科學(xué)家根據(jù)蛋白的3D活性口袋設(shè)計(jì)合理藥物分子。 2. 工具 2.1. 所需軟件下載地址 1) MolAICal: https://molaical.github.io 2) UCSF Chimera: https://www.cgl.ucsf.edu/chimera/ 2.2. 操作示例文件 所有用到的操作教程均可在下面的網(wǎng)站下載: https://github.com/MolAICal/tutorials/tree/master/001-AIGrow 3. 操作流程 3.1. 受體的處理 1. 下載胰高血糖素受體(GCGR)的PDB文件,PDB ID: 5EE7: https://www.rcsb.org/structure/5EE7 2. 啟動(dòng) UCSF Chimera軟件: File-->Open, 載入PDB 文件 5EE7.pdb(如圖1所示)。 圖1. 載入分子 3. 選擇并刪除被選分子。 選中無(wú)用配體: Select-->Residue-->OLA (如圖2所示). 圖2. 選中某個(gè)分子 刪除無(wú)用配體: Actions-->Atoms/Bonds-->delete (如圖3所示)。 以上給出了一個(gè)簡(jiǎn)單示例, 可以通過(guò)同樣的操作繼續(xù)刪除HOH、PE5和TLA等。 圖3. 刪除選中的分子 4. 加氫。Tools-->Structure Editing-->AddH (如圖4所示)。 圖4. 加氫 注意事項(xiàng): 由于MolAICal使用AMBER力場(chǎng)處理受體,在刪除氫原子之前用UCSF Chimera加上氫原子。如果受體中含有冗余的氫原子,請(qǐng)先刪除再加上。具體操作首先,選中氫原子: Select-->Chemistry-->element-->H, 然后刪除所選氫原子: Actions-->Atoms/Bonds-->delete (如圖3所示)。因?yàn)镚CGR晶體結(jié)構(gòu)中不包含冗余氫原子,所以此處省略該步驟。 5. 保存坐標(biāo)文件 GCGRH.pdb。保存GCGRH.pdb文件目的是可以方便后續(xù)的操作(如圖5所示)。 圖5. 保存PDB格式的復(fù)合物 6. 選中并刪除配體5MV(如圖6和7所示)。將無(wú)配體結(jié)合的GCGR命名為GCGRNoLigand.pdb 文件并保存 (如圖8所示)。 圖6. 選中5MV配體 圖7. 刪除5MV配體 圖8. 保存PDB格式的受體坐標(biāo) 3.2. 處理配體 1. 關(guān)閉會(huì)話 (File-->Close Session),重新載入GCGRH.pdb文件, 選中配體5MV (如圖9和10所示): 圖9. 關(guān)閉會(huì)話 圖10. 選中5MV 2. Invert (selected models): 反選配體 5MV (如圖11所示): 圖11. 反選配體5MV 3. 刪除反選 (如圖12所示): 圖12. 刪除反選 4. 將配體保存為ligand.pdb。配體分子的片段可以作為藥物生長(zhǎng)的起始點(diǎn)(如圖13所示)。 圖13. 保存配體坐標(biāo) 3.3. 計(jì)算生長(zhǎng)盒子中心 計(jì)算生長(zhǎng)盒子的幾何中心。(注意: 如果沒(méi)有配體,可以選擇實(shí)驗(yàn)中已報(bào)道的關(guān)鍵殘基作為起始的錨定點(diǎn))。 1. 關(guān)閉會(huì)話 (File-->Close Session), 載入GCGRH.pdb, 然后使用圖10的方法選擇配體 (如圖14所示): 圖14. 選擇配體 2. Tools-->Structure Analysis-->Distance (如圖15所示): 圖15. 選擇距離工具 3. 點(diǎn)擊Axes/Planes/Centroids, 然后點(diǎn)擊 “Define centroid” (如圖16所示): 圖16. 定義質(zhì)心 4. 選擇彈出窗口中的 “OK” (如圖17所示)。 圖17. 定義質(zhì)心盒子 5. 選擇已被定義的質(zhì)心 (藍(lán)色所示), 然后點(diǎn)擊“Report distance” (如圖18所示) 圖18. 點(diǎn)擊Report distance 6. 此時(shí)可以看到質(zhì)心為(x, y, z): -30.011, 1.665, -36.581 (如圖19所示): 圖19. 展示盒子的質(zhì)心坐標(biāo) 7. 計(jì)算最終盒子的大小。你可以將X, Y, Z的長(zhǎng)度調(diào)整為30, 30, 30。用以下MolAICal命令生成 “box.bild”。(注意: X, Y, Z坐標(biāo)中的雙引號(hào)是必不可少的,X, Y, Z坐標(biāo)之間的間隔距離應(yīng)該為一個(gè)空格。) 2) File-->open,然后打開(kāi)“box.bild”(如圖20所示), 然后檢查產(chǎn)生的盒子是否合適 (如圖21所示)。 圖20. 打開(kāi)box.bild 圖21. 在GCGR口袋中顯示盒子 從圖21可以看出,盒子的參數(shù)是合適的, 因此最終盒子的質(zhì)心參數(shù)為-30.011, 1.665, -36.581,盒子的長(zhǎng)度X, Y, Z 為 30.0, 30.0, 30.0。 3.4. 制作初始生長(zhǎng)片段 本教程介紹了兩種方法,你可以選擇其中任何一種進(jìn)行藥物從頭設(shè)計(jì)。如果受體活性口袋中配體的晶體結(jié)構(gòu)已知的話,我們推薦第一種方法。 方法 1. 從配體的晶體結(jié)構(gòu)中選擇片段 在本方法中, 初始片段是從GCGR活性口袋中配體的晶體結(jié)構(gòu)中提取的。 1. 制作初始生長(zhǎng)片段。打開(kāi)上文保存的ligand.pdb文件。通過(guò)鼠標(biāo)和鍵盤選擇原子。 1) Ctrl + 鼠標(biāo)左鍵: 一次選擇一個(gè)原子。 2) Ctrl + Shift + 鼠標(biāo)左鍵: 同時(shí)選擇多個(gè)原子。 本教程中,我們通過(guò)Ctrl + 鼠標(biāo)左鍵選擇內(nèi)層原子作為初始生長(zhǎng)片段。(選擇結(jié)果如圖22所示)。 圖22. 選擇初始生長(zhǎng)部分 2. 反選(已選模型)如圖23所示。 圖23. 選擇Invert (selected models) 3. 然后刪除反選部分:Actions-->Atoms/Bonds-->delete. 最終選擇圖24所示分子作為初始片段。 圖24. 初始生長(zhǎng)片段 4. 為了使分子按照正確的方法生長(zhǎng),需要在初始生長(zhǎng)片段上加氫,具體操作為:“Tools-->Structure Editing-->AddH” (如圖25所示)。 圖25. 初始生長(zhǎng)片段加氫結(jié)果 5. 然后將片段保存為sybyl Mol2格式,命名為“startFrag.mol2” (如圖26所示)。 圖26. 保存初始生長(zhǎng)片段的坐標(biāo) 方法2. 活性口袋中沒(méi)有配體的晶體結(jié)構(gòu)。 如果在受體活性口袋中沒(méi)有配體的晶體結(jié)構(gòu), 你可根據(jù)文獻(xiàn)報(bào)到或者自己的經(jīng)驗(yàn)選擇一個(gè)關(guān)鍵殘基上的原子,操作同方法1。將該原子做成獨(dú)立文件,通過(guò)序列格式SMILES給出初始片段。MolAICal將自動(dòng)搜索SMILES格式片段在GCGR口袋中的最佳位置。 將“growMethod”設(shè)置為randomFrag。然后添加“startAtomPosition”和“startSmiFrag”參數(shù)。“startAtomPosition”包含一個(gè)你所選殘基中的原子!皊tartSmiFrag”為你指定的SMILES格式的初始片段文件。參數(shù)示例如下: ---------------------------------------------------------------------------------------------------------------------- growMethod randomFrag startFragFile D:/GCGR/genstartFrag.mol2 startAtomPosition D:/GCGR/resPosition.pdb startSmiFrag C ---------------------------------------------------------------------------------------------------------------------- 本教程選擇方法1進(jìn)行藥物設(shè)計(jì)。 3.5. 運(yùn)行藥物從頭設(shè)計(jì)程序 有兩種選擇:方法1利用AI 模型及經(jīng)典程序進(jìn)行藥物從頭設(shè)計(jì)。方法2利用純經(jīng)典程序進(jìn)行藥物從頭設(shè)計(jì)。為節(jié)省時(shí)間,你可以選擇以下任何一種方法開(kāi)始學(xué)習(xí)。 方法1. 利用AI模型及經(jīng)典程序的藥物從頭設(shè)計(jì)方法 將“l(fā)ibStyle”設(shè)置為 AIFrag。實(shí)例如下: ---------------------------------------------------------------------------------------------------------------------- #定義可讀文庫(kù)路徑:mol2, SMILES, AIFrag libStyle AIFrag ---------------------------------------------------------------------------------------------------------------------- 注意: 如果顯示錯(cuò)誤信息:如“Warning: Atom 9 C.3 overlaps with protein!”及“Warning: some atoms overlap with protein.”你可以用MD模擬工具或者UCSF Chimera最小化受體-配體復(fù)合物。只有win64 或者linux64版本的MolAICal可以執(zhí)行該命令。 按照教程中的描述,將控制臺(tái)目錄轉(zhuǎn)換為 “001-AIGrow” #> cd 001-AIGrow 最后在后臺(tái)運(yùn)行以下命令 linux系統(tǒng): #> molaical.exe -denovo grow -i InputParFileAI.dat >& denovo.log & windows系統(tǒng) (使用PowerShell): #> molaical.exe -denovo grow -i InputParFileAI.dat 如果想要在后臺(tái)進(jìn)行運(yùn)算, 你可以運(yùn)行以下命令: #> powershell -windowstyle hidden -command “molaical.exe -denovo grow -i InputParFileAI.dat” 方法2. 使用經(jīng)典程序進(jìn)行藥物從頭設(shè)計(jì) 將“l(fā)ibStyle”設(shè)置為mol2。MolAICal將使用用戶自定義的文庫(kù)。實(shí)例如下: ---------------------------------------------------------------------------------------------------------------------- # 定義可讀文庫(kù)路徑: mol2, SMILES, AIFrag libStyle mol2 ---------------------------------------------------------------------------------------------------------------------- Note: 如果顯示錯(cuò)誤信息:如“Warning: Atom 9 C.3 overlaps with protein!”及“Warning: some atoms overlap with protein.”你可以用MD模擬工具或者UCSF Chimera等軟件最小化受體-配體復(fù)合物。任意版本的MolAICal可以執(zhí)行該命令。 MolAICal 可以通過(guò)JAVA 并行流調(diào)用多個(gè)CPU內(nèi)核,你需要根據(jù)電腦的配置文件設(shè)置“coreNum”參數(shù)。 按照教程中的描述,將控制臺(tái)目錄轉(zhuǎn)換為 “001-AIGrow”。 #> cd 001-AIGrow 在后臺(tái)運(yùn)行以下命令 linux系統(tǒng): #> molaical.exe -denovo grow -i InputParFileCP.dat >& denovo.log & windows系統(tǒng) (使用PowerShell): #> molaical.exe -denovo grow -i InputParFileCP.dat 如果想要在后臺(tái)執(zhí)行運(yùn)算, 你可以運(yùn)行以下命令: #> powershell -windowstyle hidden -command “molaical.exe -denovo grow -i InputParFileCP.dat” 4. 結(jié)果 當(dāng)程序運(yùn)行結(jié)束后你可以找到“results”目錄,在本教程中,循環(huán)周期設(shè)置為30,使用30個(gè)CPU核心運(yùn)算1-2天完成整個(gè)計(jì)算。如果你想查看結(jié)果,打開(kāi)001-AIGrow中的“results”目錄,其中名為“AstatisticsFile.dat”的文件包含了藥物設(shè)計(jì)的信息。該文件僅為示例文件并不包含所有結(jié)果。在文件“AstatisticsFile.dat”中將看到以下信息: ---------------------------------------------------------------------------------------------------------------------- ID Name Cluster Affinity(kcal/mol) Formula InChIKey Synthetic_Accessibility 1 lig_1.mol2 [1] -3.27 C9H13N6O14S2 BEQXRJFDXZCPLY-GRQBKTHUSA-O 77.41 2 lig_2.mol2 [1] -7.67 C13H13N11O9S IQOZHKOALGXOOC-WVXRZKCLSA-O 75.31 ……………. ---------------------------------------------------------------------------------------------------------------------- “Affinity”表示結(jié)合能力打分。“Cluster”代表k-means 聚類結(jié)果。你可以選擇有代表性的配體應(yīng)用到研究中。Synthetic_Accessibility 分值從0到100,分值100表示該化合物是理論上最易合成的。例如,在UCSF Chimera中載入“GCGRNoLigand.pdb”, “l(fā)igand.mol2” 和 “l(fā)ig_2.mol2”文件 (如圖27)。其中紅色的小分子是“l(fā)ig_2.mol2”。結(jié)果表明MolAICal生成了與GCGR原始配體類似的小分子。 圖27. 藥物設(shè)計(jì)的結(jié)果 注意: 你可能發(fā)現(xiàn)羥基上可能有奇怪的氫原子。這可能是深度學(xué)習(xí)模型產(chǎn)生的不規(guī)則分子導(dǎo)致的。這個(gè)氫原子并不參與結(jié)合能力打分。你可以用UCSF Chimera刪除該氫原子,然后再加氫。為了進(jìn)一步精確地評(píng)估這些配體與GCGR受體的結(jié)合能力, 推薦使用分子動(dòng)力學(xué)模擬和MM/GBSA進(jìn)行計(jì)算評(píng)估。 |
| 1 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 288求調(diào)劑085600材料與化工 +9 | Daunrin 2026-03-07 | 10/500 |
|
|---|---|---|---|---|
|
[考研] 材料工程專碩調(diào)劑自薦信,初試323 +3 | 李白26 2026-03-07 | 3/150 |
|
|
[考研]
|
程晴之 2026-03-06 | 6/300 |
|
|
[考研] 材料277分求調(diào)劑 +13 | 飯飯星球 2026-03-04 | 14/700 |
|
|
[考研] 085600材料與化工調(diào)劑 280分 +13 | yyqqhh 2026-03-03 | 13/650 |
|
|
[考研] 求調(diào)劑 +5 | danyyyy 2026-03-04 | 5/250 |
|
|
[考博] 26申博-目前4篇SCI一作 +4 | chen_2024 2026-03-02 | 4/200 |
|
|
[考研] 083000,總分284,求調(diào)劑 +3 | 徐yr 2026-03-04 | 3/150 |
|
|
[考研] 材料與化工,291,求調(diào)劑 +7 | 咕嚕咕嚕123123 2026-03-05 | 8/400 |
|
|
[考研] 紡織、生物、化學(xué)、材料等專業(yè) +3 | Eember. 2026-03-05 | 7/350 |
|
|
[考研] 環(huán)境調(diào)劑 +7 | 柒槿levana 2026-03-01 | 7/350 |
|
|
[考研] 322分 085600求調(diào)劑,有互聯(lián)網(wǎng)+國(guó)金及主持省級(jí)大創(chuàng)經(jīng)歷 +6 | 熊境喆 2026-03-04 | 6/300 |
|
|
[考研] 295求調(diào)劑 +4 | 小賽不吃香菜 2026-03-04 | 4/200 |
|
|
[考研] 武理材料工程302調(diào)劑 +3 | Doleres 2026-03-03 | 6/300 |
|
|
[考研] 一志愿東北大學(xué)化學(xué)314分求調(diào)劑 +5 | lr1212.. 2026-03-02 | 5/250 |
|
|
[考研] 268求調(diào)劑 +6 | 好運(yùn)連綿不絕 2026-03-02 | 6/300 |
|
|
[考研]
材料工程專碩283求調(diào)劑
5+8
|
,? 2026-03-02 | 10/500 |
|
|
[考研] 295求調(diào)劑。一志愿報(bào)考鄭州大學(xué)化學(xué)工藝學(xué)碩,總分295分 +8 | yl1 2026-03-02 | 9/450 |
|
|
[考研] 一志愿東北大學(xué)材料專碩328,求調(diào)劑 +3 | shs1083 2026-03-02 | 3/150 |
|
|
[考研] 1 +5 | 2026計(jì)算機(jī)_誠(chéng)心 2026-03-01 | 8/400 |
|