| 2 | 1/1 | 返回列表 |
| 查看: 329 | 回復(fù): 1 | |||
[交流]
使用MolAICal進(jìn)行多肽虛擬篩選教程-同樣適用于蛋白質(zhì)和核酸的虛擬篩選 已有1人參與
|
|
MolAICal官方地址: https://molaical.github.io/ 或 https://molaical.gitlab.io/ 更詳細(xì)的教程見(jiàn):https://molaical.gitlab.io/cntutorial.html 或 https://molaical.github.io/tutorial.html 本教程也適用于蛋白-蛋白,蛋白-核酸等虛擬篩選,MolAICal還提供了一種更快速并可以兼容非氨基酸殘基類型的多肽篩選方式: https://molaical.gitlab.io/cntutorial.html 中的: 30. 使用MolAICal在受體口袋中進(jìn)行多肽虛擬篩選 多肽生成的教程,見(jiàn) https://molaical.gitlab.io/cntutorial.html 中的: 28. 使用MolAICal生成多肽的教程 本教程沒(méi)有包含附錄,更詳細(xì)教程請(qǐng)見(jiàn):https://molaical.gitlab.io/cntutorial.html 中的: 29. 使用MolAICal與LightDock進(jìn)行多肽虛擬篩選教程-同樣適用于蛋白質(zhì)和核酸的虛擬篩選 ________________________________________ 1. 引言 MolAICal 可以使用開(kāi)源的 LightDock 軟件(https://lightdock.org)并通過(guò) MM/GBSA 或 MM/PBSA 方法進(jìn)一步提升生物大分子對(duì)接的準(zhǔn)確性。LightDock 是一個(gè)開(kāi)源(GPL-3.0 許可)的對(duì)接框架,適用于 蛋白質(zhì)-蛋白質(zhì)、蛋白質(zhì)-肽段、蛋白質(zhì)-RNA 和 蛋白質(zhì)-DNA 復(fù)合物的對(duì)接。它特別擅長(zhǎng)處理柔性及具有挑戰(zhàn)性的情況(例如瞬時(shí)相互作用、低親和力復(fù)合物,或需要主鏈/側(cè)鏈靈活性的體系),并且作為一個(gè)可擴(kuò)展平臺(tái),支持測(cè)試新型打分函數(shù)、約束條件或優(yōu)化策略。LightDock 采用 螢火蟲(chóng)群優(yōu)化算法(Glowworm Swarm Optimization, GSO)——一種最初為多峰函數(shù)優(yōu)化設(shè)計(jì)的仿生群體智能方法。 本教程以 胰高血糖素樣肽-1 受體(GLP-1R) 與 艾塞那肽-4(exendin-4,首個(gè) FDA 批準(zhǔn)的 GLP-1R 激動(dòng)劑)為例進(jìn)行演示(PDB ID: 7LLL.pdb)。 注意:本教程僅適用于 Linux 操作系統(tǒng)! 本教程展示了一種通過(guò) MolAICal 與 LightDock 平臺(tái)集成 實(shí)現(xiàn)肽段虛擬篩選的計(jì)算流程。MolAICal 能夠高效生成并預(yù)測(cè)多種肽段候選結(jié)構(gòu)的 3D 構(gòu)象,包括線性和環(huán)狀變體以及不同二級(jí)結(jié)構(gòu);而 LightDock 則采用先進(jìn)的群體優(yōu)化算法,實(shí)現(xiàn)高精度的蛋白質(zhì)-肽段對(duì)接模擬。該聯(lián)合方法使研究人員能夠?qū)Τ汕先f(wàn)種肽段變體進(jìn)行靶向篩選,基于結(jié)合能和相互作用模式識(shí)別出有潛力的結(jié)合體。通過(guò)多尺度建模方法和并行計(jì)算能力,該流程顯著加速了治療性肽段、蛋白質(zhì)抑制劑和核酸結(jié)合物的發(fā)現(xiàn)過(guò)程(只需將肽段替換為蛋白質(zhì)或核酸即可)。 更多細(xì)節(jié)請(qǐng)參閱 蛋白質(zhì)-DNA 和 蛋白質(zhì)-RNA 對(duì)接教程,以及 MolAICal 用戶手冊(cè)。 ________________________________________ 2. 材料 2.1 軟件要求 1. MolAICal:https://molaical.github.io 2. NAMD(CPU 版本):https://www.ks.uiuc.edu/Research/namd/ 注意:本教程可使用 NAMD 2.x、3.x 或更高版本。例如,若您使用 NAMD 3.x 版本,則將教程中的命令 “namd2” 替換為 “namd3”。更高版本的 NAMD 亦可采用類似方式替換。 3. PyMol:https://github.com/cgohlke/pymol-open-source-wheels, https://github.com/maabuu/pymol-wheels , https://pypi.org/project/pymol-open-source-whl/ , https://github.com/cnpem/PyMOL4Win 4. VMD:https://www.ks.uiuc.edu/Research/vmd 2.2 示例文件 1. 所有必需的教程文件可從以下地址下載: https://gitee.com/molaical/tutorials/tree/master/028-peptide_vs_lm ________________________________________ 3. 操作流程 3.1 分子準(zhǔn)備 為了解決Linux中的庫(kù)依賴問(wèn)題,Linux版本的MolAICal (Windows 版本的MolAICal沒(méi)有采用容器)采用了基于容器的方法。如果需要調(diào)用外部程序,建議在MolAICal容器內(nèi)安裝這些程序。如果不需要外部程序,可以忽略此步驟。本教程需要外部程序NAMD和VMD,具體步驟如下: 1. 首先,將文件復(fù)制到 MolAICal 容器中 2. 其次,進(jìn)入 MolAICal 容器的虛擬環(huán)境 注:molaical 是容器名稱。 3. 在 MolAICal 容器虛擬環(huán)境中安裝軟件的方式與在本地主機(jī)上安裝相同。以下以安裝 VMD 和 NAMD 為例: 1) 安裝 NAMD: 解壓 NAMD 文件(假設(shè)解壓后的文件夾名為 namdcpu),然后使用以下命令將其路徑告知 MolAICal: 注:請(qǐng)將上述 VMD 和 NAMD 的路徑替換為您系統(tǒng)中的實(shí)際路徑。-n 后面的 "VMD" 和 "NAMD"(大小寫(xiě)不敏感)是固定的標(biāo)識(shí)符。為確保 MM/GBSA 結(jié)果的可重復(fù)性,建議使用 NAMD 的 CPU 版本,因?yàn)?CUDA 版本中的 seed 參數(shù)似乎對(duì)結(jié)果可重復(fù)性無(wú)效。 2) 安裝 VMD: 按以下步驟操作: 解壓 VMD 文件: 注:請(qǐng)將上述路徑替換為您系統(tǒng)中的實(shí)際路徑。 修改 VMD 解壓目錄中名為 configure 的文件中的安裝路徑: 安裝 VMD: 注:請(qǐng)運(yùn)行 ./configure 并根據(jù)所用計(jì)算機(jī)選擇正確的類型,此處為 "LINUXAMD64"。 然后使用以下命令將 VMD 路徑告知 MolAICal: 至此,NAMD 和 VMD 在 MolAICal 容器內(nèi)的安裝與配置已完成。為防止MolAICal出現(xiàn)問(wèn)題時(shí)丟失已安裝的程序(例如VMD和NAMD),請(qǐng)參閱附錄2中的第3步。 進(jìn)入教程材料文件夾 “028-peptide_vs_lm”: 將看到以下文件列表: 7LLL.pdb:來(lái)自 https://www.rcsb.org 的復(fù)合物結(jié)構(gòu)文件(PDB 格式) dock_u.sh:對(duì)接單元腳本(適用于本教程類似的膜蛋白受體) dock_u_nomem.sh:對(duì)接單元腳本(適用于非膜蛋白受體) dock_u_cyc.sh:環(huán)肽與膜蛋白的對(duì)接單元腳本 dock_u_cyc_nomem.sh:環(huán)肽與非膜蛋白的對(duì)接單元腳本 mempro.pdb:本受體對(duì)應(yīng)的膜蛋白受體(制備方法見(jiàn)附錄 1或 MolAICal 蛋白質(zhì)-肽段對(duì)接教程) new.pdb:受體構(gòu)建過(guò)程中的臨時(shí)文件 P_peptide.pdb:從 “7LLL.pdb” 中提取的肽段配體(制備方法見(jiàn)附錄 1或 MolAICal 蛋白質(zhì)-肽段對(duì)接教程) restraints.list:指定活性位點(diǎn)的文件,可減少構(gòu)象搜索的對(duì)接時(shí)間(制備方法見(jiàn)附錄 1) R_protein.pdb:從 “7LLL.pdb” 中提取的受體文件(制備方法見(jiàn)附錄 1) R_P_complex.pdb:包含肽段配體和受體的復(fù)合物文件(制備方法見(jiàn)附錄 1) 選項(xiàng):LightDock中的DFIRE評(píng)分函數(shù)需要標(biāo)準(zhǔn)氨基酸殘基及其原子名稱,因此在使用DFIRE評(píng)分函數(shù)進(jìn)行對(duì)接前,必須檢查并修復(fù)受體或配體。修復(fù)命令如下: 此處該P(yáng)DB文件正常,無(wú)需通過(guò)上述選項(xiàng)處理。 ________________________________________ 3.2 肽段生成 LightDock的功能實(shí)現(xiàn)依賴于打分函數(shù)所支持的氨基酸類型。例如:DFIRE僅支持標(biāo)準(zhǔn)氨基酸及殘基名稱為"MMB"的氨基酸;此時(shí)必須使用"-nc"參數(shù)以避免在生成肽段的N端和C端添加封端基團(tuán),因?yàn)镈FIRE無(wú)法識(shí)別這些修飾結(jié)構(gòu)。 1) 使用 MolAICal 生成線性肽段 參數(shù)說(shuō)明: -call:與外部程序或命令交互。值為 ‘set’(設(shè)置環(huán)境)或 ‘run’(運(yùn)行程序) -i:調(diào)用外部程序,其后跟隨該程序的所有命令行參數(shù) -c(在 -i 之前):若值為 “pepgen”,則生成肽段 -l:肽段中氨基酸殘基數(shù) -n:生成的唯一序列數(shù)量 -3d:使用 pyPept 生成 3D 結(jié)構(gòu) -nc:不為序列添加乙;╝c)/酰胺基(am)封端 -o:生成序列的輸出文件 -dir:3D 結(jié)構(gòu)的輸出目錄 更多細(xì)節(jié)請(qǐng)參閱 MolAICal 手冊(cè)。 生成的 3D 肽段位于 “l(fā)inear” 文件夾中,可用于后續(xù)虛擬篩選。 2) 使用 MolAICal 生成帶有固定殘基的線性肽段(用于肽段修飾) 新增參數(shù)說(shuō)明: -dir:3D 結(jié)構(gòu)輸出目錄 -rc:使用 RDKit 生成的隨機(jī)構(gòu)象數(shù)量(默認(rèn):1) -d:從種子序列擴(kuò)展的方向([forward, backward, both, none]) -s:起始序列(可選) -fix:生成過(guò)程中保持固定的殘基位置(1 起始索引) 3) 使用 MolAICal 生成環(huán)狀肽段 MolAICal 還支持生成含二硫鍵等修飾的肽段(詳見(jiàn) MolAICal 手冊(cè))。 新增參數(shù)說(shuō)明: -cc:生成環(huán)狀肽段(僅支持 BILN/HELM 格式) -c(在 -i 之后):用于并行處理的 CPU 核心數(shù) 在 “l(fā)inear”、“mpep” 和 “cyclic” 目錄中分別包含了三類肽段,適用于不同目的。由于肽段虛擬篩選計(jì)算耗時(shí),本教程僅提取少量肽段用于演示。用戶可根據(jù)自身計(jì)算資源生成足量肽段用于研究。 ________________________________________ 3.3 肽段虛擬篩選 MolAICal 的虛擬篩選方法包括:創(chuàng)建一個(gè) 對(duì)接單元(Docking Unit)腳本文件,其中包含多個(gè)任務(wù);每個(gè)單元對(duì)接一個(gè)分子(見(jiàn)圖 1)。在此基礎(chǔ)上,通過(guò) 多核并行處理 可同時(shí)篩選多個(gè)分子,實(shí)現(xiàn)虛擬篩選。 圖 1:對(duì)接單元示意圖 “l(fā)inear” 和 “mpep” 文件夾中的肽段可使用相同流程篩選。對(duì)于 “cyclic” 文件夾中的環(huán)狀肽段,需進(jìn)行小幅修改:在 MM/GB/PB/SA 步驟中,末端殘基必須使用 ‘LINK’ 進(jìn)行打補(bǔ)丁。該方法也適用于肽段中二硫鍵等殘基修飾。 1) 對(duì) “l(fā)inear” 和 “mpep” 文件夾中的線性肽段進(jìn)行篩選: 參數(shù)說(shuō)明: '-call':與外部程序交互(‘set’/‘run’) '::= ':用于按指定順序?yàn)閰?shù)賦值,后面的變量必須緊跟"::=",不能有空格。 '-c':若值為 “sfile”,則運(yùn)行 MolAICal 腳本 '1::= ':待篩選分子(如肽段)的工作目錄(默認(rèn):‘linear’) '2::= ':受體文件(默認(rèn):‘mempro.pdb’) '3::= ':第一個(gè)分子(即受體)的鏈名(默認(rèn):‘R’) '4::= ':第二個(gè)分子(即配體)的鏈名(默認(rèn):‘Z’) '5::= ':每個(gè)子任務(wù)(即每次對(duì)接)使用的 CPU 核心數(shù)(默認(rèn):2) '6::= ':虛擬篩選任務(wù)使用的CPU核心總數(shù)。默認(rèn)值為1。此參數(shù)決定啟動(dòng)的并行管道數(shù)量,多個(gè)并行管道會(huì)顯著增加內(nèi)存消耗。建議保持默認(rèn)值1,即僅激活一個(gè)管道。除非可用內(nèi)存資源非常充足,方可考慮增加并行管道數(shù)量。 若要進(jìn)一步提升計(jì)算效率,可增加單個(gè)管道內(nèi)子任務(wù)的并行核心數(shù),例如通過(guò)"5::=8"格式配置(表示該子任務(wù)使用8個(gè)核心)。 '8::= ':調(diào)試模式(0 或 1)。1 表示測(cè)試任務(wù)以檢查錯(cuò)誤;0 表示直接運(yùn)行(默認(rèn):0) '9::= ':MolAICal 腳本格式的對(duì)接腳本文件(默認(rèn):‘dock_unit.sh’) '11::= ':結(jié)果輸出目錄(默認(rèn):‘dresults’) 更多細(xì)節(jié)請(qǐng)參閱 MolAICal 手冊(cè)。 2) 對(duì) “cyclic” 文件夾中的環(huán)狀肽段進(jìn)行篩選: ________________________________________ 3.4 結(jié)果排序 此處以 “cyc_result” 文件夾中的結(jié)果為例進(jìn)行說(shuō)明,用戶可參考此案例用于自身研究。 1) 僅處理自定義百分比(此處為 20%)的篩選候選分子: 或 2) 僅處理 MMGBPBSA,并自定義結(jié)果輸出目錄: 或 3) 同時(shí)處理篩選與 MMGBPBSA,使用默認(rèn)設(shè)置并獲取前 20% 的結(jié)果: 參數(shù)說(shuō)明: -m {both,filtered,mmgbpbsa}: 處理模式(默認(rèn):both) -p: 提取頂部分子的百分比(默認(rèn):5.0) -fo: 篩選結(jié)果輸出目錄(默認(rèn):vs_filtered_results) -mo: MMGBPBSA結(jié)果輸出目錄(默認(rèn):vs_mmgbpbsa_results) "cyc_result"是包含用于虛擬篩選的候選肽段分子的輸入目錄。 更多幫助信息,請(qǐng)查閱MolAICal用戶手冊(cè) 任務(wù)續(xù)跑:如果任務(wù)被中斷,請(qǐng)運(yùn)行以下命令進(jìn)行恢復(fù): '7::=': 檢查對(duì)接任務(wù)是否完成。其值為 0 或 1。若值為 1,將檢查 MM/GB/PB/SA 步驟的結(jié)果;若值為 0,則檢查第一步虛擬篩選步驟的結(jié)果。默認(rèn)值為 1。 '12::=': 為對(duì)接腳本文件 '9::=' 提供更多選項(xiàng)。默認(rèn)值為空字符串,用 "" 表示。若此輸入包含多個(gè)參數(shù),請(qǐng)使用逗號(hào)字符 ',' 分隔。MolAICal 會(huì)自動(dòng)將每個(gè)逗號(hào) ',' 轉(zhuǎn)換為空格 " "。它有一些特殊值: 若為 "createdir",則僅創(chuàng)建虛擬篩選的文件夾; 若為 "startvs",則僅運(yùn)行虛擬篩選任務(wù); 若為 "continuevs",則會(huì)處理剩余的未完成虛擬篩選任務(wù); 若為 "sn_{num}",則會(huì)設(shè)置 ${num} 個(gè)并行管道,這對(duì)應(yīng)于 '6::=' 的設(shè)置; 否則,運(yùn)行所有任務(wù)。 在指定文件夾 ${work_dir}(例如 "linear" 文件夾)中完成虛擬篩選的 PDB 文件,將被移動(dòng)到目錄 ${work_dir}_complete_folder 中。然后,直接運(yùn)行之前的虛擬篩選程序?qū)?${work_dir} 文件夾恢復(fù)任務(wù),從而有效實(shí)現(xiàn)任務(wù)續(xù)跑。 ________________________________________ 參考文獻(xiàn) 1. Jiménez-García, B.; Roel-Touris, J.; Romero-Durana, M.; Vidal, M.; Jiménez-González, D.; Fernández-Recio, J., LightDock: a new multi-scale approach to protein-protein docking. Bioinformatics 2018, 34 (1), 49–55. 2. Krishnanand, K. N.; Ghose, D., Glowworm swarm optimization for simultaneous capture of multiple local optima of multimodal functions. Swarm Intelligence 2009, 3 (2), 87–124. ________________________________________ |
金蟲(chóng) (正式寫(xiě)手)

| 2 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研]
|
旅行中的紫葡萄 2026-03-03 | 4/200 |
|
|---|---|---|---|---|
|
[考研] 復(fù)試調(diào)劑 +4 | 杰尼龜aaa 2026-03-03 | 4/200 |
|
|
[考研] 276求調(diào)劑 +8 | 路lyh123 2026-02-28 | 10/500 |
|
|
[基金申請(qǐng)] 沒(méi)有青基直接申請(qǐng)面上,感覺(jué)自己瘋了 +5 | kevin63t 2026-03-02 | 6/300 |
|
|
[考研] 267求調(diào)劑 +6 | 釣魚(yú)佬as 2026-03-02 | 6/300 |
|
|
[考研] 化工270求調(diào)劑 +10 | 什么名字qwq 2026-03-02 | 10/500 |
|
|
[考研] 284求調(diào)劑 +6 | 天下熯 2026-03-02 | 6/300 |
|
|
[考研] 化學(xué)0703求調(diào)劑 學(xué)碩 理/工科均可 總分279 +3 | 1一11 2026-03-03 | 5/250 |
|
|
[考研] 中國(guó)科學(xué)技術(shù)大學(xué)材料與化工281求調(diào)劑,有科研和獲獎(jiǎng)經(jīng)歷 +6 | wsxw 2026-03-02 | 7/350 |
|
|
[考研] 307求調(diào)劑 +6 | wyyyqx 2026-03-01 | 6/300 |
|
|
[考研] 求調(diào)劑院校 +6 | 云朵452 2026-03-02 | 8/400 |
|
|
[考研] 085600材料工程一志愿中科大總分312求調(diào)劑 +9 | 吃宵夜1 2026-02-28 | 11/550 |
|
|
[考研] 一志愿中石油(華東)本科齊魯工業(yè)大學(xué) +3 | 石能偉 2026-03-02 | 3/150 |
|
|
[考研] 0856化工專碩求調(diào)劑 +15 | 董boxing 2026-03-01 | 15/750 |
|
|
[考研] 303求調(diào)劑 +5 | 今夏不夏 2026-03-01 | 5/250 |
|
|
[考研] 求調(diào)劑 +3 | 熬夜的貓頭鷹 2026-03-02 | 3/150 |
|
|
[考研] 272求調(diào)劑 +6 | 田智友 2026-02-28 | 6/300 |
|
|
[考研] 0856材料求調(diào)劑 +4 | 麻辣魷魚(yú) 2026-02-28 | 4/200 |
|
|
[考研] 295復(fù)試調(diào)劑 +3 | 簡(jiǎn)木ChuFront 2026-03-01 | 3/150 |
|
|
[論文投稿]
Optics letters投稿被拒求助
30+3
|
luckyry 2026-02-26 | 4/200 |
|