大家好
我計劃做一個NMAD FEP/ lambda-REMD 計算兩個小分子配體對一個蛋白靶點的結(jié)合自由能差異 (relative binding affinity by free energy pertubation), 腳本文件均有CHARMM-GUI input generator 產(chǎn)生。
一共有5個腳本,其中1,2 非常簡單,第三個為關(guān)鍵運行腳本如下圖附件,其中已經(jīng)列出我所使用的cluster node 的配置信息,以及namd 的運行代碼,namd2 equ_$system.namd >...一行已經(jīng)運行完畢,沒有問題。(實際運行時,加了+p32, 以使得namd/2.13-multicore 使用32個cpu 進行32 threads 的計算)。 問題出在后面的 namd2 + replicas 32... 環(huán)節(jié), 錯誤提示是segmentation fault, 通常的解釋是首先懷疑磁盤空間不夠用,已經(jīng)嘗試將PBS -l mem=16gb, 增加至 —PBS -l mem=32gb, 仍然出現(xiàn)同樣的報錯。同樣也已經(jīng)嘗試 ulimit -s unlimited, 無效。
為了做trouble shotting, 我沒有一次提交附件1的pbs 文件至我所使用的cluster, 也就是沒有使用batch 模式,而是使用interactive job模式,即首先申請#PBS -l 所要求的資源,分配我node 后, 手動load 所需運行環(huán)境:module load intel/18.0.1.163
module load openmpi/3.1.2-intel
module load namd/2-13-multicore (or namd/2-13-mpi ???)
現(xiàn)在已知代碼namd2 equ_$system... 一行運行無錯誤, 因為手動單獨運行該行命令(實際運行時加了 +p32, 因為申請了32 塊CPU),幾小時后可成功得到結(jié)果 equ_site.out (namd/2.13-multicore)
好像無法單獨運行 namd2 +replicas ... , 因為互相迭代關(guān)系的存在?我嘗試單獨運行第一行 replicas 即變量為0時 提示restart number wrong。
為了一起運行后面有問題的 namd2 +replicas ,,,, 我刪除了沒問題的 equ_$system 行, 剩下的部分單獨做了一個附件2的腳本。
然后使用命令“csh 附件2.csh” 提交該csh 腳本(node 默認(rèn)語言環(huán)境為bash,而charm-gui 生成腳本為csh),然后就會出現(xiàn)上面提到的segmentation fault. 而是時大量刷屏出現(xiàn)的那種,感覺上replicas 迭代試圖運行,但是每一個都遇到該segmentation fault問題,單僅為猜測。
有幾個問題:1 namd/2.13-multicore 是否支持 REMD simulation ?
2. 如果需要load namd/2.13-mpi, 如何運行?namd2 ? mpirun ?
3. 是否必須要通過replica exchange MD (REMD) 才能做FEP ?
4. 關(guān)于bash/csh 的切換,是否恰當(dāng)?
謝謝!
![NAMD/lambda-REMD segmentation fault/ Desmond ligand mutation fep]()
附件1.png
![NAMD/lambda-REMD segmentation fault/ Desmond ligand mutation fep-1]()
附件2.png
![NAMD/lambda-REMD segmentation fault/ Desmond ligand mutation fep-2]()
附件3.png |