Gromacs教程II-MD结果分析 - 图文- 下载本文

g_energy -f ener.edr -o temperature.xvg

此命令将产生一列能量及其参量,这些参数存贮在.edr能量文件中。本教程的能量文件可能含有68个参量,每个都可以提取并画出图像。 最开始九个对应于力场中的不同能量。还应注意,从第47个开始同时列出了蛋白和非蛋白的参量,及两者之间的相互作用。为了提取温度,输入\0\(Gromacs version 4.0.5),回车。用xmgrace程序看图,看看在指定温度附近(300 K)的温度如何波动。从波动也可以计算体系热容,热容在g_energy输出文件的结尾。 xmgrace -nxy temperature.xvg

==Q== What is the average temperature and what is the heat capacity of the system? ( T )

通过调用能量参量名,可以自动运行能量文件。使用'echo'和管道命令 (\,实现从一个程序到另一个程序的数据传输,g_energy可以自动回应。为了提取多个参量,每个参量以\划分。拷贝并粘贴,或者输入以下命令行提取其他参量。不幸的是,能量参量必须用数字指定。

echo 15 0 | g_energy -f ener.edr -o pressure.xvg

echo -e \echo 20 0 | g_energy -f ener.edr -o volume.xvg echo 21 0 | g_energy -f ener.edr -o density.xvg

echo -e \逐个查看这些文件,看看数值的收敛情况。如果数值没有收敛,就表明模拟尚未达到平衡,需要延时才能进行进一步分析。而且,平衡附近的数据不能用于分析。这里,为了简便起见,我们不管他了,直接用这些数据分析。 ==Q== What are the terms plotted in the files energy.xvg and box.xvg ==Q== Estimate the plateau values for the pressure, the volume and the density. ( T )

一些参量比其他的收敛慢。特别地,温度很容易收敛而系统各部分的相互作用收敛可能较慢。看看蛋白质和溶剂之间的相互关系:

echo -e \0\| g_energy -f ener.edr -o coulomb-inter.xvg echo -e \0\vanderwaals-inter.xvg

|

g_energy

-f

ener.edr

-o 周期性图像建的最小距离

对于QA,一个最重要的需要检查的事项是,周期性图像之间不应该有相互作用;因为周期性图像是有独立身份的,这些相互作用在物理学上不应该发生。设想双极性蛋白质图像存在直接的相互作用,那么同一蛋白质在盒子边界的两个末端就会产生作用力,这将影响蛋白质的本身行为并使模拟结果失效。 为了确认这些相互作用没有发生,我们用g_mindist命令计算周期性图像每次的最小距离:

g_mindist -f traj.xtc -s minimal-periodic-distance.xvg -pi

topol.tpr

-od ==Q== What was the minimal distance between periodic images and at what time did that occur? ( T )

==Q== What happens if the minimal distance becomes shorter than the cut-off distance used for electrostatic interactions? Is it the case in your simulations?

小距离的事件发生是偶然性的还是持续性的,也会有影响。如果是持续性的,就可能影响蛋白质动力学;但是如果只是偶尔发生,就一般不会有影响。 ==Q== Run now g_mindist on the C-alpha group, does it change the results? What does is mean for your system?

不只是直接相互作用需要关注,那些由水分子介导的间接效应,也会产生问题。例如,蛋白质可能影响最初四层水分子的排列,这相当于1 nm的距离;理想的情况是,最小距离不应该小于2nm。

波动的均方根

除了能量本身的检查外,还应该检查模拟过程中,松弛后的蛋白质向平衡状态收敛的情况。通常,松弛只是考虑了与参考结构(例如,晶体结构)的Euclidean距离。这个距离以 均方根偏差 (RMSD)表示。然而,我们推荐再检查一下与平均结构的松弛情况,也就是说,与平均结构的RMSD。个中原因,将在下一段说明。但为了计算与平结构的RMSD,需要首先得到平均结构。这个结构可在计算波动均方根(RMSF)时附加得到。

RMSF的捕获每个原子相对平均位置的波动。这能深入观察蛋白质柔性部位的性质,相应于晶体结构测定中的b-factors (温度因子)。通常,我们希望RMSF与b-factors相近,这能表明模拟结果与晶体结构相适应。RMSF (和平均结构)用g_rmsf计算。-oq选项运行计算b-factors,并把它们添加到参考结构中。我们最关心每个残基的波动,可用选项-res设定。

g_rmsf -f traj.xtc -s topol.tpr -o rmsf-per-residue.xvg -ox average.pdb -oq bfactors.pdb -res

用xmgrace看看RMSF,找出柔性和刚性区域。

==Q== Indicate the start and end residue for the most flexible regions and the maximum amplitudes. ( T )

==Q== Compare the results from the different proteins. Are there differences? If yes, which is the most flexible and which least?

为了获得这些结果关联性的印象,这里有个人类prion蛋白质1qlz 的RMSF,图中会导致CJD疾病的突变残基被标示出来。

现在来看看两个pdb文件,把它们读入Pymol。然后根据b-factors给结构文件bfactors.pdb上色,检查柔性区域。平均结构是非物理结构。看看其中的一些侧链,并注意平均结构对其构想的影响。 pymol average.pdb bfactors.pdb spectrum b, selection=bfactors

颜色分布在b-factor范围内,蓝色代表最低(最稳定),红色代表最高(最易波动)。你可以减少最大值来调整颜色范围,如设为500:

Q = 500; cmd.alter(\q

以下图像显示的是人类野生型UbcH8蛋白根据模拟计算得到的b-factors上的颜色。蓝色是低,红色是高。白色区域表示目前已知的能够反转蛋白质相互作用特征的残基。在图像右侧,你可以看到那些在Helix 2前后的loops有较高的b-factors。第二个图像是helix 2前loop的放大显示。