==Q== What can you say about the interactions? The residues K60 and D88 are highly conserved and the single mutation of residue D56 toward E56 in UbcH8 modify its interaction profile. What could be the cause of that? Compare your graphs with the ones generated by your co-group colleagues.
现在回到你的工作目录: cd ../
二级结构
蛋白质结构最常需要判断的是二级结构,如α-螺旋和β-折叠的确定,一个可以用来做出判断的命令是dssp。此程序不在gromacs发行,但是可以在CMBI(Radboud University)得到。Gromacs确实为dssp提供了一个交互界面,允许对每帧轨迹计算二级结构: cd ~/Desktop
wget
ftp://ftp.cmbi.ru.nl/pub/molbio/software/dsspcmbi.tar.gz tar -zxvf dsspcmbi.tar.gz
setenv DSSP \
do_dssp -f traj_nojump.xtc -s topol.tpr -o secondary-structure.xpm -sc secondary-structure.xvg -dt 10 secondary-structure.xvg文件包含一个时间序列,列出了每帧中与各种二级结构有关的残基数量。更详细的信息在.xpm文件中,它对每个残基一段时间的二级结构用颜色表示出来。.xpm文件能用类似Gimp等软件进行观察,但是一些有用的元数据可以用gromacs工具xpm2ps加入,结果可以用gview或类似程序观看。For locals, do note the similarity between the plot and the front of the new building of the Hogeschool Utrecht.
xpm2ps -f secondary-structure.xpm -o secondary-structure.eps gv secondary-structure.eps
==Q== Discuss some of the changes in the secondary structure, if any. ==Q== Compare the stability of the secondary structures in the different proteins.
拉氏图
蛋白质骨架的phi-和psi-扭转角是两个对于深入了解蛋白质结构特性非常有用的参数。对phi-相对psi-角度作成的图称为拉氏图;拉氏图的某些特定区域反映了蛋白质二级结构单元或氨基酸的特性,(而这些区域)之外的区域被认为是不可能出现的(不可到达)。phi/psi角随时间的变化可以反映结构的变化。这些叫可以用g_rama程序计算,虽然方式有点粗略,因为它把所有的东西一股脑儿放在一个文件里。为了观察单个残基,可以用linux程序 'grep'从图中选出来。
g_rama -f traj_nojump.xtc -s topol.tpr -o ramachandran.xvg 此文件包含所有残基所有的phi/psi角。为了提取某个残基(例如LYS-60)的角度,输入:
grep LYSH-60 ramachandran.xvg | awk '{print $1 \rama-LYSH-60.xvg
用这个提取后面的拉氏图,并用xmgrace观察。PDB结构中,残基82-86被归为螺旋。看看你的模拟结果,现在还是不是这样?
==Q== What can you say about the conformation of these residues, based on the ramachandran plots (see the plot given above)?
动力学和时间平均特性的分析 又是RMSD
均方根偏差(RMSD)在模拟的收敛性中已经算出来了,但是它也可用于进一步的分析。RMSD是两个结构之间的比较值。如果我们对轨迹文件中的结构各个合并,计算RMSD值,然后就可以看看是否有属于同一类型或有共同特征的结构组。这些结构中,属于同一组的有较低的RMSD值, 而与其它结构相比则有更高的RMSD值。用矩阵形式表示RMSD值,这也可以用来确定过渡变化。
为了建立RMSD矩阵,调用g_rms命令和两条轨迹。本教程中,我们采用同一条轨迹。我们在轨迹文件中每隔一帧提取一次,生成了1001x1001矩阵。选择组合\
==Q== What is interesting by choosing the group \for this analysis? Think about the different proteins used for this practical. g_rms -s topol.tpr -f traj_nojump.xtc -f2 traj_nojump.xtc -m rmsd-matrix.xpm -dt 10
得到的矩阵是灰阶图。为了看得更清楚,我们可以采用彩色梯度图: xpm2ps -f rmsd-matrix.xpm -o rmsd-matrix.eps -rainbow blue gv rmsd-matrix.eps
==Q== How many transitions do you see?
把你的和你同组同学的轨迹相比较,也是非常有趣的。请重复相同过程,但采用-f和 -f2选项,对不同的轨迹运行g_rms。你应当和你的组员共享你们的工作结果,那么将会有6种组合可能性:
? ? ? ? ? ?
UbcH6_wt vs UbcH8_wt UbcH6_wt vs UbcH6_E56D UbcH6_wt vs UbcH8_D56E UbcH8_wt vs UbcH6_E56D UbcH8_wt vs UbcH8_D56E UbcH6_E56D vs UbcH8_D56E
==Q== What can you conclude from this analysis? Could you expect such a result, justify?
簇分析
在结构间距离的基础上,这些RMSD也可以归并为一些反映构象可及性和每个RMSD相对权重的簇。用一个簇算法可以完成这个任务,g_cluster包含多个簇算法。该程序产生多个输出文件。查看帮助文件了解它们的含义,然后运行这个程序。注意,我们已经算好了RMSD矩阵,可以把它作为g_cluster的输入。 g_cluster -h
echo 6 6 | g_cluster -s topol.tpr -f traj_nojump.xtc -dm rmsd-matrix.xpm -dist rmsd-distribution.xvg -o clusters.xpm -sz cluster-sizes.xvg -tr cluster-transitions.xpm -ntr cluster-transitions.xvg -clid cluster-id-over-time.xvg -cl clusters.pdb -cutoff 0.1 -method gromos -dt 10
==Q== How many clusters were found and what were the sizes of the largest two? ( T )
改变cutoff值,得到适当数量的簇 (10 < Nclusters < 100)。 用pymol打开文件clusters.pdb,比较前两个簇的结构。 disable all
split_states clusters delete clusters
/for i in range(3,100): cmd.delete( \dss
show cartoon
util.cbam clusters_0002
align clusters_0001 and ss h, clusters_0002 and ss h ==Q== Are there notable differences between the two structures?
距离RMSD
采用RMSD 比较结构的一个不足之处是,它包含了最小平方拟合,这会影响结果。一个蛋白质的结构也可以用一套原子间距离来表示。这也可以用来获得一个比较量,这个比较量不依赖于拟合,这就是距 RMSD (dRMSD)。可采用g_rmsdist程序:
g_rmsdist -s topol.tpr distance-rmsd.xvg
-f
traj_nojump.xtc
-o ==Q== At what time and value does the dRMSD converge and how does this graph compare to the standard RMSD?
原子间距离分析,模拟得到的NOE's
上面用到的g_rmsdist程序也可用于进一步的举例分析。特别地,为了了解结构及其稳定性的,通过查看原子间的平均距离及其这些距离波动可能会有用处。对蛋白质中的每对原子的平均距离和距离波动进行计算获得矩阵,用上面的步骤给影像重新上色,并显示.png文件的结果 (rmsmean.png和rmsdist.png).