蛋白质晶体学简介(根据牛津大学Stuart教授的讲义译编) 下载本文

目录

1引言………………………………………………………………………………………………1 2蛋白质测定的基本步骤…………………………………………………………………………2 3结晶………………………………………………………………………………………………4 4数据收集…………………………………………………………………………………………7 5相位测定…………………………………………………………………………………………11

6相位改善及扩展………………………………………………………………………………15 7电子密度图的解释……………………………………………………………………………16 8修正……………………………………………………………………………………………17 9相关的信息……………………………………………………………………………………19 参考文献…………………………………………………………………………………………19

1.引言

蛋白质及其复合物、组装体完整的三维结构的测定是研究生命活动中分子结构与功能关系,揭示生命现象的物理化学本质的科学基础。蛋白质及其复合物晶体的X-射线衍射是研究生物大分子三维精细结构的最主要的手段之一。在人类基因组全序列测定顺利完成和―后基因组时代‖(Post-genome era)到来之际,生命科学的中心任务是揭示基因组的功能,并在此基础上阐明遗传、发育、进化、功能调控等基本生物学问题,以及进一步解决与医学、环境保护、农业密切相关的问题。由于基因的功能最终总是通过其表达产物-蛋白质来实现的,因此,要了解基因组全部功能活动(包括正常的和异常的),最终也必须回到蛋白质分子上来。目前,我们还不可能只用基因组DNA的一维序列预测生命活动的机理(mechanism)和途径 (pathway),也难于仅用基因的信息去解释疾病发生与发展的分子机理。显然,在人类基因组测序完成之后的时代,在有关生命活动整合知识的指导下,以蛋白质及其复合物、组装体为主体的生物大分子的精细三维结构及其在分子、亚细胞、细胞和整体水平上的生物学功能的研究是生命科学的重大前沿课题,也是当前生物学领域中最具有挑战性的任务之一,在后基因组时代生物学发展中处于战略性的关键地位。

蛋白质晶体学是一门十分活跃的边缘学科,60年-1997年之间已经有12名蛋白质晶体学家荣获诺贝尔奖。蛋白质晶体学不仅与生物学、医学有着密切联

系,它的发展也需要物理学、化学数学等学科以及计算机科学作为它的基础。蛋白质晶体学也是一门发展很快的年轻学科。从1934年Bernal得到胃蛋白酶单晶衍射照片算起,也仅有66年的历史。但无论从结构测定的方法还是从结构测定所用的仪器都有了飞跃的发展。多对同晶重原子置换法(MIR)的提出,使蛋白质晶体结构分析在方法上有了重大的突破;以后又有了分子置换法(MR);由于可变波长的同步辐射加速器的应用,近年来又发展了多波长反常散射法(MAD)。随着科学技术的发展, 高速大容量计算机的出现, 在衍射数据的收集方法上经历了一个否定之否定螺旋式上升的发展。从最初的有层线屏的底片法,到以后有计算机控制的逐点收集的衍射仪法, 到目前有各种形式的面探测器,大大加快了衍射数据收集的速度。X-射线光源的强度也有了极大的提高, 第三代同步辐射加速器,结合Laue法的应用, 使晶体学出现了一个崭新的领域,研究时间分辨的动态晶体学。因此, 以一章的篇幅, 把蛋白质晶体学作一个全面完整的介绍,那是很困难的。牛津大学Stuart教授是国际上最著名的结构生物学家之一,笔者聆听过他在牛津大学的―蛋白质晶体学讲座‖,他以他多年来在该研究领域成功的经验、独特的手笔介绍了该领域的基础本概念和最新方法。正因为如此,并征得他本人同意, 本讲义将他的讲稿为主,而不另写(也因为限于笔者的水平)。希望读者建立起对蛋白质晶体学这门发展中的学科的正确的、国际规范化的全新的概念,为此,本讲义还将附加中英文专业术语解释;同时了解当前最新的研究方法,特别是在实际应用中的经验和特别需要注意的问题,这一点与其它同类书籍有着很大的不同,这不但对于正在从事生物大分子晶体结构测定的研究人员也具有极其重要的参考价值,同时可以作为其他相关学科对蛋白质晶体学有兴趣的本科生、研究生和科研人员的入门书。此外,蛋白质结晶学是一个专业跨度较大,同时专业性又非常强的领域, 因此, 本讲义仅仅是试图让大家建立起对蛋白质结晶学这门学科的正确的概念,同时也概括了当前研究中最新的方法以及必要的基本原则。更详细的参考书、有关结构解析的程序包、网页地址、有关国际组织及数据库的分类在讲义的最后部分中列出。

2蛋白质结构测定的基本步骤

X射线晶体学可在原子或接近原子的水平上分析蛋白质的精细三维结构。3?以上分辨率的蛋白质精细结构可提供丰富的信息, 如特定原子的位置, 它们之间

的相互关系( 如氢键等),溶剂的亲和性及分子内柔性的变化等。目前,应用X射线晶体学技术可以测定分子量达到107D级的全病毒.和2.5x106D级的核糖体。其关键在于是否能够获得高度有序的蛋白质晶体

X射线晶体学研究通常采用的X射线波长与化学键键长相当, 也与晶体内的原子间距离相应,约为1?左右。一个晶体包括上亿个有序排列的基本单元( 如一个蛋白质分子); 在晶体的所有重复单元中,每个原子的核外电子对X射线散射的波形是可以叠加的。

散射可通过傅立叶综合计算重复单元 (蛋白质等) 的电子密度图。然而电子密度图的计算必须得到散射光束的振幅( 可直接测量) 和它们的相位(不能直接测量, 因而存在相位问题)。蛋白质结构测定主要包括以下几个过程:

第一步结晶:需要通过大量的条件筛选和优化以使蛋白质分子间的弱相互作用促使蛋白质分子形成高度有序的晶体而不是随机聚合形成沉淀。这就要求溶液中的蛋白质处于过饱和状态, 并只形成少数的成核中心, 使晶体能持续地慢慢地生长成大单晶。

第二步数据收集:通常利用( 单波长) X射线光束照射在一定角度范围内旋转的蛋白质晶体,同时记录晶体对X-光散射的强度。这些强度可转换为结构测定中的结构因子的振幅(|Fhkl |). 此外, 在Laue法中, 晶体通常保持静止而使用连续X光波长(白光)收集数据

第三步相角的测定:结构因子的振幅(|Fhkl |)及相角(?hkl )是物理上相对独立的量。由于结构因子相角的全部信息在收集数据时丢失, 因此必须通过其它途径来得到它们的数值。除结晶外, 相角的测定在结构分析中仍然是一个问题最多的部分。

第四步相角的改进(优化):电子密度图的质量及其后的可解释性主要决定于相角的准确性。有的情况下采用晶胞中不对称单元中的等同部分(例如,一个以上的等同分子)的电子密度平均,有可能大大地改善误差较大的起始相角。

第五步电子密度图的解释:相位确定后,可开始计算电子密度图. 若从电子密度图能跟踪出肽链走向和分辨出二级结构(如基于高分辨率的数据, 通常这意味

着衍射数据的分辨率至少达到3.5?), 则可能推出多肽链的三维折叠方式。进而根据氨基酸序列,就可能构建出原子坐标形式的蛋白质结构模型.。

第六步修正:考虑到已建立的立体化学资料(如键长, 键角等) 的限制, 根据X射线衍射数据对初始的蛋白质分子模型进行修正。

3结晶

蛋白质结晶技术的综述请参看参考书5-7。通常只需要毫克级的均一的蛋白纯品( 通常纯度至少超过95%)便可进行蛋白质结晶研究。最初的条件实验一般需要1-2mg,但最终得到解析出蛋白质结构所需的数据,可能需要几毫克或更多的蛋白质样品。在摸索晶体生长条件时应考虑分子生物学家或蛋白质化学家所提示的溶液中影响蛋白质稳定性及构象的各种因素;尽量避免蛋白质样品的反复冻融,已经证明许多蛋白冷冻干燥处理后对结晶不利;使用5-50mg/ml甚至更高浓度的蛋白质溶液,一般来说, 浓度越高, 效果越好, 至少起始时是如此。不过也有浓度为2mg/ml蛋白质结晶的先例;过滤蛋白质溶液, 缓冲液等, 清洁任何玻璃或塑料表面上的尘粒 (光学商店清洁镜头的除尘器效果很好), 以最大限度地减少成核中心的数量。

摸索蛋白质结晶条件最常用的方法是应用汽相扩散技术的悬滴法(图1a). 因为此法不但可节省样品而且可有效利用储存空间。此法是使任何挥发性的组分在小液滴和大样品池间达到平衡,使蛋白质液滴中沉淀剂及蛋白质的浓度逐渐增加, 达到过饱和状态,最终析出晶体。晶体生长的基本装置是Linbro多孔组织培养板及用二甲基二氯硅烷硅化后的玻片或塑料盖玻片。

悬滴法长晶体包括以下四个步骤:

第一步, 在作结晶实验之前,最好对蛋白质样品进行离心,以除去不溶解的蛋白和杂质,以减少不必要的成核中心, 此外,对蛋白质样品进行超滤,也是值得推荐的。

第二步, 采用―吹气法‖除去培养晶体用的组织培养板和盖玻片上可能带有的灰尘。

第三步,在组织培养板的孔中加入0.2 - 0.5ml经过超滤的含沉淀剂及添加剂的缓冲液,作为池液, 孔边缘涂上真空脂。

第四步, 吸1ul或2ul池液放到硅化后的盖玻片上, 加等体积蛋白溶液至此池液上 (这个体积比将决定平衡后的蛋白质浓度),混合均匀,应避免气泡出现。

第五步, 翻转盖玻片盖在孔上, 检查密封是否良好。

上述方法中步骤2和4目前己可在自动化仪器中进行(8), 但是, 绝大部分拥有该仪器的实验室最终还是乐意采用手工方法。起始的条件实验常在感兴趣的区域(通常低于沉淀蛋白所需的浓度)进行,然后再进行实验条件的优化。一般的,蛋白质晶体生长所需的硫酸胺等沉淀剂浓度在理想浓度的1%或2%偏差范围内, 但对于不同分子量的聚乙醇胺(PEG)则可宽松一些。晶体在数小时至数月后出现。通常,微晶可用作晶种以长出合用的晶体(9)。汽相扩散法的另一种形式是坐滴法(图1c), 坐滴中含池液和蛋白溶液各1-2ul。此方法对于以下情况非常适用:即使用非离子去垢剂作为添加剂表面张力较低时;或用PEG或乙醇作为沉淀剂 (由于凝结等问题, 悬滴体积趋于增大)时;反向扩散导致液滴增大时;或结晶条件已确定, 需要大量晶体时。除汽相扩散技术外,微量透析法(Dialysis buttons from Cambridge Repetition Engineers)和微量批处理法(Douglas Instruments Ltd) 也是值得了解的。.

由于多种因素的影响, 蛋白质结晶仍是一门艺术。表1列出了一些目前经常用到的进行蛋白质结晶的基本条件和思路。硫酸胺, 二甲基-2,4-戊烷二醇(MPD)及PEG 4000是初次结晶时经常使用的沉淀剂,在参考书7中列出了用这些沉淀剂进行的一些研究项目,表1中列出的很多方案在参考书5-7中都有介绍。应用不完全因子法筛选实验条件的子集合方法目前在几个实验室经常使用(Hampton Research)(10)。动态光散射法目前已被发展用于监测潜在的结晶条件,可以作为摸索结晶条件的辅助工具(11)。当单独的蛋白质不能结晶时, 往往能与其抗体(Fab片断)以及其他生物大分子共结晶(12)。非离子去垢剂可辅助几个完整膜蛋白的结晶而大大拓宽了晶体学的研究领域(13,14)。糖基化位点较多的蛋白也需要特殊考虑,一个方法是使用神经氨酸酶的处理方法以降低糖基化水平。最近有建议使用甘油作为辅助溶剂以帮助柔性较大的蛋白结晶(15)。然而分子内的高

柔性常常迫使人们使用截去蛋白的N端或C端(柔性过大的部分)以后再进行结晶。

在初次出现晶体时,往往需要回答以下两个问题:

1. 是盐晶体吗? 盐晶体通常具有很高的双折射和很高的密度, 硬玻璃样的外表, 因而易于区分;用衍射来鉴定,它在高分辨率下 (通常6?下什么也没有) 只有少数几个很强的衍射点。

2. 其次是它们能给出有用的衍射吗? 遗憾的是宏观观察时很有序的(甚至是双折射)的真正蛋白质晶体可能在微观上仍不够有序而不能衍射, 或只能达到较低的分辨率(低于4?),形成多晶或双晶的晶体当然是无法使用的。根据我们的经验, 添加剂如β-正辛基?-D-吡喃型葡糖(苷)甙 (β-octyl glucoside) 可能有助于消除孪晶的问题(16)。

表1: 结晶实验中的常用条件和思路 沉淀剂

盐: 硫酸胺, 甲酸胺, 柠檬酸钠

PEG: 400, 4000,3000, 6000,8000, 20000 有机溶剂: MPD, 乙醇 (4?C, 很难避免其蒸发) 混合物: PEG+0.5-1M LiCl或NaCl, 盐+2-4%有机溶剂 添加剂

0.25%-1% 非离子去垢剂如β- 正辛基?-D-吡喃型葡糖(苷)甙 (β-octyl glucoside)

二氧六环 (Dioxane) 金属离子如Ca2+, Zn2+ 还原剂: DTT 甘油

可变条件 pH 缓冲液类型

温度: 通常尝试5?C和20?C

结晶环境: 重力或微重力 (太空中结晶, 很费钱!) 共晶生长试剂 抑制剂 辅因子 底物

单克隆抗体片断(Fabs) 蛋白样品的变化 采用限制性蛋白酶酶解

采用基因工程方法修饰N端或C端(如截短) 采用不同种类的蛋白或突变体蛋白 采用不同表达系统 (如―对付‖糖基化等)

通过测量蛋白质晶体的密度可计算晶体中溶剂所占体积的比例及不对称单元中蛋白质分子的数目。测量可采用蔗糖密度梯度法,对于含溶剂较多的晶体,由于蔗糖掺入晶体内, 必须进行相对于时间进程的一系列密度测量, 这样才可推知时间为零时的正确密度。

方法2:相对于时间进程的晶体密度测定方法步骤如下

1. 制备浓度梯度为5%的从10% (w/w) 到60%的蔗糖溶液系列。 2. 从高浓度到低浓度一层一层地铺在超离心管中,对溶液加热可以增加流动性,因此可能有助于这一步实验的进行。

3. 使用范围在1.05-1.25g/cm3 的已知密度的二甲苯或溴苯进行校正。在梯度中加入一系列已知密度的小液滴, 在水平转头中离心(30‘s, 多少转?),即可确定梯度标记图。

4. 在梯度中加入一个晶体, 离心30秒测量位置,然后推算出密度, 随后以几分钟为时间段进行重复测量。

5. 将测量结果拟合为一次指数函数的形式并外推获得时间为零时的晶体密度数值.

假设蛋白质的一个典型蛋白质结构部分具有特定的体积为0.74cm3/g, 可用下式进行计算:

Mp[Da] =2.324(v/n) [?3]{?c[g/cm3]-1}

V: 单位晶胞体积 n: 单位晶胞内不对称单元的数量 ?c: 晶体密度 Mp:不对称单位的蛋白质质量

4数据收集

采用同步辐射加速器光源收集数据,体积为0.1x0.1x0.1mm3或更小一些的有序晶体已足够。在一般实验室里用旋转阳极作为X光光源收集数据,则需要较大的晶体。蛋白质晶体通常装在适当内径的玻璃或石英毛细管中 (Astrophysics Research Ltd.), 见图2a。参考书20中给出了详细的晶体操作注意事项。易碎的平板样晶体可装在特制的扁平毛细管中(20)。

如计划在数据收集过程中浸入底物则可将晶体装在一个流动的小盒中(20)。室温下,晶体在X射线照射下会受到损伤,影响它的寿命。在低温条件下收集数据,将会延长晶体寿命,提高数据的质量。高盐环境中生长的晶体,通常冷冻至–10oC不会有不良影响。在低温条件下收集数据,可用Cryo装置。通过表面张力将晶体悬置在一个薄金属圈限定的液滴中(22), 然后,将晶体快速冷冻至液氮温度(通常在100K左右), 这样可大大延长晶体寿命(23), 见图2b。但使用者必须预先评估特定的晶体在实现这个过程中经常遇到的困难与使用此法的益处。

只有为每一个新蛋白质晶体建立一个最佳的条件(主要是选择合适的冷冻保护剂)才能真正地受惠于低温数据收集。一些对温度变化特别敏感的晶体,必须严格在其生长温度的环境中安装。图2a

图2b

进行酶作用机理研究的时间分辨结构测定工作要求数据收集的速度能够跟得上反应速度。这时可用极高光通量和准直度的同步辐射加速器作为X-光光源,并用Laue法(白光)收集数据,以满足其速度上的要求。总而言之, 数据收集是一个较为专业化的领域, 在这里就不再论述了。

表2列出了与数据收集有关的资料,如X-光光源, 探测器及数据收集方法等。封闭管是最弱的X射线源,目前大多数实验室使用旋转阳极或同步辐射加速器作为X-光光源。同步辐射加速器的优点是:

1. 首先是具有高度平行的强光束。这对于具有较大的晶胞及高分辨率数据衍射能力弱的晶体是很必要的;

2. 其次是它的波长较短,同步辐射加速器X-光光束波长一般小于1?。短波长可以减少吸收,有利于延长晶体寿命。

3. 第三是波长可调性。这对于Laue法数据收集及单晶的多波长反常散射法(MAD)很重要。与铜靶相比, 旋转金靶阳极具有X射线波长短的优点, 金靶的特征发射光谱包括了PtLIII的吸收边缘, 因而,一般实验室中的旋转阳极,MAD法可有一些应用 (参见参考书26)。随着工作波长在1?以下的探测器的使用, 应重新评价不同阳极材料的不同优点。单位晶胞很大(晶胞大于200?)的晶体的在一般实验室中的旋转阳极上的数据收集通常要求配备聚焦能力较强的Frank型棱镜系统。对于要求相对较低的一般实验室中的旋转阳极上数据收集, 我们现常用易于匹配且更富于变化的光学系统, 例如石墨单色器和平行光管。同样,随着新的探测器的应用, 我们应重新认真评价X光光学系统及在同步辐射加速器上应用的技术在一般实验室中的X-光系统上的推广和应用。

表2 数据收集 X射线源

密封管 旋转阳极 同步辐射加速器

X射线棱镜(一般实验室中) 镍过滤器 石墨单色器 Frank反射镜 光纤系统 X射线探测器 线性比例计数器 摄影胶片

外部带磷光体的电视区域监测器: FAST 多丝正比计数器: Hamlin/Xuong, Xentronics Imaging plates 图像盘 CCD 数据收集方法 衍射仪法 徊摆法

Laue法(白光辐射)

目前探测器主要有摄影胶片、电子面探测器、图像盘(Imaging Plate)以及CCD。

目前较为广泛采用的是图像盘或CCD,这两种检测方式可在较宽的X射线波长范围内提供较高的灵敏度及低背景, 适于衍射较弱的晶体。必须指出,在一

般实验室采用大面积、高分辨率探测器,需要新一代X-光光学系统去匹配才能有效益。

用回摆法收集数据是目前最常用的方法。下面就有关参数的选择提供一些参考意见:

1, 第一,准直光束的大小应与晶体的尺寸相当或略小;

2, 第二,晶体到探测器的距离应根据晶胞的大小来决定,晶胞越大距离越远,以保证衍射点不重叠;

3, 第三,回摆范围也与晶胞大小有关,晶胞越大回摆范围越窄,图像盘的回摆范围一般为10 __ 20 ,在不增加衍射点的重叠情况下,尽可能加大回摆角度。但对于电子面探测器应窄一些,以增加信噪比,一般为0.250或更小。

4, 第四,曝光时间取决于良好的统计计数与X射线光束下晶体有限的寿命之间的平衡,减少曝光时间可以相对多收数据,虽然数据可能会弱一点以至数据内部一致性会稍差一些, 但可能提供一套更为完整的数据, 减少某些系统误差;

5, 第五,一般以晶体的主对称轴为回摆轴收集数据最为有效 (可在最小的回摆范围收到全套数据);当然这些还与空间群、晶胞大小以及晶体外形有关。作为在实验室面探测器上进行日常数据收集的一种策略,故意设置晶体在1800旋转范围进行收集一段空一段(如150,再空150)的分段收集,可在相对小的旋转角度内收集到一套完整的数据。但在当需要反常散射测量时(因为后者需要在同一图上收集Bijvoet点对) 就不太适合了。

在常规的光束下使用回摆法时,位于旋转轴的附近数据一般来说是无法测量的。但如果使用较短的波长,可以减小旋转轴附近的不可测区域;另外将晶体的对称轴校准在离旋转轴几度的地方,即使晶轴略微偏离旋转轴,则倒易格子中的对称性经常允许记录与旋转轴附近对称性相关的数据,这也可减少盲区。

蛋白质可能的空间群见表3,晶体形态学常常给出晶体学轴的对称性和取向的线索,经典的空间群的初次鉴定通常在旋进相机上进行,但根据我们的经验, 在晶体轴的00, 900以及适当的话300或450回摆照相经常足以确定晶胞的大小

及晶体学点群(表3)。由原始数据的系统消光规律可以定义晶体的螺旋轴。我们认为首先是收集数据, 不要将非常珍贵的晶体浪费在了解晶胞的特点上,可在一个较低的对称空间群上处理数据,并检查可能的对称等效点。除非有相位

信息,许多对映体结构不能被区分, 如P3121和P3221。但这并不影响数据收集和处理。

数据处理一般包括以下几个步骤:

第一步指标化,以确定晶胞参数和格子类型。这一步现在经常采用自动指标化算法(29),以保证在X光束下晶体寿命不会浪费在晶体的定向上;

第二步预测全部衍射点的记录位置;

第三步整合 (现经常使用?profile fitting‘(30)): 包括预定点位置的强度测量及适当背景值的估算;

第四步对称等效点的比例因子的校正和平均、归并以给出一套独立数据,在此过程中,还需要校正随时间变化的晶体损伤及晶体外形不规则所造成的吸收效应的差别。

上述方案中,适当时候,也需要进行对探测器及光源依赖的校正。有的时候,需要进行特殊的吸收效应校正(31)。后修正(post-refinement)对于不完整衍射点(partiality)强度偏差的估计有改善作用, 尤其是在病毒晶体学中尤为适用(32)。强度数据最终统一后(scaling),一般情况下,所得到的强度的R因子的变化应在3%(良好的数据)和11%(很弱的数据)之间。衍

射强度的R因子定义为:

对于某些空间群 (见表3) 倒易格子的几何对称性比其强度的对称性高 (这样对指标的选择可能存在歧义), 因此,对于一个独立指标数据群可能要求在计算前进行指标操作,当格子表现出赝对称性时可能也是这样 (如两个几乎相同的晶胞尺寸)(33)。

数据收集过程中的晶体在毛细管中的滑动可能导致对该部分数据分开处理。一套完整的原始数据,它的完整度(completeness)应超过80%,而且缺失数据在

倒易空间中应随机分布;全部数据至少高于独立数据(即它的丰度redundancy)2-3倍以上,以便得到正确的比例因子,提高数据的精度。

数据的质量对结构分析中以后各阶段的重要性是不言而喻的,不过,如果因为数据的收集量大(redundancy高)而使得数据的Rmerge增加了一点并不是坏事,因为统计测量的信息量的真相将表现在最终的电子密度图中,在这种情况下最终的准确性将会提高。Rmerge作为分辨率函数的指标必须进行监测,很多人认为一个分析的最高分辨率的壳层的Rmerge不应超过25%,数据的完整性对初始相位及结构测定是很重要的, 而对于以后的差值电子密度图就不太重要了。对于非晶体学对称性, 差值电子密度图所需的数据部分可进行粗略估计,如对于五重对称, 一个(随机样品)的完整数据的1/5应就足够了。

5. 相位测定

在晶体中一个不对称单元中有多个相同的蛋白质分子时, 一些有价值的分子之间堆积的信息可直接从结构振幅计算得出,而不必要预先知道任何相位信息:

1. 例如自身旋转函数可检查分子间是否存在任何非晶体学对称轴问题。必须注意非晶体学与晶体学旋转轴的平行将会掩盖这类峰的信息,高对称性的空间群往往容易产生背景嘈杂的函数;

2. 计算低分辨率的 (如15-7?) 的母体(native)Patterson函数以检查不对称单元中的简单平移关系。例如晶体学及非晶体学对称操作的组合使分子方向不变而产生一个沿晶轴的平移。

晶胞中分子堆积的这类基本信息对解决一些疑难的相位问题会有很大的邦助,下面分别介绍获得相位信息的三种主要方法。

5.1 单对或多对同晶置换法(SIR/MIR)

这是目前最常使用的方法,该方法的基础是以测量重原子 (常为金属) 结合到蛋白质分子上有限的几个特异位点时而导致的衍射强度差(变化)。常用的试剂列在表4中,详细的使用在参考书34中有讨论。由于这些试剂毒性都很大,处理时一定要严格按规定的方法进行。制备重原子衍生物晶体,一般采用将母体

晶体浸在重原子溶液中,重原子化合物的常用浓度范围为1mM-10mM,浸泡时间可从数小时到数天,浸泡条件的摸索尽量用小晶体作试验,记住大晶体必须用于数据收集。浸泡过程中要注意观察,首先必须保证浸

泡于重原子溶液中的晶体不出现裂痕。重原子衍生物晶体也可尝试用共晶生长法(Co-crystallization)来制备。

表4:常用的重金属化合物:

Platinum compounds:K2PtCL4,K2Pt(CN)4 Gold compound:KAu(CN)2,NaAuCL4

Uranium compounds: Pb(NO3)2,UO2(CH3COO)2

Lead compounds: Pb(NO3)2,Pb(CH3COO)2,trimethyl lead acetate Rare earth: lanthanide and samarium salts

Mercurials: p-chloromercurri benzene sulphonate (PCMBS),ethylmercury phosphate(EMP),mercuric acetate,mersalyl,1,4-diacetoxy mercuri-2,3-dimethoxybutane (Baker‘s dimercurial)

Complex ions and clusters: K2HgI4 in excess KI, tetrakis(acetoxymercuril) methane(TAMM),[[W3O2(O2CCH3)6](H2O)3](CF3SO3)2(WAC) 蛋白质分子中某些化学基团在传统上是重原子衍生物制备的首选对象, 如游离的巯基, 在参考书34中有讨论。单一暴露的二硫键可被还原并掺入一个汞原子(35)。人们也试图用重原子簇来制备重原子衍生物,重原子簇具有较大的质量和特征的对称性,可与晶体的特定性质相匹配(36,37)。进行蛋白突变以提供理论上适于重原子结合的位点(如定点突变产生游离半胱氨酸,谷氨酸()38)。然而有用的重原子衍生物的获得仍有赖于运气的好坏,晶体颜色或密度的改变可对重原子是否结合提供一些提示,但最终仍要依赖于X射线的数据收集。将母体和衍生物晶体的数据相比较:

1. 如果晶胞大小变化很小,且平均强度变化不随着分辨率的变化而增加,则两者的同晶度较好;

2. 一个好的重原子衍生物它与母体平均强度差异应大大超过随机噪声的本底。一般说,每17KD蛋白的一个高占有率的汞位点可在母体和衍生物间的结构因子振幅上产生大约25%的平均差异. (见图3);

图3:

每个重原子衍生物可收集一小部分衍射数据(较低分辨率)来判断其是否有用。然后对那些有希望的样品进行全套数据收集(高分辨率)。对不同晶体的同一种重原子衍生物数据一起合并要十分小心, 因为重原子的占有率可能不同, 需要对每一套数据分别进行重原子修正(39)。

所以,最好能从一个晶体中收集一套完整的重原子数据。在统一重原子衍生物与母体数据(Scaling)时也应注意各向异性的比例因子的影响(39)。重原子的反常散射信息在消除位相的双解上是很重要的,即使反常散射信号往往比同晶差值小一个数量级(见5.3及图3)。成功的反常散射信号的取得主要决定于数据收集和统一时的精度。相关系数是评价反常散射差值可*性的一种简单的指标(39)。

对于低对称性空间群的晶体,如果不对称单位内仅有一个或二个重原子位点, 差值Patterson图的Harker截面上几个强峰能立即确定为重原子峰 (Patterson函数的解释可见教科书, 如参考书4)。

重原子峰不太明显的情况时,计算各独立分辨率范围的差值Patterson图,通过图间的比较可能有助于典型峰的确认。从我们的经验来看, 在两个类似图谱间基于2?以上的峰,计算简单相关函数可作为其有用信息含量的一个指标。对于特别复杂的例子,自动Patterson搜索程序非常有效(如参考书40)。由于差值Patterson图是用数据对的差值的平方来计算, 少数大的差值可造成灾难性的后果, 因此去除数据中差值过大的部分(差异大于平均差异的三倍)是很重要的。我们也建议将原点去除作为一种标准操作程序。

由于傅立叶级数系数的―断尾效应‖,在原点峰周围会造成波动,这可能掩盖图中的真正峰。锐化(sharpening)结构因子振幅的观测值可能有助于解释难度较大的图。具有高对称性和(或)高非晶体学对称性的差值Patterson图比较复杂,但这一定要与不能提供正确相位的低质量衍生物的直接噪音相区别。打印出预测的Patterson峰去和实际的Patterson峰进行对比,往往可以帮助解释复杂的差值Patterson图。

重原子位点的坐标可被改进, 并可通过重原子修正程序获得占有率及温度因子的数值。重原子的修正用结构因子或结构振幅。相位修正使用所有可能的信息, 应成为首选方法。然而, 对于单一衍生物而言, 振幅的修正更为有效,根据我们的经验,对应Patterson图的简单修正效果很好。如果能得到多个衍生物或反常散射数据, 相位的修正会更好一些.。由于相角的限制, 中心对称反射在这个阶段特别有价值。遗憾的是重原子修正会增加由于偏差而导致的问题,尤其是对于非中心对称的衍射点。所以用?眼睛‘检查修正是否确实合理改善了差值Patterson图的一致性是很重要的。衍生物的一个主要位点确定后, 得出的相位结果可用于差值傅立叶分析寻找同一衍生物其余次要位点或解决其它衍生物的重原子位置 (同样的,也可检查解出的重原子位置在自身Patterson图中是否有所表现)。

下列各步可提供进一步的检查:

? 检查原始差值Patterson图上所有主要峰的吻合程度;

? 采用约缺傅立叶差值图(Ommite map)检查相位的故意约缺部分的正确性;

? 蛋白质电子密度图的可解释性 (最终实验!)。

一般情况,好的重原子衍生物的蛋白质相位的最终平均品质因子值应为0.6或更好,平均品质因子值降至0.3,则意味着相位信息需合理权衡才能与其它衍生物的相位合并使用,或可用第六部分介绍的方法改善。按分辨率壳层监测重原子衍生物的相位力(phasing power)(即重原子结构因子振幅/平均闭合误差(mean error of closure)),一旦这个数值小于1, 通常认为这个重原子衍生物不再有相位力(也有例外)。总的相位力大于1.5时意味着是一个有潜在使用价值的重原子衍生物。

用单对同晶法解决相位时,相位的双解问题,可用反常散射分量(见5.3部分)和溶剂扁平化(solvent flattening)来解决。在没有反常散射时, Friedel点对(hkl和-h-k-l)强度相同, 因此, 甚至在多个同晶重原子衍生物存在时,仍可能有两种明显(―手‖型)为同样有效自身一致的重原子位点(x, y, z或-x, -y, -z)。利用反常散射信息可正确地选择―手‖型。如手型错误的话,?螺旋电子密度图看起来将像左手螺旋; 交换―手‖型即可改正过来(注: 对于对映空间群也涉及与―镜像‖空间群的交换)。

5.2 分子置换法(MR)

分子置换法是使用一个已知的三维结构作为一个粗略模型,计算被观察的未知蛋白质结构的结构因子振幅的起始相角。当然, 这要假定二者结构上很相似。因此只有当蛋白质与一个已知三维结构的蛋白质的氨基酸序列同源性很高(通常至少为30%同源性, 50%以上更好)时才能使用这个方法。一个例外是病毒家族如微小RNA病毒, 尽管序列很不相同, 其中的衣壳结构却很相似。如果大分子复合物其中一个已知组分包括了复合物相当的一部分(超过33%), 则该组分可能就足够了(BTV结构为例)。

如能为同源结构家族建立一个―平均‖结构作为起始模型可能更为有利。已知的结构模型必须正确放置在未知结构的晶胞中。如果两个结构相似的话, 它们的Patterson函数也应相似。对于一个蛋白质晶体的Patterson函数是计算晶胞中分子内向量在原点周围的分布。因此在原点周围的Patterson函数分析可决定模型的取向(采用旋转函数)。考虑分子间向量后可决定分子在晶胞中的位置(采用平移函数)。使用分子置换法一般分以下三个步骤:

第一步计算交*旋转函数指出分子的正确取向。在不同分辨率范围内重复进行计算以检查峰的重复性。计算中试用几个不同的积分半径,但积分半径不应超过未知分子预期尺寸的一半, 尤其是必须小于晶胞最短的尺寸,以避免侵入邻近的原点峰。

P1模型晶胞的尺寸应远远大于模型分子 (以避免分子间向量对Patterson函数的干扰) 。观测结构因子的锐化(sharpening)可能对峰的解释有好处。

第二步将模型以―正确‖取向放置在真实的晶胞中,(请特别注意原子坐标的正交化的变化情况!)重新运行交*旋转函数 (相对旋转现在应为零) 进行检查。由于第三步对取向的准确性非常敏感, 应注意获取可能的最优数值,如果几个数值看起来都同等有效,每一个都要尝试第三步。最近设计了一种相关系数修正 (基于将观测值和计算值的Patterson系数之间的一致性最大化) 的简单方法,可以用于修正大量最好的交*旋转函数的解。这一方法的出现提供了一种自动、可*的方法去筛选和改进大量的交*旋转函数的解。

第三步计算平移函数以寻找模型分子在晶胞中的正确位置。, 可根据R因子和相关系数的标准来判断。一般相关系数比R因子具有更高的灵敏度及可*性。

在实际应用中,不对称单元中存在多个未知分子使计算分析的难度增大, 除非这些分子之间的相对位置已知。在研究模型中加入分子间的相对位置信息对于结构解析会有所帮助 (如对于二体, 三体或四体,尝试低聚物模型)。该方法的应用成功与否可能主要取决于所用的模型,一般情况下,成功的MR方法的范例,其模型分子和未知分子之间的r.m.s.的偏差不大于1?。其他值得注意的有:

1, 对于铰链型结构, 如Fab, 在铰链处断裂, 可将两个组分作为两个独立的模型对待(参考书45介绍了一个可行的方法);

2, 另外删除多余的结构域、插入物或已知差别很大的部分,有利于获得较好的结果;

3, 在非常相似的结构或良好数据的情况下,往往用C?坐标就足够了, 但结果的背景会

杂乱一些。主链及对等的侧链原子可在C?坐标上参照已有的数据库自动建立。判断分子置换法的结果是否正确的标准如下:

1, 最常用而又简单的方法是考察晶胞中堆积的合理性; 2, 另外也可比较不同分辨率范围内结果的一致性;

3, 在多个亚基(分子)的情况下, 则考察亚基之间的关系是否与自身旋转函数中的结果吻合;

4, 如有重原子衍生物数据的话,用MR法取得的模型相位计算差值傅立叶图,图上应能揭示出重原子位点。然后对此模型进行刚体修正, 开始是在低分辨率下, 起始R因子应在59%以下(随机), 通常为50%,在修正过程中,这值应显著下降,修正可延伸至二级结构单元, 最后按第八部分介绍的进行全面修正。警告: 由于是以具有较大误差的起始模型的相位为基础,此时的修正很可能具有人为的倾向性, 所以在此阶段的修正及检查电子密度图的过程中必须十分小心(见第七和第八部分)。

5.3 反常散射及多波长反常散射(MAD)

重原子衍生物的反常散射通常作为单对同晶置法相位双解的一种补充信息。需要强调的是这种效应很弱, 即使是经典的反常散射数据使用也需要准确的测量。重原子修正过程中的反常散射数据统计应能够区分两个可能的重原子―手‖性位点, 如不能实现这一点,则意味着反常散射数据的准确度还不足以为相位确定提供有用的信息。使用反常散射直接确定相位信息还不标准化, 需要仔细的实验设计, 所以这部分只包括一些浅显的纲要, 有兴趣的读者一定要参看主要参考书。对于含金属原子的小蛋白分子,金属原子对整体结构振幅的贡献又占了相当比例(至少30%),金属原子的反常散射也能准确测定则可尝试通过部分结构加反常散射的方法确定相位。

对于大的蛋白分子, MAD法要求蛋白质分子中有一个金属原子和波长可调的同步辐射加速器X射线源,结果基本等同于完美的同晶置换法。由于此法依赖于衍射振幅非常小的数值变化,因此必须进行非常准确的测量,在数据收集时必须特别小心。同时或尽量同时(避免晶体损伤造成的误差)在同一张图像上收集Bijvoet点对;收集Bijvoet点对时为相同的光束路径照射晶体(避免不同吸收效果造成的误差);良好的统计计数(目前常用图像盘作为探测器,因为胶片模糊而电子探测器不稳定);用吸收边附近的波长收集数据,具有较强的反常散射效应。数据统一时必须特别小心, 局部的比例因子很重要, 出现反常差值异常差异过大或过弱的数据必须从Patterson函数中去除。

此法在金属蛋白中广泛使用, 对无金属的蛋白进行标记的一个途径是培养细菌以产生含硒代甲硫氨酸的蛋白质, 然而,这要求含硒代甲硫氨酸的蛋白质在

细菌中能够表达。当然,也可将重原子衍生物作为母体处理。目前采用含硒代甲硫氨酸的蛋白质晶体,或采用汞或铂家族的化合物作为衍生物的晶体进行MAD方法测定结构已经成为蛋白质晶体学最为常规的发法之一。

6. 相位改善及扩展

在此阶段我们可以考虑利用晶体的不对称单元中蛋白质的多个拷贝(非晶体学对称)或更经常由于晶体的溶剂含量(30-90%不等)所提供的信息。王必成教授的溶剂扁平化方法(Wang‘s solvent flattening)是目前改善相位的一个常规技术, 甚至对于溶剂含量一般(50%)的晶体,在溶剂区域的密度的限制提供了大量的额外的信息(51),而这些信息往往可以消除单对同晶置换法的相位双解,也可改善多对同晶置换法(MIR)的相位,产生一个可解释的电子密度图。原则上任何相位都可用此法进行改善,因此,近来的结构测定(52)常用此法大大地了改善分子置换法(MR)的相位 (从蛋白质复合物的一个组分的MR相位,计算初始电子密度图; 溶剂扁平化还应用于相应的差值图,可使90%的单位晶胞扁平化, 从而大大增加了未知蛋白组分的电子密度)。

使用溶剂扁平化方法时,以下经验可供参考:

1, 计算分子边界时使用足够大的收敛半径以―模糊‖电子密度图; 2, 不要过高地估计溶剂含量, 这可能截短蛋白质区域, 但应试图使用所有可能的溶剂;

3, 蛋白质内负区域的截短不能超过总蛋白区域的3%;

4, 每次分子边界计算后重复溶剂扁平化多次直至不再有相位变化; 5, 重复分子边界计算直至建立一个光滑稳定的边界;

6, 检查分子边界是否有意义, 重原子应处于蛋白-溶剂交界边缘, 蛋白质区应有连续性, 电子密度图中可见二级结构组分及非晶体学对称性;

7, 如初始相位特别糟糕, 在低分辨率下(如6?)开始, 然后逐渐延伸到高分辨率可能会有益;

8, 注意溶剂扁平化方法得出的品质因子数值往往高得不真实 (通常数值超过0.7),但相角是否确实有改进, 这只能根据蛋白质电子密度图来判断(不能相信溶剂密度图)。

不对称单元(如非晶体学对称)中有几个拷贝的分子进行平均或不同晶型的分子平均,也可用于改进电子密度图。特别是不对称单元中有大量重复部分时可用一套低分辨率的相位作为起始点, 这样abinitio相位可逐渐扩展到全部原始数据(53)。这方法相当复杂,需要占用相当多的计算机时间,使用时要小心。实空间对称平均的最适方法可参见参考书54. 有兴趣的读者可从参考书42中了解到的成功结构解析(主要为病毒)的过程和详细的介绍,对于寡聚蛋白的经验可参阅在参考书40。

为进行实空间平均, 需要建立: 1, 非晶体学对称轴的取向及位置; 2, 非晶体学对称性所适用的区域边界。

起始的非晶体学对称轴取向的初始估计可从自身旋转函数获得,或根据重原子位置及现有的电子密度图中得出。所得的初始分子取向信息往往需要*初始图中非晶体学相关点电子密度间的相关系数的最大化来修正 (如需要的话, 在极低分辨率下开始以改善收敛半径。

相位扩展必须在倒易空间逐步进行,以我们的经验, 约为倒易格子单位三分之一的一系列连续步骤就可从G函数计算出适当的数值(42)。从8 ?到4 ?的分辨率壳层一般含有可确定二级结构位置的信息, 也是倒易空间一个难以正确确定相位的区域。

必须严格注意R因子(收敛后典型的平均R因子值在12-20%之间)及相关系数, 最后检查电子密度图以监测进程。

7. 电子密度图的解释

用平均品质因子大于或等于0.6计算得出的电子密度图的质量较好,一般可以看到:

1, 6 ?分辨率的电子密度图中可见分子轮廓, ?螺旋表现为棒状, ?折叠表现为片状;

2, 3 ?分辨率电子密度图中, 多肽链能完全显现, 氨基酸侧链清晰可见, 羰基的膨胀部显现出来(可确定肽平面的连接) ;

3, 2.5 ?分辨率电子密度图未知氨基酸序列时可正确辨认50%的侧链, 多肽主链上的羰基膨胀部清晰可见, 就象紧密结合的水分子一样;

4, 1.5 ?分辨率电子密度图单个原子几乎都可解决, 水结构很清晰; 5, 1.2 ?分辨率电子密度图可见到很多氢原子。

已知氨基酸序列时,可在3?的分辨率下(在3.5时,要特别好的电子密度图)将蛋白质结构的电子密度图转为结构模型。早期用堆积画在薄塑料片上的电子密度图以建立初始的肽链走向,但目前用于电子密度图解释的主要工具是计算机图象工作站,由于新的方法的发展,过去流行的―mini map‖也趋于消失。程序的应用可以自动获得电子密度图并可获得分子的框架, 然后与初始密度相联系, 在图象工作站上人工进行连接或改进,从而产生一个粗结构模型, 在此基础上进行详细的电子密度图解释或模型构建。从数据库中输入已知的蛋白质结构信息对迅速建立一个立体化学上的可信模型提供了进一步的强有力帮助,在电子密度图解释的初始阶段, 一定要建立氨基酸序列与电子密度区域间的对应关系。因此将数据库中与电子密度图内二级结构长度相应的?螺旋或?折叠添加在图中,这些二级结构将提供结构的基本骨架。对于一个高质量的电子密度图, 这些区域可作为锚点,进一步按顺序联系到一起,给出多肽链折叠的明确解释。同样,来自于数据库的已有?转角等的模板在此阶段可提供有力的立体化学准则, 特别是对那些建立模型不熟的人。遗憾的是联系二级结构区域的无规卷曲(通常是柔性较高的)与电子密度的对应性很差, 这经常成为结构中不能很好确定的部分。对于一个新构建的结构, 检查它是否合理,最简单而又重要的标准是多肽链折叠不能形成一个结,侧链电子密度与序列较为吻合。也可考察重原子位置在化学性质上是否合理;还可与同源结构相比较,考察其保守残基和二级结构单元的保守性;检查氨基酸类型的环境是否合理,如大多数疏水性的氨基酸应埋在蛋白质核内,这也是一个证明。结构模型的基础是电子密度图, 记住这一点很重要, 只有电子密度图才能给

出真正无偏向的信息,其后的所有东西都存在于其中。如果计算电子密度图没有重大错误的话,在这个阶段敏锐的意识可能是极其重要的。根据电子密度图中可清晰解释的区域构建部分结构(例如蛋白质结构域)可提供其余的相位信息。因而采用相位组合方法(见第八部分)可产生一个更易充分解释的电子密度图。电子密度图解释与修正交替使用已证明是一个很有价值的策略(如参考书58). 用分子置换法解出的结构必须特别小心,因为在这种情况下的电子密度图从来都是有偏差的。在整个分子置换过程中模型缺省部分(如辅因子)的电子密度图质量,提供了基于MR相位的电子密度图真实信息的客观测量。

8. 修正

修正可以极大地改善蛋白质结构的精度, 因此在蛋白质结构测定中,修正是必不可少的步骤。然而, 即使有严密的立体化学限制, 观察值对需修正的参数的比例还是太低 (表5), 低于3分辨率时,同时修正蛋白质全部原子(非氢原子)的xyz坐标及各向同性B因子是没有意义的。

表5:修正—观察结果与数的比例

分辨率? FMDV FMDV w/NCS TNF PPb βlac. 4.0 2.2 11.0 1.8 1.3 1.2 3.5 3.3 16.5 2.6 1.9 1.7 3.2 4.3 21.5 3.4 2.5 2.3 3.0 5.2 26.0 4.1 3.0 2.7 2.8 6.4 32.0 5.1 3.6 3.3 2.5 9.0 45.0 7.1 5.1 4.7 2.3 11.5 57.5 9.1 6.5 6.0 2.0 17.5 87.5 13.8 9.8 9.0 1.7 28.5 142.5 22.4 15.8 14.6 1.5 41.4 207.0 32.5 22.9 21.2

1.2 80.7 403.5 63.2 44.3 41.1 1.0 139.2 696.0 109.0 76.2 70.8

表中给出的数值是可观察的独立衍射数据数目(假定为100%)与每个不对称单元的非氢原子数目之比。因此表中数值4相对于对每个非氢原子的x, y, z坐标和温度因子B修正时每个参数一次观察结果。样例来自于我们的经验: FMDV(foot and mouth disease virus口蹄疫病毒)空间群I23, 含超过80%的溶剂及RNA; 含NCS的FMDV, 如上但有严格的非晶体学对称限制, 相应于不对称单元中附加的五重轴对称; TNF(肿瘤坏死因子)空间群P3121, 含65%溶剂;PPb(糖原磷酸化酶b)空间群P43212含50%的溶剂; βlac. (β内酰胺酶I)空间群C2, 溶剂含量低于50%.注意衍射数据与参数的比例独立于晶胞的对称性及蛋白质大小, 该比例受晶体内溶剂体积以及非晶体学对称的影响极大; 因此带NCS的FMDV3.0?时的比例比PPb1.5时的更好; 对于立体化学制约的修正(如X-PLOR, PROLSQ)情况有所改善, 因为含有多余的制约因素。最小二乘法的收敛半径相当小, 因而结构可能滞留在局部能量极小值的错误构象状态, 需要经常返回电子密度图进行手工模型重建。通过使用立体化学制约的分子动力学方法,以增加收敛半径, 一般R因子从48%降至25%时不需要任何手工干预。立体化学制约的分子动力学方法步骤如下:

1. 第一步能量最小化使新建结构消除总的空间障碍和不合理的立体化学等。

2. 第二步估算总的B因子。

3. 第三步将分子模型加热至2000或3000K以进行立体化学制约的分子动力学方法修正

4. 第四步冷却模型, 在给定的一段时间内,进行(如1ps)缓慢降温。 5. 第五步在新的结构基础上进行能量最小化修正。 6. 第六步限制性地修正各向同性B因子。

对于基于分子置换法基础上的模型, 高同源序列的区域 (如核心二级结构) 可认为是基本正确(对于主链原子在0.5?内), 采用上述方法修正时可对这些区域

作较强的制约。修正中要注意利用权重因子,使立体化学制约与衍射数据制约达到平衡。如可能的话, 非晶体学对称应作为一种制约(如在病毒结构中) 或限制因素。来自于晶体中大部分溶剂的散射显著影响了低分辨率数据的精度(在8 ?以下), 因此在把这些观察结果用于修正之前应进行溶剂校正。模型某些区域的多种构象(如一个小抑制剂的两种可能的取向)可按照电子密度图构建多重结构模型,并用当前的修正程序进行修正。这可能对高分辨率下蛋白质的适当描述较为重要。

近些年来,修正方法 (特别是立体化学制约的分子动力学) 降低晶体学R因子的能力开始被滥用,计算机承担了重建错误结构区域的很多工作, 但最终还得由晶体学家来确定其是否正确。最近人们发现,一些错误结构经立体化学制约的分子动力学修正后竟然给出―令人信服‖的R因子。对于任何一个新的蛋白质,一旦模型建立后其中的错误就不容易消除,因而初始模型应建立在尽可能好的MIR或MAD图上,使之从一开始就接近于正确的结构模型是非常重要的。遗憾的是, 对于MR模型, 从一开始就可能有错误存在, 而我们也知道它并不正确。错误的MR结果R因子可修正至30%或27%,当然, 大部分模型可能在R因子25%处需要一些修正。对于以MR为基础的模型, 分辨率的扩展 (如从2.5?到1.9?) 可在修正后大大改善电子密度图质量,这可能主要是由于结构振幅数据大量增加,使相位的质量提高。将当前修正的相位与初始相位相结合,解决以MIR或MAD相位为基础的结构测定中的位相bias问题已被证明是有益的(61,62)。

约缺(omit)图是揭示结构中的错误的最好的方法,但前提是要求没被约缺的结构大部分是正确的。最好的一类约缺图是约缺的那部分从没有包括在模型中(如辅因子或抑制剂), 这种区域的清晰密度特别可信, 尤其是以MR为基础的结构测定。

避免在结构修正过程中的出现灾难性的错误的要点如下 1, 用所有数据 (没有任何删除) 进行修正及计算R因子;

2, 严格应用立体化学制约 (与理想键长r.m.s.偏差必须小于0.02?); 3, 注意被修正参数与衍射数据的比例,不要在修正中加入过多的参数(参见表5);

4, 除非在较高的分辨率的情况下修正过程中的R因子很低, 不要冒然加入过多的水分子(然而这最终决定于相位的质量及电子密度图的清晰性);

5, 要保证结构模型中所有主链的Φ-Ψ角均符合期望的Ramachandran值; 6, 温度因子B的分布也必须合理,

如果上述条件均满足,则结构测定工作大功告成。赶快发表论文并请把你的坐标存入蛋白质数据库。这也是我们在结构测定中所遵循的原则。