1、第 卷 第 期 年 月电 子 显 微 学 报 ,文章编号:()冷冻电镜解析病毒颗粒中的蛋白质结构朱东杰,章新政,(中国科学院生物物理研究所生物大分子国家重点实验室,北京;中国科学院大学,北京)摘 要 病毒的蛋白质衣壳在病毒颗粒识别受体以及入侵细胞中起到了关键作用,其高分辨结构的解析有利于帮助理解病毒入侵宿主的分子机制,并为对抗病毒的疫苗和药物的设计提供精细的靶点信息。由于正二十面体病毒粒子的高对称性以及其在冷冻电镜照片中远优于蛋白质复合物的衬度,伴随着技术发展,冷冻电镜单颗粒技术率先在一系列直径约 的正二十面体病毒上获得了准原子分辨率结构解析,这些工作不仅揭示了病毒颗粒精细的组装机制,也展示了
2、冷冻电镜解析蛋白质结构的潜力。随着直接电子探测相机的出现,更小的正二十面体以及其它对称性病毒的三维重构分辨率获得显著提升。而埃瓦尔德球矫正算法的发展以及其在病毒重构中的应用使大型正二十面体病毒三维重构突破了分辨率瓶颈,最终实现了准原子分辨率结构解析,在原子尺度展示了极其复杂的大型病毒是如何由成百上千个结构蛋白组装而成。现阶段,冷冻电镜技术正在向原位结构解析方向发展。原位结构解析技术不仅可用于非对称性病毒颗粒上蛋白质的高分辨结构解析,也可以用于研究各种病毒入侵宿主细胞、转录、复制以及病毒颗粒组装、出芽的研究。基于电子断层重构以及亚单位平均的原位结构解析方法展示了其强大的能力,但依然存在着数据采集
3、通量低,三维重构分辨率提升困难的问题。原位结构解析需要进一步发展、完善,结合更好的细胞冷冻切片制备技术,将病毒的原位结构研究推进到新的高度。本文将结合冷冻电镜重构技术的发展和病毒粒子的结构生物学研究,描述这三个阶段的技术和科研的进展,并对未来进行展望。关键词 冷冻电镜;病毒结构解析;正二十面体;对称性破缺;原位结构解析中图分类号:;文献标识码:收稿日期:;修订日期:基金项目:国家自然科学基金资助项目(,);科技部重点研发计划()作者简介:朱东杰(),男(汉族),福建南平人,博士:通讯作者:章新政(),男(汉族),浙江绍兴人,研究员,博士:病毒粒子可以分为对称性病毒(通常包括正二十面体、螺旋以及
4、五次对称等)以及非对称性病毒。病毒粒子的大小差异非常大,其中常见对称性病毒颗粒可以从小至直径不到 的 到大至约 的。许多 左右的正二十面体病毒可以结晶,因此其三维结构可以通过射线晶体学解析。然而,更大的病毒通常难以结晶,对这些无法结晶的病毒粒子,冷冻电镜是研究它们三维结构的重要工具。其中对称性病毒往往具有较好的全同性,可以利用冷冻电镜单颗粒方法对病毒粒子整体开展高分辨三维结构解析。而非对称性病毒粒子则缺乏全同性,其病毒粒子的结构需要用电子断层重构来获得。冷冻电镜对二十面体病毒的研究历史可追述到上世纪九十年代。等在 年通过冷冻电镜在 上,使用了胶片作为成像媒介,利用 个 颗 粒 得 到 了 分
5、辨 率 为 的 重 构。等在 年同样使用胶片,利用约 个颗粒在 的分辨率解析了 的结构。在如此低的分辨率下,人们只能看到蛋白质轮廓与,难以进行区分二级结构。因此,提升分辨率成为了人们对当时冷冻电镜的主要需求。从 年开始,随着高端 场发射透射电镜的应用,更为稳定的样品台设计,以及各种冷冻电镜数据分析和三维重构计算软件的开发与应用,冷冻电镜单颗粒技术率先在正二十面体病毒上证实了其三维重构分辨率可以超过准原子分辨率。如图 所示,其中,等使用基于参考对中的方法在 上获得了 的三维重构;等在 上首次使用 相机上获得了 的结构解析。利用这些准原子级模型,基于冷冻电镜三维重构密度图的原子模型重头搭建得以实现
6、。这些工作在原子尺度揭示了无法结晶的病毒粒子的组装细节,揭开了复杂病毒的神秘面纱。随着经验 第 期朱东杰等:冷冻电镜解析病毒颗粒中的蛋白质结构 的积累和方法的发展,更多的正二十面体病毒,例如:的、的 和 的 病毒的三维重构得以解析。这一阶段,更多的计算软件纷纷得以快速发展,包括、等软件在底层函数设计、自动化、灵活性、对中精度以及优化复杂参数等方面各有各的优势。经过一段时间发展后,这些软件均可以获得很好的三维重构。但是,软件的使用逻辑、参数选择方面需要科研人员的精确控制,因此,在三维重构分辨率上,往往人的因素最终会大于软件的因素。值得一提的是,基于正二十面体病毒的高分辨重构的数据分析,单蛋白质的
7、欠焦量、像散优化,放大倍数优化等更为精细的 参数分析方法已经被很好地提出并证实了其有效性。在上述的冷冻电镜发展早期,具有较好均一性,直径在 左右的正二十面体病毒是使用冷冻电镜进行结构解析的理想样品。而对于更小的对称性病毒,数据信噪比低是三维重构分辨率低的关键因素,因此近年来基于直接电子探测相机的分辨率革命,大幅提升了冷冻电镜数据的信噪比,使得更小的对称性病毒的结构解析更为容易。而对于更大的对称性病毒,蛋白质的柔性问题以及三维重构中的埃瓦尔德球效应则限制了其三维重构分辨率。目前,冷冻电镜技术的发展已经较为完善地解决了对称性病毒三维重构所遇到的问题,将众多病毒的三维重构分辨率推进至准原子分辨率以内
8、(优于 )。此分辨率的突破对病毒粒子的结构生物学研究尤为关键,因为超过 分辨率的三维重构可以保证蛋白质原子模型的精确搭建,实现在原子尺度理解病毒粒子的组装、入侵等分子机制。冷冻电镜断层重构虽然可以对缺乏全同性的非对称性病毒粒子开展三维重构,但相对含有对称性的重构而言重构分辨率较低。由于病毒粒子上的许多结构蛋白质具有全同性,因此可以在三维的断层重构数据中对多个具有全同性的蛋白质进行平均(亚单位平均技术),提升三维重构的信噪比和分辨率。类似的技术还可以用于病毒粒子入侵宿主以及病毒粒子在宿主内进行组装和出芽等现象的细胞原位结构生物学研究。目前,相较单颗粒技术,基于电子断层重构的原位结构解析技术研究周
9、期长,分辨率相对较低,应用受限比较严重,因此,技术的完善和发展对该研究领域的进一步突破尤为关键。本文围绕病毒粒子结构生物学研究,对相关的单颗粒技术和原位结构解析技术的发展历史进行介绍,同时也介绍一些可用于病毒三维重构的前沿新技术,最后对该领域的未来进行了展望。希望能对进入病毒结构生物学研究领域的同仁有所启发。冷冻电镜解析具有对称性的病毒衣壳蛋白质结构 分辨率革命推动小尺寸病毒解析 年以来,直接电子探测相机得以在冷冻电镜中应用。可以实现电子计数算法的直接电子探测相机的性能相较胶片或 更为突出,大幅提升了冷冻电镜数据的信噪比。胶片时代,电子曝光时蛋白质的漂移导致冷冻电镜成像质量大幅下降,常常会有接
10、近一半的数据无法用于高分辨三维重构。直接电子探测相机的可高速输出照片,满足将冷冻电镜照片以电影的形式呈现。因此,蛋白质的移动轨迹可以在电影中追踪并矫正,数据质量进一步得以提升。高效的直接电子探测相机也将冷冻电镜数据采集效率较胶片提高了数倍。数据质量和数量的提升促使了冷冻电镜的分辨率革命。伴随着第一个准原子分辨率蛋白质复合物的结构解析,冷冻电镜的分辨率革命拉开了序幕。此外,基于贝叶斯统计的方法在数据信噪比低的样品上具有更精确的对中能力;二维分类,三维分类的运用可挑选出更为均一的蛋白质复合物,进一步推进了重构分辨率;而更为自动化和合理的计算流程不仅将研究人员对重构质量的影响变小,也消除了大部分的过
11、拟合问题,使得冷冻电镜三维重构更为简单,分辨率更为可信。软件的进步大幅降低的使用者的门槛,将冷冻电镜分辨率革命推向了整个结构生物学。在这个期间,小型正二十面体病毒的冷冻电镜成像质量获得了大幅提升,由于其具有更好的均一性,大量小型正二十面体病毒的高分辨三维结构获得解析。目前,在电镜数据集 上分辨率高于 的正二十面体病毒冷冻电镜单颗粒重构已经超过 个,其中达到或超越 的结构有近 个。这些高分辨率的病毒结构几乎都是小尺寸病毒,如,等。通常,左右的正二十面体病毒解析到准原子分辨率仅需不到 个病毒颗粒的冷冻电镜照片,对应大约不到一小时的冷冻电 电子显微学报 第 卷图 年首批被解析到准原子分辨率的正二十面
12、体病毒,。,图 部分病毒的非对称结构解析。镜机时,冷冻电镜成为了获得其三维结构的最为便捷的工具。具有全同性病毒的非对称结构 各种具有对称性的病毒粒子,例如螺旋对称性,次轴对称性以及二十面体对称性病毒,其病毒粒子具有全同性,可以用单颗粒技术获得高分辨结构解析。在具有全同性的基础上,拥有二十面体对称性的病毒可存在不遵守正二十面体对称性的结构。对这些结构的解析通常需要先使用正二十面体对称或五次对称重构得到一个比较精确的衣壳结构,在此基础上,需要破 除 对 称 性(),结合三维分类并根据非对称结构蛋白的特性使用不同方法进行处理。如图 所示,噬菌体的衣壳是五次对称的,其 是十二次旋转对称的;噬菌体的 同
13、样 是 十 二 次 对 称的;噬菌体的成熟蛋白是非对称的。对于这类蛋白质质量很大,特征明显的情况,可直接使用限制欧拉角搜索范围甚至从头进行三维重构得到对应结构。更复杂一些的如,其内含的 的组装是伪 对称的,等利用对称重构中展现的非对称蛋白质信息,如 来确定初始欧拉角进而解析结构。又如对于 病毒的 粒子,等认为 个对称的空间取向总会有一个与非对称的基因取向相同,进行 份非对称重构后得到了内部的基因分布。在进行非对称结构解析时,一种被称为减法的做法经常被采用,即利用每个颗粒的欧拉角在三维模型上得到衣壳投影后,在颗粒上减去对应的蛋白质密度,以便削弱外侧强信号对内部非对称信息的影响。受限于较弱的非对称
14、蛋白质的信号强度以及强的背景蛋白质密度信号,二十面体病毒的非对称结构解析相较对称重构较难获得准原子分辨率的结构。解析大尺寸病毒的限制因素及解决方法 冷冻电镜分辨率革命显著地提升了对小尺寸正二十面体病毒的解析能力。然而,冷冻电镜对更大尺寸的病毒,如核质巨 病毒,在分辨率革命后仍然难以获得准原子分辨率的结构。这是因为柔性与埃瓦尔德球效应显著地妨碍了常规单颗粒 第 期朱东杰等:冷冻电镜解析病毒颗粒中的蛋白质结构 分析对其的解析能力。小型正二十面体病毒蛋白质组装通常更为刚性,而大型正二十面体病毒的蛋白质壳层更为柔性,破坏了单颗粒三维重构所需的均一性。另一方面,严格的电子散射原理认为透射电镜成像位于埃瓦
15、尔德球面上,但冷冻电镜单颗粒分析要求投影满足中央截面定理。球面与平面在高频差异导致了埃瓦尔德球效应,即引入了额外的相差。对埃瓦尔德球效应的矫正传统上在傅里叶空间完成。在模拟数据上,几乎所有矫正方法都能取得良好效果,但在大型二十面体病毒的实际数据上几乎都失败了。这可归结为三大原因:其一,冷冻电镜实际数据信噪比很低,导致在傅里叶空间作用的矫正方法难以计算正确的费里德对;其二,颗粒欠焦量不容易测量精确,引入了额外的随机相位差导致矫正方法难以成功;其三,尤为重要,即蛋白质柔性引入的额外相位变化通常远大于经过大量颗粒平均后的 偏差引入的相位变化。考虑到柔性与埃瓦尔德球效应的共同影响,基于埃瓦尔德球效应可
16、等价于实空间的景深效应的原理,也可以认为景深效应是埃瓦尔德球效应的二阶近似,等提出的分块重构的思想便应运而生。如图 所示,其基本原理是将传统单颗粒算法获得的三维重构分成较小的许多块,利用块的几何位置和病毒成像数据的角度对中参数,计算该成像数据中每一块对应的局域欠焦量,将三维重构的每一块运用局域欠焦量重新进行三维重构以消除景深效应。其中,每一块三维重构前,可以结合三维分类并通过三维精修对其中心以及取向参数单独优化,以补偿病毒的柔性问题。分块重构是第一种在冷冻电镜实际数据上实现埃瓦尔德球效应矫正的重构算法,如图 所示,运用在 与数据上均突破了埃瓦尔德球效应导致的分辨率极限。对于,由于其直径约 且柔性很大,在多数区域不满足严格的正二十面体对称,因此采用传统的正二十面体重构方法仅能得到分辨率约 的三维模型。采用分块重构后,等和 等分别将 衣壳蛋白质层分辨率从约 分辨率提升至 与 ,接近了准原子分辨率,有效地阐述了其组装原理。对于由囊膜包裹的甲病毒属,多个课题组使用分块重构解析了、等病毒,有效地矫正了囊膜与衣壳的柔性,并把分辨率提升到准原子级。对于包含五次对称的 噬菌体和,等与 等使用分块重构将