1、2022 年 12 月第 30 卷 第 8 期中国实验动物学报ACTA LABORATORIUM ANIMALIS SCIENTIA SINICADecember 2022Vol.30 No.8高畅,任鹏程,李明格,等.Tn5 转座子及其在生物技术领域的应用 J.中国实验动物学报,2022,30(8):1087-1094.Gao C,Ren PC,Li MG,et al.Tn5 transposon and its applications in biotechnology J.Acta Lab Anim Sci Sin,2022,30(8):1087-1094.Doi:10.3969/j.i
2、ssn.1005-4847.2022.08.010基金项目国家自然科学基金(32070401)。Funded by National Natural Science Foundation of China(32070401).作者简介高畅(2000),女,在读本科生。Email:cherrelle1107 ;任鹏程(2001),男,在读本科生。Email:tutu_pcr 。#共同第一作者通信作者胡仪(1985),女,博士,副教授,博士生导师,研究方向:微生物生态学。Email:yi.hu Tn5 转座子及其在生物技术领域的应用高畅1#,任鹏程1#,李明格2,吕赫喆2,胡仪1(1.北京师范大学
3、生命科学学院,北京 100875;2.中国科学院动物研究所,北京 100101)【摘要】随着二代测序技术的快速发展,测序及其相关技术愈发成熟并向高精度和高通量的方向深入。传统的测序方式对样本量要求很高,而许多珍贵样本难以满足要求,因此能够降低样本量需求的技术亟待开发。而Tn5 转座酶在文库构建中可以在片段化 DNA 的同时将接头序列加入到靶序列两侧,大大缩减了实验流程,同时也降低了对样本量的需求。因此,Tn5 转座酶在生物技术领域的应用被逐渐开发,例如 CUT&Tag、stLFR 和 TRACE-seq 等技术就是将 Tn5 转座酶应用于表观测序、长片段测序和转录组测序等领域的研究成果。简单的
4、实验流程和极低的成本使其备受青睐。本文中,我们对 Tn5 转座子及其在生物技术领域的应用进行了综述,以期方便大家理解 Tn5 转座子及其相关技术,为未来 Tn5 转座子相关技术的改进和推广提供参考。【关键词】二代测序;Tn5 转座子;生物技术【中图分类号】Q95-33 【文献标识码】A 【文章编号】1005-4847(2022)08-1087-08Tn5 transposon and its applications in biotechnologyGAO Chang1#,REN Pengcheng1#,LI Mingge2,LYU Hezhe2,HU Yi1(1.College of Lif
5、e Sciences,Beijing Normal University,Beijing 100875,China.2.Institute of Zoology,Chinese Academy of Sciences,Beijing 100101)Corresponding author:HU Yi.E-mail:yi.hu 【Abstract】With the rapid advancement of next-generation sequencing(NGS),sequencing and its related technologies are becoming more mature
6、 and providing higher accuracy and throughput.Traditional method of sequencing require a large sample quantity that is difficult to obtain for some samples.Thus,techniques with a lower demand on sample quantity are in urgent need.In library construction,the Tn5 transposase cuts DNA and adds an adapt
7、er sequence to both sides of the target sequence,which requires fewer steps and a lower sample quantity.Therefore,applications of Tn5 transposase have been gradually developed in biotechnology.For example,CUT&Tag,stLFR,and TRACE-seq are techniques that use Tn5 transposase in epigenomic sequencing,lo
8、ng fragment reading,and transcriptome sequencing.The simple steps and very low cost make the techniques popular.In this review,we summarize the Tn5 transposon and its applications in biotechnology to make it understood more easily and provide a reference for improvement and promotion in the future.【
9、Keywords】next-generation sequencing(NGS);Tn5 transposon;biotechnologyConflicts of Interest:The authors declare no conflict of interest.中国实验动物学报 2022 年 12 月第 30 卷第 8 期 Acta Lab Anim Sci Sin,December 2022,Vol.30,No.81 Tn5 转座子及转座机制1.1 Tn5 转座子Tn5 是一种复合型转座子,其中心序列可表达3 种抗生素(kanr、strr、bleor),两侧为高度同源的倒置序列 IS
10、50R 和 IS50L1(图 1A)。IS50R 可以表达产生转座酶(transposase,Tnp)和抑制转座酶活性的抑制蛋白(inhibitor,Inh),IS50L 表达产生两个非活性蛋白2-3。每个 IS50 序列都位于两个 19 bp 的倒置末端(外末端 outside end,OE 和内末端 inside end,IE)之间。倒置末端为转座酶的作用位点,但OE 和 IE 在序列上略有不同1,4。后续的研究发现,转座的发生只需其中的关键成分,即转座酶和两个 19 bp 的倒置末端,内部可以包含任何足够长的 DNA 片段(图 1B)。并且,这两个 19 bp 的末端可以是倒置的 OE
11、和 IE、两个 OE、两个 IE,也可以是两个马赛克末端(mosaic end,ME)。实际上,ME 是一种人工构建的末端,其序列与 OE 存在 3 个碱基对的不同,且具有比 OE 和 IE 更高的转座速率5。注:A:Tn5 的天然结构:Tn5 转座子由编码 3 种抗生素(kanr、strr、bleor)的中心序列和两侧的倒置序列(IS50L 和 IS50R)组成,每个 IS50都位于一个外末端(OE)和一个内末端(IE)之间,IS50L 编码两个非活性蛋白,IS50R 编码转座酶(Tnp)和转座酶抑制蛋白(Inh);B:Tn5 转座子的简化结构:任意足够长的 DNA 片段在其两侧加上外末端(
12、OE)或者其它末端(IE、ME)都构成一个转座子。图 1 Tn5 转座子结构Note.A.Traditional transposon Tn5.It contains two inverted versions of IS50(IS50L and IS50R)bracketing three antibiotic resistance genes(kanr,strr,bleor),and the IS50 elements are defined by the outside end(OE)and inside end(IE).IS50L encodes two inactive protei
13、ns,while IS50R encodes transposase(Tnp)and an inhibitor of transposition(Inh).B.Simplified transposon Tn5.Two outside ends(OE)or other ends(IE,ME)brackets sufficient DNA.Figure 1 Structure of transposon Tn51.2 转座酶结构由 IS50R 编码的 Tn5 转座酶可以分成 3 个结构域:与转座子末端 DNA 结合的 N 端结构域、具有催化活性的中部结构域和负责蛋白质结合的 C 端结构域。N 端
14、结构域的二级结构仅包含-螺旋和转角,用于与转座子末端序列的识别和结合;C 端结构域也仅有-螺旋和转角,可以与转座酶结合促进转座过程,也可以同 Inh 结合形成二聚体抑制转座6。而转座酶的活性位点则位于由约 300 个氨基酸残基组成的中部结构域内,该结构域内含有一个“核酸酶类 H 模体”起催化作用,且该模体在所有转座酶和逆转录病毒整合酶中都起类似的作用6-8。Tn5转座酶的“核酸酶类 H 模体”活性中心内有 D97、D188、E326 作为保守的氨基酸残基组成 DDE 模体,对转座酶的活性有至关重要的作用。该 DDE 模体与两个 Mn2+结合,两个 Mn2+分别与 OE 末端的 3-OH 和 5
15、-P 配位作为催化活性中心6。此外,在DDE 模体的谷氨酸残基后还存在一对保守的赖氨酸残基(EKK),其中,第二个赖氨酸残基与Y319、R322 及 DDE 模体中的 E326 组成了高度保守的 YREK 模体,该模体使得非转移链的 5-P 发生位移,为靶 DNA 的结合留下了空间9。1.3 Tn5 转座机制Tn5 转座需要多个步骤,主要包括转座酶二聚体的形成、供体 DNA 的切割、靶 DNA 的捕获与链转移、链转移复合物的脱离 4 个步骤(见图 2)。首先,在缓冲液中加入 Mg2+,两个转座酶分子的 N 端 2665 位氨基酸残基及活性中心的几个氨基酸残基与Tn5 转座子末端序列特异性结合,
16、构成两个转座酶-DNA 复合体6,10。紧接着,这两个复合体利用转座酶 C 端 螺旋交叉,发生剪刀状二聚化,形成一个转座酶二聚体6-7。在形成转座酶二聚体后,转座酶启动 DNA 的切割,并且,一侧的转座酶催化另一侧末端的反应,呈现出交叉作用的现象11。整个催化反应大致包括 3 个步骤:首先,转座酶活化的水分子与 DNA 链反应,使 OE 末端暴露出游离的 3-OH;其在接下来的反应中与互补链形成发夹结构,8801中国实验动物学报 2022 年 12 月第 30 卷第 8 期 Acta Lab Anim Sci Sin,December 2022,Vol.30,No.8使转座子 DNA 从供体 DNA 骨架中脱离;最后,另一活化的水分子将该发夹结构打开,释放出 3-OH 为链转移做准备12。在整个催化反应完成后,转座酶二聚体捕获靶 DNA 并进行链转移。许多研究表明,注:Tn5 的转座机制:两个 Tn5 转座酶结合 OE,形成复合体并发生二聚化。随后,通过亲核反应使转座子 DNA 脱离供体 DNA。最终,Tn5 二聚体捕获靶 DNA,完成链转移。图 2 Tn5 的转座机制Note.Mec