新一代测序技术

以“桑格法”为代表的第一代测序技术,实现了测序技术从无到有的飞跃,人们用它完成了“人类基因组草图”和动物、植物、微生物等模式生物的基因组测序。第一代测序已经发展到实现自动化,但总的来说,由于其通量低、过程长、成本高,很难商业化。新的测序技术以不可阻挡的势头发展。

下一代测序的起点,NGS)2005年以来的罗氏454、Illumina GA/HiSeq、Life SOLiD/Ion Torrent、PacBio RS等发明。新技术大大提高了测序通量,降低了测序成本。本文主要介绍华大平台的Illumina测序技术、太平洋生物科学SMRT RS测序技术、牛津纳米孔测序技术、DNBSEQ TM测序技术。

该技术是目前应用最广泛的下一代基因组测序平台,采用边合成边测序的技术,实现大规模并行测序。最早是由Solexa公司开发的,所以也叫Solexa测序技术。Illumina测序平台有多种仪器可供选择,如适用于测序中心和测序公司的HiSeq系列测序仪,适用于中小型实验室和医院医疗诊断测序的MiSeq和NextSeq500测序仪,以及专门用于医疗诊断测序的MiniSeq。排序模式分为高通数量模式和快速模式。其中,高通模型兼容更多的样本量和应用类型;而快速模式测序速度更快,单次操作成本更低。

Solexa测序技术的原理在知乎上的网友“星空理想主义者”和“”等平台上的“Z_Y_H”都有详细介绍:

(详细分析二代测序原理!——星空理想主义者的文章——知乎);

(illumina双端测序-z _ y _ h上的文章-)。

以下只是简单总结。该方法的第一步是建立测序文库制备(图1)。将基因组断裂成小片段,两端完成,3’加尾,加入Illumina特殊接头(一端寡T),含有酶切位点,为环状非互补链,形成“球形”接头。当用限制性内切酶切割时,形成一个“Y”形末端,这样就可以一步一步地复制。在双链末端添加与后续扩增引物互补的片段(通过两次重复实现,两端引物序列不同,设为P5和P7),在引物内侧添加标记(两端标记不同)。如有必要,可用Taq酶使其达到平端。要做好上述工作,就要进行纯化,只有正确添加了接头的序列才用于后续反应,去除引物、酶等杂质。以上操作可以一次对整个库进行。

纯化后,对文库进行扩增和聚类,目的是扩增测序信号。在具有八个泳道的流动池上,变性测序文库与固定在泳道玻璃壁上的寡核苷酸(P5’,P7’)特异性互补结合,并在一轮复制(5’-->:3’)后,切割并洗去模板,固定在芯片上的寡核苷酸合成互补链。然后开始桥扩增,将含有DNA片段的文库扩增至约1000个拷贝,每个拷贝具有相同的DNA序列,从而形成一个簇。最后的扩增产物退化为单链,可用于成对末端测序。然而,通常的做法是通过使用甲酰胺基嘧啶葡糖苷酶(Fpg)的8-氧代鸟苷(8-oxog)的选择性切割,从接头选择性切割正向或反向序列,以避免过近的链间距对序列添加的影响。如果先切断反向序列,在测量后,重复上述反应直到选择性切割,切断正向序列并进行反向测序。

第三步是测序过程。Illumina平台使用SBS技术和3’-阻断可逆终止子技术进行测序。3’-末端可逆屏蔽终止子技术使用带有荧光标记的特殊核苷酸。该核苷酸的3’-羟基被化学基团保护,导致在每次DNA链合成中只能添加一个核苷酸。但在记录荧光图像时,化学屏蔽基团被酶切法切断,3’-末端恢复连通性,等等。可以想象,起初变性文库中含有模板-互补链(两个标签没有区别),在一个过程中同时测序,所以在收集单读测序结果时需要识别互补链,避免序列拼接混乱。正反双端测序大大提高了测序效率。

由于Illumina测序技术采用的是扩增聚类的信号放大原理,其读出长度达不到一代测序的水平,因为扩增到几百个碱基后,由于核苷酸浓度和酶活性的影响,簇内碱基的添加不再同步,如果不同步,信号就会混乱,导致读出序列不准确。

该技术是太平洋生物科学公司推出的单分子实时DNA测序技术,基于边合成边测序的原理。该技术的主要特点是长阅读,平均序列在10kb以上,最长阅读长度可达40kb。它以SMRT细胞为测序载体。SMRT池是一片厚度为100nm的金属,其一面有150000 (2014)个直径为几十纳米的小孔,称为零模波导,ZMW),又称纳米孔。测序时,系统将测序文库、DNA聚合酶和带有不同荧光标记的dDNA放在纳米孔底部进行DNA合成。通常,纳米孔固定DNA聚合酶菲尼克斯和DNA模板。

这种方法的特别之处在于测序文库不需要扩增,因为零模波导可以大大消除噪声荧光背景,单分子反应释放的荧光也可以被准确记录。另外,利用SMRT技术检测到标记的荧光基团与脱氧核苷酸的结合位置不在碱基上,而是在5’磷酸基团的第三个磷酸基团上,这样在dNTP互补结合测序模板和测序引物的缩合反应后,荧光基团与焦磷酸一起被切断,省略了酶切步骤。

2014年,牛津纳米孔公司推出了几款基于纳米孔测序技术的测序仪,如MinION、PromenthION、GridION等。其基本原理是在充满电解质的纳米孔两端加上一定的电压,就可以很容易地测出通过纳米孔的电流强度。纳米孔的直径只能容纳一个核苷酸通过。当核苷酸通过时,纳米孔被核苷酸堵塞,通过的电流强度变弱。由于四种核苷酸碱基的空间构象不同,当它们通过纳米孔时,减弱的电流强度的变化是不同的。因此,只有检测DNA通过纳米孔时电流强度的变化,才能实现实时测序。

这种方法也不需要文库扩增,可以长时间、实时、单分子阅读,可以大大降低测序成本。

这项技术源于完全基因组学,在华大得到改进。根据华大官网的文章,简要说明这种方法的原理。

根据图2的流程,BGI使用DNA纳米球技术来扩增DNA序列,其中DNA被分成大约100个碱基对的片段。此线段的每一边都与第一个连接器连接,即连接器1。扩增连接的DNA片段,并通过结合两端的接头形成环连接的序列片段。切割环状DNA片段以加入第二个接头,即接头2,并重复扩增和环化过程。曾经四种接头,即接头1,2,3,4(四种接头的序列不同,有的是与引物互补的寡核苷酸,有的是标记等。)添加到DNA片段中,通过滚环扩增最终的环状DNA以产生DNA纳米球,DNB)。在滚球扩增中,并不切断每个拷贝,而是在不影响延伸的情况下,扩增后用一定的方法变性,得到一组多拷贝的纳米球。纳米球固定在芯片上的网状孔中。

采用探针-锚定连接测序(CPAS)和多重置换扩增双端测序(MDA-PE)增加测序的阅读长度,可检测到100bp/150bp的双端序列。到目前为止,还没有详细公开组合探针锚定聚合技术。MDA-P的具体原理是通过复制延伸对第一条链进行测序后,在具有链置换功能的高保真聚合酶作用下,去除第一条链模板,合成第二条链,通过DNA分子锚对第二条链进行测序。

与其他二代测序相比,DNBSEQ TM测序技术以DNB为基础,用原始模板进行扩增,不同于PCR的指数级增长。最重要的是在放大过程中不会积累误差。

程皓枫。下一代基因组测序技术[M]。第一版。北京:科学出版社,2016。

【2】详细分析二代测序原理!——星空理想主义者的文章——知乎。

[3] illumina双端测序-Z_Y_H篇-。

[4]华大科技-产品服务-全外显子测序-产品介绍。

[5]破译人类基因组:下一代测序——(1)——周静的文章——词汇学。