基因检测方法有哪些?

摘要:基因检测的方法有哪些?介绍了几种常见的DNA水平基因检测方法,比较了它们的优缺点及其在临床诊断和科研中的应用,对指导研究生和临床医生课后学习,促进临床科研,提高科研和教学水平具有指导意义。基因检测方法的比较基因检测的技术原理是什么?

1,第一代测序

1.1桑格测序采用直接测序法。

1977年,FrederickSanger等人发明了双脱氧链终止法,后来成为最常用的基因测序技术。2001年,AllanMaxam和WalterGibert发明了桑格测序法,在随后的10年间成为基因检测的金标准。基本原理是双脱氧核糖核苷三磷酸(ddNTP)缺乏PCR延伸所需的3’-OH,因此每当分子ddNTP被添加到DNA链上时,延伸将被终止。每个DNA测序由四个独立的反应组成。将模板、引物和四种不同放射性同位素标记核苷酸的ddNTP与DNA聚合酶混合,形成不同长度的片段。反应体系中存在大量起点相同终点不同的DNA片段,用聚丙烯酰胺变性凝胶电泳可分离出单碱基差异的DNA序列,获得放射性同位素放射自显影条带。根据电泳条带读出DNA双链的碱基序列。

人类基因组测序就是基于这种技术。Sanger测序法是一种直接测序法,具有准确性高、简单快速的特点。目前对于临床上一些小样本遗传病基因的鉴定仍有很大的实用价值。例如,使用Sanger直接测序FGFR2基因来确认单基因Apert综合征和直接测序TCOF1基因可以检测出多达90%的与TreacherCollins综合征相关的突变。值得注意的是,桑格测序是针对已知致病基因的突变位点设计引物,进行PCR直接扩增测序。只需要扩增包含单个突变点的外显子片段,不需要扩增该点所在基因的所有外显子。

所以要明确定位待扩增位点所在的基因外显子和该点的具体位置,针对包括该点在内的上下游150~200bp的外显子片段设计引物。另外,尽管出现了NGS,桑格测序对于位点明确、数量有限的单基因遗传病中致病基因的检测还是非常经济高效的。至今,桑格测序仍是基因检测的金标准,也是在家族和正常对照组中验证NGS基因的主要手段。

值得注意的是,桑格测序的目的是寻找与疾病相关的特定基因突变。没有明确候选基因或候选基因数量较多的大样本病例很难筛选,这样的测序研究依赖于具有高通量测序能力的NGS。桑格测序虽然分析精度高,但其精度还取决于测序仪器和测序条件的设置。此外,桑格测序无法检测大片段缺失或拷贝数变异等基因突变类型,因此无法对一些相关遗传病做出基因诊断。

间接测序用于1.2的连锁分析。

在NGS出现之前,疾病基因定位克隆的国际通用策略是基于大规模全基因扫描和连锁分析。人类染色体成对出现,一个来自父亲,另一个来自母亲。每对染色体在相同的位置有相同的基因,但它们的序列并不完全相同,因此被称为父系和母系等位基因。

遗传标记是指在群体中表现出多态性的DNA序列,可以追踪家族中染色体、染色体片段或基因座传递的任何遗传特征。它存在于每个人身上,只是大小顺序不同,具有可遗传性和可识别性。目前使用的是第二代遗传标记,即重复序列多态性,尤其是短串联重复序列,也称为微卫星标记。

连锁分析是以连锁为基础研究致病基因与遗传标记关系的方法。如果控制某一表型性状的基因附近存在遗传标记,利用遗传标记与拟选基因之间是否存在连锁关系以及连锁程度,可以将该基因定位在染色体上的某一位置。在1986中,Morton等人提出了LOD方法,主要检验两个基因在一定重组率下连锁的可能性。LOD值为正,支持联动;如果LOD值为负,则拒绝链接。通过计算微卫星标记与家系中致病位点之间的LOD值,可以初步估计它们之间的遗传距离和连锁程度,从而确定基因在染色体上的大致位置。然后利用该区域的染色体基因图谱,分析定位区域内所有基因的功能和表达,选择合适的候选基因进行突变检测,最终定位或克隆致病基因。

然而,利用连锁分析进行基因检测有很大的局限性。不仅需要大量的基因样本,而且一般需要三代或三代以上基因家族患者的血样。而且数据量大,处理复杂,输出速度慢,定位不准(一般只在某个染色体区间),使得研究工作繁重,基因定位的时间周期特别长。目前,用于连锁分析的单核苷酸多态性和短串联重复序列仍在使用,但经典的间接测序方法,如单链构象多态性、变性梯度凝胶电泳和异源双链分析在美国已被淘汰,但在发展中国家作为研究方法仍被限制使用。

2.下一代测序(NGS)

主要包括全基因组测序(WGS)、全外显子测序(WES)和靶向区域测序(TRS),都属于新一代测序技术。总的来说,NGS技术具有通量大、时间短、准确率高、信息丰富等优点,能使遗传学家在短时间内准确定位感兴趣的基因。然而,这些不同的测序技术在测序范围、数据分析量、测序成本和时间等方面有很大不同。如果选择合适的方法,将在临床诊断和科学研究中起到事半功倍的作用。

2.1靶区测序是目前常用的基因芯片技术。

它的测序原理是基于DNA杂交原理。靶基因区的DNA通过芯片杂交或溶液杂交与靶基因区定制的探针富集,然后通过NGS技术测序。在测序过程中,成千上万的cDNA或寡核苷酸被放在芯片上组成阵列,固定在芯片上的已知序列的核苷酸探针与溶液中相应的带有荧光标记的核酸序列互补配对。根据测序仪显示的强荧光的位置和强度,得到每组点阵列的信息,然后通过生物信息学算法确定目标核苷酸的序列组成。用于测序的选定靶区域可以是连续的DNA序列或分布在同一染色体不同区域或不同染色体上的片段。靶区测序技术是一种非常好的方法,可以进一步检测过去通过连锁分析锁定在染色体某一段的基因突变,但无法发现突变。2010年,Nicholas等人利用基因分型芯片结合连锁分析技术成功发现了一个小头畸形的新基因WDR62,文章发表在NatGenet杂志上。类似的研究确定了家族性胰腺癌中的8个候选突变位点,并发现了家族性渗出性玻璃体视网膜病变中的易感基因TSPAN12。

基因芯片测序技术可以进一步研究通过连锁分析或全基因组筛选已经锁定在目标范围内的特定基因或区域,是解决连锁分析找不到致病基因的有效手段。基因芯片技术在筛选已知基因突变方面优势明显,可以快速、全面地检测目标基因突变。同时,由于靶区的限制,测序范围大大缩小,测序时间和成本也相应降低。然而,基因芯片检测所需的DNA量很大。因为提取的DNA有降解的风险,所以最好使用冷冻全血作为基因芯片研究的血液样本,这样才能充分保证可用于检测的DNA量。

2.2全外显子测序(WES)

外显子组是单个个体基因组DNA中所有蛋白质编码序列的总和。人类外显子的序列约占人类全部基因组序列的65438±0%,但它包含了约85%的致病突变。WES是一种利用序列捕获技术捕获并富集整个外显子区域的DNA,然后进行高通量测序的基因分析方法。采用的技术平台主要有罗氏的SeqCapEZ全外显子捕获系统、Illumina的Solexa技术和安捷伦的SureSelect外显子靶向序列富集系统。捕获的目标区域在34~62M之间,不仅包括编码区域,还包括一些非编码区域。NGS的测序过程主要包括DNA测序文库的制备、锚定桥接、PCR扩增、单碱基延伸测序和数据分析。掺有不同荧光标记碱基片段被测序仪捕获,荧光信号被计算机转换成不同颜色的测序峰和碱基序列。基因测序结果与NCBI SNP数据库、千人基因组数据库等国际权威数据库进行比对,最终确定是否为突变基因。

自NGS技术问世以来,WES在临床疾病致病基因的识别方面取得了前所未有的成就。这些成果不仅集中在单基因遗传病上,而且在多基因影响的复杂疾病中发现了大量的相关基因。在单基因疾病中发现新基因或已知基因的新突变,如色素性视网膜炎和终末期骨发育不良。在一些罕见疾病中发现了新的致病基因,如歌舞伎综合征、家族性混合型高脂血症和脊髓小脑性共济失调。同时,在小细胞肺癌、慢性淋巴细胞白血病等肿瘤的研究以及肥胖症、大脑皮质发育不良等复杂疾病的研究方面也取得了丰硕的成果。

WES技术在筛查范围和检出率上较其他测序技术有明显优势。例如,对于桑格测序和基因芯片测序无法筛查的样本,WES可用于进一步的基因筛查和鉴定。WES技术可以获得比传统Sanger方法更深的覆盖范围和更精确的数据。由于信息量的大幅增加,WES可以获得更多关于个体编码区的信息,因此成为检测致病基因和易感基因位点的有效手段。与连锁分析法相比,WES对家系要求不是很严格。一个单基因遗传病家系中有2~3个患者,1个正常人,连续三代不需要鉴定致病基因。WES使以前无法研究的家族成为可能,因为不需要三代以上的严格遗传家族。它不仅是单基因遗传病的一种很好的研究方法,而且可以对许多常见病,如肿瘤、糖尿病等进行大规模的比较研究。

2.3全基因组重测序(WGS)

WGS是对已知基因组序列的物种不同个体的基因组进行测序,数据分析后拼接组装序列,或者对不同组织进行测序,分析体细胞突变的一种研究方法。虽然WES可以快速全面地找出个体基因组中的所有突变,从而发现个体之间的差异,但它不能有效地检测外显子以外区域的基因。在这种情况下,目前有必要借助WGS进行全基因组检测。但由于人类基因组太大,单端全基因组测序很难达到所需的测序深度。因此,需要重复测序或双端测序,这将大大增加测序成本,并因达不到足够的测序深度而降低结果的准确性。对于临床疾病诊断和一般科研来说,其高昂的检测成本也是难以承受的。尽管如此,对于一些WES无法解决的临床研究和科研课题,还需要在WGS的帮助下进行更全面的基因检测。

3.观点

NGS的出现给新兴的基因组技术增添了无限的活力和想象空间。特别是基因芯片的问世及其在大规模疾病筛查和基因诊断的临床应用中的生命力,以及其商业化的发展模式令人鼓舞。眼科是单基因疾病最常见的学科,通过芯片技术筛查拉贝氏病,使许多病因不明的视神经萎缩得到明确诊断。原发性开角型青光眼是眼科中最隐蔽、最危险的致盲眼病,其致病基因或突变的鉴定将对疾病筛查具有非常重要的临床价值和巨大的商业价值。在新生儿糖尿病筛查中使用基因芯片技术可以更加快速、全面和经济,避免第一代测序过于繁琐和遗漏。

基因芯片技术在产前诊断方面更有发展前景。孕妇只要进行DNA验血,就可以筛查遗传病,避免了羊膜穿刺术抽取羊水进行有创检查的局限性和危险性。目前,随着基因检测技术的提高和检测成本的不断降低,在不久的将来有可能发展大规模的个体化基因检测。同时,随着药物易感基因和疾病易感基因的深入检测,将在基因检测的基础上实现个体化医疗。有理由相信,随着人们生活水平的不断提高和健康意识的不断增强,基因检测在未来医学发展中的应用前景将非常可观。