霍尔丹效应的原理是什么?
经典群体遗传学起源于英国数学家哈代和德国医学家温伯格在1908年提出的遗传平衡定律。后来,英国数学家费希尔、遗传学家霍尔丹thus和美国遗传学家赖特建立了群体遗传学的数学基础和相关计算方法,从而初步形成了群体遗传学的理论体系,群体遗传学逐渐发展成为一门独立的学科。群体遗传学是研究生物群体遗传结构及其变化规律的科学。它应用数学和统计学的原理和方法,研究生物群体中基因频率和基因型频率的变化,以及环境选择效应、遗传突变、迁移和遗传漂变与遗传结构的关系,从而探索生物进化的机理,为育种工作提供理论依据。从某种意义上说,生物进化是群体遗传结构不断变化和进化的过程,因此群体遗传学理论在生物进化机制特别是种内进化机制的研究中具有重要作用[1]。
20世纪60年代以前,群体遗传学主要只涉及群体遗传结构的短期变化。这是因为人的寿命与进化时间相比是如此之短,以至于没有办法检测到种群遗传的遗传变化或者基因在长期进化后的进化变异,所以我们不得不简单地通过短期变化的延续来推断长期的进化过程。利用大分子序列特别是DNA序列的变异来研究群体遗传学后,人们可以准确地定量推断群体的进化,可以检验前人关于长期进化或遗传系统稳定性的推断的可靠性[1]。同时,对生物群体中同源大分子变异模式的研究,也使人们重新审视达尔文以“自然选择”为核心的生物进化论。20世纪60年代末70年代初,Kimura[2]、King和Jukes[3]先后提出了中性突变随机漂移理论:认为大部分大分子的进化变异是选择性中性突变随机固定的结果。此后,分子进化的中性理论进一步完善[4],如Ohno[5]关于复制在进化中的作用的假说:认为进化的发生主要是重复的基因获得新的功能,自然选择只是维持基因原有功能的一种机制;最近Britten[6]甚至推断几乎所有的人类基因都来自古代的复制事件。虽然中性理论在理论和实验方法上也有缺陷,但它为分子进化的非中性检测提供了必要的理论基础[7]。目前,“选择理论”和“中性进化理论”仍是分子群体遗传学讨论的焦点。
1971年,木村[8]首次明确提出了分子群体遗传学的新理论。之后,Nei从理论上系统阐述了分子群体遗传学。从65438到0975,Watson [9]基于替代模型估计了DNA多态性的参数Theta(θ)和期望方差。1982年,英国数学家金曼[10,11]构建了“追溯祖先”原理的基本框架,使得用少量样本研究一个种群代表整个种群的遗传结构成为可能,并进一步推断出影响遗传结构形成的各种进化因素。对祖先原则的“回溯”分析,使推测种群的进化史更加合理可信。1983中,Tajima[12]推导了核苷酸多样性参数Pi(π)的数学期望值和方差。此后,随着中性平衡相关检验方法的提出[13~15],分子群体遗传学的理论和分析方法日臻完善[16]。
近20年来,在分子群体遗传学的基础上,又衍生出一些新的分支,如分子系统地理学。地理学的系统概念是Avise在1987中提出的,它强调了一个物种的基因谱系的当前地理分布的历史成因[17],同时有效地推测了物种扩散和迁移的微观进化史[18]。
2实验植物分子群体遗传学的研究内容和进展
基于DNA序列变异检测的实验分子群体遗传学研究始于1983,以Kreitman[19]发表的《果蝇乙醇脱氢酶基因位点的核苷酸多态性》一文为标志。以植物为研究对象的实验分子群体遗传学论文最早发表于90年代初[20,265,438+0]。但由于当时DNA测序成本较高,植物分子群体遗传学的初期发展较为缓慢。随着DNA测序逐渐成为实验室常规实验技术之一,以及基于追溯理论的各种计算机软件分析程序的开发和应用,实验分子群体遗传学在近10年间发展迅速,相关研究论文逐年增多。研究的植物对象主要是模式植物拟南芥。以及重要的作物如玉米和大麦。水稻、高粱、向日葵等。[16].其研究内容涵盖了种群的遗传结构(同源DNA分化模式)、突变、重组、连锁不平衡和选择等各种进化力量对遗传结构的影响、种群内的基因进化模式(中性或适应性进化)、种群间的遗传分化和基因流动。同时,通过栽培种与野生祖先或野生近缘种DNA多态性的比较研究,分子群体遗传学在研究作物驯化的遗传原因和结果方面也取得了重要进展,如作物驯化的遗传瓶颈、人工选择对“驯化基因”核苷酸多态性的选择性扫荡等。
2.1植物基因或基因组DNA多态性
分子群体遗传学的研究基础是DNA序列变异。同源DNA序列的遗传分化程度是衡量群体遗传结构的主要指标,其分化模式是理解遗传突变、重组、基因转化等进化内在驱动力的前提。随着DNA测序和分子生物学技术的快速发展,越来越多的全基因组序列或基因序列的测序结果被公布,物种或群体中基因的DNA多态性模式也越来越清晰。
在植物中,对拟南芥和玉米基因组DNA多态性的调查是最系统的,研究报告也很多。例如,Nordborg等人[22]调查了由96个样本组成的拟南芥群体中876个同源基因片段(0.48 Mbp)的序列单核苷酸多态性,* * *检测到超过65,438+07,000个SNP,平均每30 bp有65,438+0个SNP位点。而Schmid等人[23]的研究结果显示,拟南芥基因组的平均核苷酸多态性为0.007( W)。Tenaillon等人[24]对22个玉米植株的染色体1上的21基因***14 420 bp的序列进行了分析,结果表明玉米具有较高的DNA多态性(1SNP/27.6 bp,=0.0096)。Ching等[25]研究表明,36个玉米优良品系的18基因座平均核苷酸多态性为1SNP/31 bp,编码区平均核苷酸多态性为1SNP/124 bp。载体缺失和位点插入主要出现在非编码区。此外,一些基因位点的DNA多态性在其他物种中也存在,如向日葵、马铃薯、高粱、火炬松、花旗松等。[26 ~ 30],也进行了调查,结果表明不同物种之间的DNA多态性存在很大差异。
育种模式是显著影响植物基因组DNA多态性的重要因素之一。一般来说,近交种的遗传多态性低于异交种,这一点已被一些亲缘关系相近但育种方法不同的种间比较研究所证实,如石松属和Leavenworthia [31,32]。然而,在拟南芥中却不是这样。Savolainen等[33]用不同的育种方法比较了拟南芥(近交种)和白英(露头种)乙醇脱氢酶基因的核苷酸多态性,发现拟南芥的核苷酸多态性参数Pi值为0.0069,远高于白英。
2.2联动不平衡
不同位点的等位基因在遗传上并不总是独立的,它们的连锁不平衡对于构建分子育种和图位克隆的遗传图谱具有重要的参考价值。Rafalski和Morgan等[34]比较了玉米与人类群体的连锁不平衡和重组,全面阐述了连锁不平衡的影响因素,包括育种体系、重组率、群体遗传隔离、群体亚结构、选择、群体大小、遗传突变率、基因组重排等随机因素。物种的繁殖系统对连锁不平衡的程度有决定性的影响。一般来说,近交物种的连锁不平衡水平较高,而异交物种的连锁不平衡水平相对较低。然而,也有例外。比如野生大麦是近交种,但连锁不平衡水平极低[35~37]。
拟南芥是一种典型的自交植物。研究表明,拟南芥组基因大部分位点的连锁不平衡存在于约15 ~ 25 kb的基因组距离内[22],但在特定位点的连锁不平衡达到250 kb,如控制开花时间和邻近区域的基因[38]。拟南芥基因组的高度可变片段也具有强烈的连锁不平衡[39]。这些结果表明,拟南芥非常适合构建连锁图谱,因为用少量的样本就可以形成有效的作图群体。除了拟南芥,其他大多数自交物种都表现出高度的连锁不平衡,如大豆连锁不平衡大于50kb[40];栽培高粱的连锁不平衡大于15kb[41];水稻中Xa位点的连锁不平衡可达100 kb以上[42]。
与大多数近交物种相比,异交物种的连锁不平衡要低得多。例如,玉米染色体1的体细胞连锁不平衡迅速下降,在距离约200 bp处变得很弱[24],但在某些玉米群体如遗传狭窄群体或某些基因位点如人工选择位点[43~46]中,连锁不平衡水平会增强。在野生向日葵中,很难检测到超过200 bp的连锁不平衡(r=0.10),而栽培向日葵群体的连锁不平衡可以达到约1.100 BP的距离(r=0.10)[26]。马铃薯的连锁不平衡在短距离内迅速下降(1 kb至r2=0.2),但超过1Kb后下降非常缓慢(10 cM至r2=0.1)[27]。此外,火炬松、花旗松等异交林树种也表现出低水平的连锁不平衡[30,365,438+0]。
2.3基因组重组对DNA多态性的影响
基因组的遗传重组是指二倍体或多倍体植物或动物减数分裂过程中同源染色体之间的交换或转化[47]。它通过破坏遗传连锁来影响群体DNA多态性的模式,其在基因组中特定位点出现的概率与该位点的结构有很大关系。基因组中往往存在重组热点,如玉米中的青铜(bz)位点,其重组率比基因组平均水平高100倍以上[48]。并且重组主要发生在染色体的基因区域,而不是基因间隔区[49,50]。同时,基因密度高的染色体片段重组频率远高于基因密度低的染色体片段[41,51];在不同物种中,基因组重组率的平均水平也有很大差异。例如,大麦群体的基因组重组率= 7 ~ 8×10–3[52],比拟南芥(= 2×10–4)[27]高40倍,但只有玉米(= 12 ~ 14× 65438+)
目前关于重组与DNA多态性相关性的研究很多,但没有一致的结论。一些研究表明,重组对DNA多态性有很大的影响。如Tenaillon等[24]研究表明,玉米染色体1的DNA多态性与重组率有很高的相关性(r=0.65,P=0.007),同样的现象也存在于野生玉米群体、大麦和野生番茄中[52~54]。然而,在拟南芥中,重组对DNA多态性的贡献率非常低[22]。Schmid等[23]调查了具有大量基因位点的拟南芥群体的核苷酸多态性,发现重组率与核苷酸多态性的相关性不显著;Wright等人[55]调查了拟南芥染色体1和2的6个天然群体的序列变异模式,结果表明核苷酸多态性并没有随着着丝粒附近的抑制染色体区域的重组而降低。说明拟南芥基因组的重组率与DNA多态性没有必然联系。Baudry等人[31]对番茄属的5个物种进行了比较研究,结果也表明重组对种群间DNA多态性没有明显影响。
2.4基因进化模式(中性进化或适应性进化)
分子群体遗传学中关于分子进化有两种观点:一种是新达尔文主义的自然选择理论,认为在适应性进化过程中,自然选择在分子进化中起重要作用,突变起次要作用。新达尔文主义的主要观点包括:任何自然种群中总有足够多的遗传变异来应对任何选择压力;就功能而言,突变是随机的;进化几乎完全取决于环境变化和自然选择;自然种群的遗传结构往往处于或接近最适合其生存环境的状态;在环境没有改变的情况下,所有新的突变都是有害的[56]。另一种是以日本学者木村为代表的中性理论,他认为在分子水平上,物种内的遗传变异(蛋白质或DNA序列多态性)是选择中性或接近中性的,物种内的遗传结构是通过注入突变和随机漂移的平衡来维持的,生物的进化是通过选择突变的随机固定(有限种群的随机样本漂移)来实现的,即遗传漂移是进化的主要原因,选择并不占优势[2~4]。这两个理论在实验植物的分子群体遗传学研究中可以得到支持。
植物基因在物种内进化的研究主要集中在作物上,如拟南芥、玉米、大麦和少数林木。Wright和Gaut[16]对2005年以前发表的相关文章进行了详细的统计。结果表明,拟南芥中约30%的基因表现出适应性进化;玉米中约有24%的基因表现出非中性进化;在大麦的九个基因中,有四个受到选择的影响。
选择主要包括正向选择、平衡选择、背景选择和稳定选择,它们单独或共同影响特定基因的进化。例如,花旗松中控制木材质量和耐冷性的基因[30]、火炬松的耐旱基因[29]和欧洲山杨的食草动物诱导的蛋白酶抑制剂[57]都受到了正向选择、平衡选择和背景选择单独或多种方式的影响。植物抗性基因(R基因)是一种已经被深入研究的基因。大多数研究结果表明,抗性基因是高度多态的,并且经历了复杂的选择[58]。刘和伯克[26]研究了栽培大麦和野生大麦群体中的9个基因,并表明其中8个受稳定选择的影响。Simko等人[27]调查了47个马铃薯样本中的66个基因位点,结果表明,大部分基因位点是在马铃薯群体进化过程中直接选择或分化出来的。以上对不同物种不同基因位点的研究都强调了分子进化的非中性结果,这说明选择在基因的进化中起着非常重要的作用;另一方面,中性进化的结果很少被报道,或者被有意无意地忽略。事实上,即使在强调选择作用的研究文献中,仍有相当数量的基因表现出中性进化,说明在种内微观进化过程中,选择和中性漂变可能单独或共同影响不同的基因位点,* * *都促进了物种的进化。
2.5群体遗传分化
分子群体遗传学的一个重要研究内容是阐明物种不同种群之间甚至不同物种(通常是亲缘物种,如栽培物种及其亲缘物种或祖先野生物种)之间遗传结构的差异,即遗传分化,并推测产生这种差异的原因,以便人们更好地了解种群动态。
一个植物物种内不同种群间的遗传分化有很多情况,比较典型的有:(1)世界范围内拟南芥的遗传分化。川边和宫下[59]使用了三个基因,即碱性几丁质酶A(ChiA)、碱性几丁质酶B(ChiB)和乙醇脱氢酶(Ahd)来分析拟南芥的群体亚结构。结果表明,只有ChiB表现出一定的种群亚结构,但ChiA和AHD的系统聚类与样本的地理来源没有相关性,这表明拟南芥最近在全球范围内经历了快速扩张。Aguade[60]和Mauricio等人[61]用不同基因和Schmid等人[23]用多个基因位点对拟南芥进行的分子群体遗传学研究也支持了同样的结论。(2)林木品种的遗传分化。Ingvarsson等[62]发现山杨诱导萌发的候选基因(phyB)的变异方式呈现纬度渐变,说明山杨具有明显的适应性分化;Ingvarsson等人[63]通过研究多个基因单倍型的地理格局分布,也发现胡杨具有明显的地理遗传分化。但研究表明,像花旗松[30]]、火炬松[29]和日本柳杉[64]等物种并没有发生明显的遗传多样性地理分化。
植物不同种间遗传分化的研究主要集中在栽培种与其野生近缘种的DNA多态性比较上。由于早期驯化瓶颈和人工选择育种等遗传漂变的结果[65]。栽培物种的遗传多样性通常低于其野生祖先。Hamblin等人[28]利用AFLP结果筛选基因片段的DNA多态性,对栽培高粱(二色高粱)和野生高粱(propinquum)进行了比较研究。结果表明,野生高粱的平均核苷酸多态性约为0.012(),约为栽培高粱的4倍。刘等[26]研究表明,野生向日葵中的核苷酸多态性达到0.0128()和0.0144( W),显著高于栽培向日葵中的(0.0056()和0.0072( W)。Eyre-Walker等人[66]研究了栽培玉米和野生玉米的Adh1基因序列,结果表明栽培玉米的遗传多样性仅为野生玉米的75%左右(Zea mays subsp。parviglumis)。Hyten等[67]研究表明,野生大豆的平均核苷酸多态性为0.0217()和0.0235( W),而地方品种的平均核苷酸多态性为0.0143()和0.0115( W),约为野生大豆的66%(W。以上结果充分反映了栽培种驯化中遭遇了瓶颈效应。
地理学的三分子体系
地理分子系统是在分子群体遗传学基础上发展起来的一门新的科学。早在20世纪60年代,Malecot[68]就发现基因的同一性随着地理距离的增加而降低。Nei的《分子群体遗传学与进化》一书1975中也提到,在描述群体的遗传结构时要注意基因或基因型的地理分布[1];1987 Avise等人[17]提出了地理学的系统概念。在植物方面,分子地理系统学研究取得了许多重要成果。比如对四世纪冰期植物避难所的推测和对冰期后物种扩散、移民等历史事件的解读,其中最典型的研究是欧洲冰期植物避难所的确定和冰期后欧洲植物移民历史事件的再现。例如,欧洲栎属植物单倍型的地理分布格局表明,栎属植物的冰河期避难所位于巴尔干半岛、伊比利亚岛和意大利亚平宁半岛,由于不同冰河期避难所的迁移形成了现在的分布格局[69]。King和Ferris[70]推测北欧的大多数桤木种群是从冰河时期避难所喀尔巴阡山脉进化而来的。Sinclair等人[71,72]推测第四纪冰期赤松的避难所可能在爱尔兰或法国西部。此外,地理学的分子系统在阐明栽培作物驯化的一些历史事件方面也取得了很大进展,如驯化的时代和驯化的起源。如Olsen等[73]对木薯单拷贝核基因甘油醛-3-磷酸脱氢酶单倍型的地理分布进行了深入调查,推测栽培木薯起源于亚马逊河流域南部边境地区。Caicedo等人[74]利用核基因的果实液泡转化酶的序列变异来解释栽培番茄野生近缘种茄的种群扩张历史。基因变异的地理分布表明,栽培番茄起源于秘鲁北部,然后逐渐扩展到太平洋沿岸。Londo等人[75]利用一个叶绿体基因和两个核基因的变异,对两个亚洲栽培籼粳亚种及其相关野生种进行了系统的地理研究,阐明了籼粳起源于不同的亚洲野生稻(O. rufipogon)种群,其中籼稻起源于喜马拉雅山南部的印度东部、缅甸和泰国,粳稻驯化于中国南方,等等。
4总结与展望
目前,植物分子群体遗传学的研究在国际上方兴未艾,在国内也开始引起重视。随着水稻、拟南芥和杨树全基因组测序的完成,更多的粮食作物、经济作物和重要林木品种的部分基因组测序结果和EST序列相继发表。人们对这些物种的DNA多态性、连锁不平衡水平、基因组或个体基因的进化驱动力、种内种群动态和迁徙历史有了一定的了解,但还远远不够透彻和透彻。为促进我国植物分子群体遗传学研究的发展,笔者提出以下建议,值得抛砖引玉。(1)借鉴国际上分子群体遗传学的先进方法,特别是以果蝇和人类为研究对象的相关工作。分子群体遗传学研究侧重于分析方法、研究思路和有待阐明的群体遗传学问题,易于学习、掌握和深化研究;(2)比较基因组学的进一步研究。由于植物物种的多样性和基因组的复杂性,人类不可能对不同植物物种的全基因组逐一进行测序,只能选择少数物种作为模式物种进行测序。鉴于不同物种间同源基因和基因排列顺序存在一定程度的保守性,模式植物的基因组测序结果和物种间的比较研究结果可以促进和加速其他物种的相关研究。(3)更加重视分子群体遗传学。从某种意义上说,分子群体遗传学是研究种内(微观)进化的学科,种内微观进化是研究种间宏观进化的前提和基础,从而加深了人们对物种形成和生命进化的认识。另一方面,连锁不平衡水平是分子群体遗传学研究的重要内容之一,了解连锁不平衡水平对于构建高通数量遗传图谱,利用自然群体进行复杂性状(QTL)定位和相关基因克隆具有重要的参考价值。(4)特别需要开展中国特有的典型分布格局植物类群的分子群体遗传学和地理分子系统的深入研究,这对了解中国植物物种起源、进化和分布变迁的历史具有重要意义。同时,中国是许多重要作物和经济作物的起源和驯化中心之一。深入了解栽培种及其近缘野生种的DNA多态性和分布,可以为我国物种保护、重要基因挖掘、野生种驯化栽培、分子育种和植物资源可持续利用提供理论指导。