基因进化|献给渴求知识的你

想知道基因进化分析的内容!

想自定义,画出漂亮漂亮的图形!

想知道文章中基因进化的应用!

看看这篇文章,获得一些灵感!!!

01

系统树

进化树也叫种系发生树、进化树、进化树、种系发生树、种系发生树等。显示被认为具有相同祖先的物种之间的进化关系的树形图用于描述物种之间的分类和进化关系。

自达尔文时代以来,许多生物学家希望以一棵树的形式来描述地球上各种物种的进化史。最理想的方法是收集各种物种的化石(直接证据),根据化石信息构建系统发育树。但最大的缺点是化石分散、不完整甚至缺失。

由于化石的先天缺陷不能用于大规模重建物种的系统发育树,生物学家会考虑利用比较形态学和生理学,根据物种的外貌重建系统发育树。这种方法只能确定系统的大致演化框架,细节有争议。

如何解释收敛进化,发散进化,平行进化?

趋同进化:远缘物种因生活环境相似而具有相同结构或物理结构的现象。

分歧进化:亲缘关系较近的物种,由于生活环境不同,每个物种为适应自己的生态位而发生了分化,导致形态上的巨大差异。

平行进化:具有相同祖先的后代适应相似的生活环境,独立发育成相似形态的进化现象。

趋同进化和平行进化的主要区别在于亲缘关系的远近。

1964年,莱纳斯·鲍林提出了分子进化理论。

基本原理:核苷酸和氨基酸序列包含了生物进化史的全部遗传信息。根据分子特征(DNA、RNA、氨基酸、蛋白质),推断物种间的系统发育关系。即在传统SSR标记和高通量测序SNP标记的基础上,利用数据模型描述物种间的进化规律,构建系统进化树。

02

群体结构

群体遗传结构是指一个物种或群体中遗传变异的非随机分布。根据地理分布或其他标准,一个群体可以分为几个亚群。同一亚组中的不同个体亲缘关系较高,而亚组之间亲缘关系较远。

群体结构的分析有助于理解进化过程,通过基因型和表型的相关性研究可以确定个体所属的亚群体。

群体结构,又称群体分层,是指在所研究的群体中存在基因频率不同的亚群体。

03

主成分分析

主成分分析是一种统计方法。通过正交变换,将一组可能相关的变量变换成一组线性不相关的变量,变换后的变量称为主成分。主成分分析的主要应用有:人群分层、离群点筛选、亚群体的进化关系、人群结构修正。

基本思路:尽量把原来众多的具有一定相关性的变量(标志物)重新组合成一组不相关的综合变量(主成分)。

如何求横轴和纵轴两个随机变量的“与”的线性组合,使其包含最大的信息量?

上图实线方向对应的线性组合波动幅度最大,所以信息量最大。数学上,这意味着这个线性组合的方差是最大的。

推而广之,对于多维随机向量,我们希望找到多个线性组合,即多个主成分。其中,第一主成分包含的信息最多,第二主成分包含的信息第二多,以此类推。这些主成分之间的相关性几乎为零,即主成分之间的信息不重叠。

PCA二维图表显示

04

选择清除分析

在中性进化理论下,一个新的突变往往需要很长时间才能在群体中达到较高的频率,而这些突变周围的连锁不平衡程度在这段时间内会因为重组率的影响而几乎完全衰减和退化。因此,基因组中绝大多数的非选择性基因座会一直处于随机漂移状态,它们之间形成的连锁不平衡容易衰减,单倍型长度相对较短。但在选择的作用下,群体有利等位基因频率会在短时间内达到一个较高的值,重组效应会在一定程度上被对冲,不能实质性地降解长程单倍型。同时,选择下的连锁不平衡会导致选择位点附近中性位点的基因频率增加,形成长程单倍型纯合性。在群体遗传学中,这种由选择引起的某些染色体片段多态性减少的现象称为选择性淘汰。

自然选择使有利突变留在群体中,与之连锁的中性位点突变频率增加,而非连锁的中性位点突变频率减少;简单来说就是选择基因组的某个区域消除多态性,即遗传多样性降低,群体中出现高频等位基因和低频等位基因。

正面选择vs负面选择?

正选择:自然选择“选择”了一些稀有的等位基因,拥有这些等位基因的个体可以繁殖出更多的后代;这样的突变基因往往具有与原始基因不同的功能,而这种功能使得拥有它的生物更能适应环境。

负选择(Negative selection):当群体中存在一个有害的突变等位基因时,携带该等位基因的个体会因为生存力或繁殖力的降低而从群体中被淘汰,也称为纯化选择。

选择清除还是背景选择?

选择性淘汰:在有利突变产生后被正选择固定的过程中,与之相连的中性位点的变异也被固定。

背景选择:负选择在去除有害突变的同时,也会去除与之连锁的中性位点的变异。

选择性清除和背景选择都会导致基因组中选定区域的遗传多样性下降,很难区分,但背景选择不会导致群体中高频等位基因突变。