求一篇题为《从遗传因素到全基因组测序》的论文。请讨论一下基因概念的发展以及你对基因的理解。
1961年,法国人雅各布和莫诺的研究成果极大地拓展了人们关于基因功能的视野。他们发现有些基因并不合成蛋白质模板,只是调节或操纵,提出了操纵子理论。从此基因按功能分为结构基因、调控基因和操纵基因。结构基因和调控基因:根据操纵子理论,不是所有的基因都能编码肽链。因此,能够编码多肽链的基因称为结构基因,包括编码结构蛋白和酶蛋白的基因,以及编码阻遏物或激活物的调控基因。有些基因只能转录不能翻译,比如tRNA基因,rRNA基因。还有一些DNA片段,本身不转录,但控制相邻结构基因的转录,称为启动子基因和操纵子基因。启动子基因、操纵子基因及其控制下的一系列结构基因形成一个功能单位,称为操纵子。就其功能而言,调控基因、操纵基因和启动子基因都属于调控基因。这些基因的发现大大拓宽了人们对基因功能及其关系的认识。断裂基因:20世纪70年代中期,法国生物化学家夏莫邦和伯杰发现,一个细胞中的结构基因并不全由编码序列组成,而是在编码序列中间插入了非编码碱基序列,称为间隔区或断裂基因。这一发现在1977年被英国的Chavries和荷兰的Franwell证实,当时他们研究了兔子β-球蛋白的结构。1978年,生物化学家沃特·吉尔伯特提出了基因是转录单位的观点。他认为一个基因是一个DNA序列的嵌合体,同时含有两个片段:一个片段会被表达并存在于成熟的mRNA中,称为“外显子”;虽然一个片段也同时表达,但在成熟的mRNA中会被删除,称为“内含子”。近年来发现,原核生物的基因序列一般是连续的,一个基因内部几乎没有“内含子”,而真核生物的基因大多是由不连续的DNA序列组成的断裂基因。断裂基因的表达过程如下:整个基因从DNA转录成信息RNA前体mRNA,其中包含的序列会被称为“剪接体”的RNA/蛋白质复合物切除,两端相互连接形成连续的核酸序列,从而形成成熟的mRNA。DNA分子断裂基因的存在赋予了基因功能发挥更大的潜力。基因重叠:长期以来,人们认为在同一DNA序列中不可能存在重叠的阅读结构。但在1977年,韦纳在研究Q0病毒的基因结构时,首次发现了基因的重叠现象。1978年,Feir和Sangor在研究和分析φX174噬菌体的核苷酸序列时,也发现5375个核苷酸的单链DNA中包含的10个基因中有几个基因有不同程度的重叠,但这些重叠的基因有不同的阅读框架。在噬菌体G4、MS2和SV40中发现了重叠基因。基因的重叠使得有限的DNA序列包含了更多的遗传信息,是生物对其遗传物质的经济合理利用。假基因:1977年,G Jacp在研究了非洲爪撑5SrRNA基因簇后提出了假基因的概念,它是一种失活的基因,其核苷酸序列与其对应的正常功能基因基本相同,但不能合成功能蛋白。假基因的发现是真核生物应用重组DNA技术和序列分析的结果。在大多数真核生物中都发现了假基因,如Hb假基因、干扰素、组蛋白、α球蛋白和β球蛋白、肌动蛋白以及人的rRNA和tRNA基因都含有假基因。因为假基因不起作用或者不能有效地起作用,所以有人认为假基因相当于人类的微量器官,或者作为互补基因。移动基因:1950年,美国遗传学家麦克林托克首先在玉米基因组中发现了移动基因。她发现玉米染色体上有一个控制基因叫Ds,会改变位置,同时会引起染色体断裂,使与其离开或插入位置相邻的基因失活或恢复稳定性,从而导致玉米籽粒性状的改变。这项研究在当时并没有引起重视。20世纪60年代末,英国生物化学家夏皮罗和前西德生物化学家西特在细菌中发现了一种被称为插入序列的位置可移动的遗传因子,70年代初又发现了一些细菌质粒的耐药和可移动基因。到20世纪80年代,至少有20种这样的基因。在20世纪90年代之前,科学家最终通过实验证明了麦克林托克的观点,可移动基因不仅可以在个体的基因组内移动,还可以在个体之间甚至物种之间移动。众所周知,可动基因在真核细胞中普遍存在。基因迁移性的发现不仅打破了遗传DNA恒常性理论,也为理解肿瘤基因的形成和表达以及生物进化中的信息膨胀提供了新的启示和线索。