多核技术的发展历史

多核技术的历史与现状

本文将介绍多核技术这一当代新技术的历史和现状。从实际需求出发,介绍了多核技术的发展背景和技术支持,并简要阐述了多核技术的前景。本文还介绍了多核技术在中国的一些进展。以及“龙芯”的部分情况。

本文概述:

1.多核技术的定义

2.多核技术背景。

3.多核技术的现状

4.多核技术在中国的发展。

总结

第1章多核技术

1.1多核技术的定义

在当代,由于社会的进步和社会需求的不断增加,面对市场规模和业务需求的不断提高,高性能计算机已经成为不可或缺的数据处理工具。但是由于单核多线程已经不能满足当前的需求,计算机领域出现了一种新的技术——多核(内部)技术。多核是指在一个处理器中集成两个或多个完整的计算引擎(核心)。最显著的是多核处理器技术,这也是CPU设计中的先进技术。它在一个芯片上集成了两个以上的处理器内核,以增强计算性能。CMP通过在多个CPU内核之间分配工作负载,并依靠高速片内互连和高带宽的内存和输入/输出(I/O)管道来提高系统性能。

1.2多核技术的应用

随着多核技术的发展,超级计算机诞生了。2009年6月19日,造价2亿元、峰值运算速度超过每秒200万亿次的超级计算机“魔方”在上海开始高速运行。有了“魔方”,上海超算的“脑力”增加了20倍。“黎明4000A”支持的300多个用户,已经将大部分用户搬到了魔方,包括天气预报、生物制药、生命科学、汽车、核电、钢铁、新材料、土木工程、物理、化学、航空、航天、船舶等几十个应用领域。

除了老项目,魔方还有望担当重任:上海的商用飞机、新材料、医药、重大装备、新能源、电动汽车等九大高新产业,都将依托高性能计算技术。

或许,有一天,当你乘坐一架国产大飞机时,不仅机身设计取决于超级计算机的贡献,出现在你面前的飞行员和乘务员的调度顺序也是由超级计算机决定的。在“超级计算机500强”榜单中,美国291台超级计算机中有35台用于金融企业或相关机构。未来,魔方将助力上海国际金融中心建设,设计衍生产品,控制风险,为金融机构提供各种计算解决方案。

第二章是多核技术的背景。

2.1多核技术与单核多线程技术的区别

单核多线程就是在单个计算引擎中以主频的形式执行多个程序。虽然看起来是多个程序并行执行,但实际上还是一个处理器在工作,只是主频高,不会被用户察觉。

多核技术是将两个或多个完整的计算引擎集成在一个处理器中。它可以同时在多个计算引擎上运行程序,或者一个程序可以在多个处理器上运行。在没有执行顺序冲突的情况下,真正缩短了运行时间,提高了计算效率。

2.2多核技术的出现

单核多线程虽然表面上解决了多个程序不能同时执行的困境,但它始终是一个计算引擎在工作。未来的主流应用要求处理器具备同时执行更多指令的能力,仅仅从单核处理器中提取更多的并行性是不可能的。

2.2.1多核后台

因为功耗问题限制了单核处理器不断提升性能的发展途径。众所周知,处理器作为计算机的核心,对输入的数字化数据和信息进行加工处理,然后输出结果。假设计算机的其他子系统都不存在瓶颈,那么影响计算机性能的核心部件就是处理器。反映在指令中的是处理器执行指令的效率。

处理器性能=主频x IPC

从上面的公式可以看出,衡量处理器性能的主要指标是每个时钟周期(IPC)可以执行的指令数和处理器的主频。实际上,频率就是每秒钟周期性变化的次数。主频是1GHz,也就是1秒,1亿个时钟周期。

因此,提高处理器性能有两种方法:提高主频和增加每个时钟周期(IPC)执行的指令数。处理器微架构的改变可以改善IPC,提高处理器的性能。但是对于同一代架构来说,提高IPC的范围非常有限,所以在单核处理器时代,通过提高处理器主频来提升性能是唯一的手段。

可惜提高处理器主频不是无止境的。从下面的推导可以看出,处理器的功耗与处理器内部电流和电压的主频平方和成正比,而主频与电压成正比。

因为:“处理器功耗与电流x电压x电压x主频成正比”和“主频与电压成正比”

所以:“处理器的功耗与主频的三次方成正比”如果通过提高主频来提高处理器的性能,那么处理器的功耗将呈指数(三次方)和非线性(一次方)增长,很快就会碰到所谓的“频率墙”。能耗的快速增加使得业内大多数厂商都在寻找另一个提高处理器性能和改善IPC的因素。

提高IPC可以通过提高指令执行的并行性来实现,而提高并行性有两种途径:一种是提高处理器微架构的并行性;二是采用多核架构。

在相同的微架构下,为了达到处理器IPC的目的,可以采用多核的方式,有效控制功耗的急剧上升。看下面的推演。

因为:“处理器功耗与电流x电压x电压x主频成正比”和“IPC与电流成正比”

所以:“处理器功耗与IPC成正比”

从单核处理器到多核处理器,如果主频不变,理论上IPC可以翻倍,理论上功耗最多翻倍,因为功耗的增加是线性的。实际上,当双核处理器的性能达到与单核处理器相同的性能时,前者的主频可以更低,因此功耗呈指数级下降(立方)。体现在产品上就是双核处理器的起飞频率可以低于单核处理器,性能更好。

可以看出,未来处理器的发展趋势是:为了达到更高的性能,在相同的微架构下,可以在保持较低主频的同时增加处理器的数量。较低的主频也有效控制了功耗的上升。

2.2.2技术的发展导致了多核技术的出现。

当然,光有想法是不够的。没有辅助技术的支持,所有的想法都无法实现。

自上世纪八九十年代以来,推动微处理器性能不断提升的主要因素有两个:半导体技术的快速进步和体系结构的不断发展。半导体技术的每一次进步都为微处理器体系结构的研究提出了新的问题,开辟了新的领域。体系结构的发展在半导体技术发展的基础上进一步提高了微处理器的性能。这两个因素相互影响,相互促进。其实有些规律的东西是很难维持的。多核的出现是技术发展和应用需求的必然产物。这主要基于以下事实:

1.晶体管时代即将到来。

根据摩尔定律,微处理器的速度和单片集成度每18个月就会翻一番。通用微处理器经过发展,主频已经超过4GHz,数据宽度达到64位。制造技术也在以惊人的速度发展。0.13um工艺的微处理器已经量产,下一代90nm工艺的微处理器也已经问世。按照这个速度,到今年,芯片上集成的晶体管数量有望超过6543.8+0亿。因此,架构的研究遇到了一个新的问题:如何有效利用大量的晶体管?国际上对这一问题的研究方兴未艾。多核通过在一个芯片上集成多个简单的处理器内核,充分利用这些晶体管资源,最大限度地提高其能效。

2.建筑发展的必然性

超标量结构和超长指令字结构广泛应用于高性能微处理器中。但是它们的发展遇到了不可逾越的障碍。超标量体系结构使用多个功能单元同时执行多条指令,从而实现指令级并行(ILP)。但其控制逻辑复杂,难以实现。研究表明,超标量结构的指令集并行度一般小于8。超长指令字结构使用多个相同的功能组件来执行一条超长指令,但也存在两大问题:编译器技术支持和二进制兼容性。

3.能源消耗在增加。

随着工艺技术的发展和芯片复杂度的增加,芯片发热现象日益突出。多核处理器中的单核速度更慢,处理器消耗的能量更少,产生的热量也更少。同时,在原有单核处理器中增加的晶体管可以用来增加多核处理器的核心。多核处理器在满足性能要求的基础上,通过关闭(或下调)部分处理器等低功耗技术,可以有效降低能耗。

4.设计成本的考虑

随着处理器结构的日益复杂和人力成本的不断上升,设计成本随时间线性甚至超线性增长。多核处理器通过重用处理器IP可以大大降低设计成本。同时,模块的验证成本也显著降低。

5.门延迟逐渐缩短,而全局连接延迟不断延长。

随着超长指令字技术的发展,晶体管特征尺寸正在缩小,这使得晶体管栅极延迟减小,但互连延迟增加。当芯片的制造工艺达到0.18微米甚至更小时,线延迟已经超过门延迟,成为限制电路性能提升的主要因素。在这种情况下,由于CMP(芯片多处理器)的分布式结构中全局信号较少,与集中式结构的超标量处理器结构相比,在克服线延迟的影响方面更有优势。

第三章多核技术现状

3.1多核技术的各界支持

自多核技术出现以来,社会各界都给予了高度的支持。在教育方面,中国有超过120所高校开设了多核技术或并行计算课程。为将来并行程序的设计服务。另一方面,许多大公司和网络游戏代理公司花费巨资支持超级计算机的研发,以提高其竞争水平。很多媒体及时播报多核技术的发展。及时提供给社会相关人士研究。很多大企业已经开始培养并行程序开发和超级计算机使用的人才。从65438年到0993年,德国曼海姆大学的Hans和Eric发起建立了全球超级计算机500强排行榜,极大地推动了多核技术的发展...

3.2多核技术的成就

多核技术的发展至今已经取得了辉煌的成就。已经代表了一个国家的科研实力。功耗更低、性能更好、体积更小的超级计算机已经成为全球竞争更加激烈的高科技领域。

2005年,IBM制造的蓝色基因在500强中排名第一。处理器数量达到65536,实测值为136800GF,峰值达到183500GF。到2009年6月底5438+065438+10月,美国橡树岭国家实验室的克雷XT5超级计算机“美洲虎”排名第一,其运算速度已经达到每秒65438+759万亿次。幸运的是,中国的“天河一号”也已经跻身前五,创下了中国超级计算机在世界上的最高排名。他的运行速度是每秒563万亿次。该产品采用英特尔至强处理器,AMD GPU作为加速器,* * *拥有76,5438+0,680个计算核心。第34届超级计算机500强中,使用英特尔处理器的有4.2台,占比80.4%。52采用IBM架构,42采用AMD Opteron处理器。

所以,我们要深思一个问题,为什么中国没有自己的处理器?别担心。其实中国已经在研究他自己的处理器了,是中国的“龙芯”。目前,龙芯正式迈出了“以企业为主体,以市场为导向,产学研相结合”的步伐。相信用不了多久,我们听到的就是:“我用的是国产的龙芯处理器”。

第4章多核技术在中国

4.1中国多核技术成果

虽然多核技术已经应用到很多领域,尤其是超级计算机,但是全世界也非常关注这方面。让我们来看看中国超级计算机的发展:

中国从1978起步,经过5年的发展,中国首台命名为“银河”的第十亿台巨型计算机在国防科技大学诞生。它的研制成功向世界宣告,中国成为继美国、日本等国之后,能够自主设计制造超级计算机的国家。

1992年,国防科技大学研制出峰值速度为每秒1亿次的“银河二号”通用并行超级计算机,主要用于中期天气预报。

1993年,国家智能计算机研究开发中心(后成立为北京曙光计算机公司)研制成功曙光一号全对称存储多处理器,这是我国第一台设计研制的基于VLSI的通用微处理器芯片和标准UNIX操作系统的并行计算机。

1995年,曙光公司推出曙光1000,峰值速度为每秒25亿次浮点运算,实际运算速度提高了每秒10亿次浮点运算。曙光1000类似于美国Intel公司在1990年推出的大规模并行计算机体系结构和实现技术,与国外差距缩小到5年左右。

1997年,国防科技大学成功研制出峰值性能为每秒1300亿次浮点运算的Galaxy - III并行超级计算机系统。

从1997到1999,曙光公司陆续在市场推出曙光1000A、曙光2000-I、曙光2000-II超级服务器,峰值运算速度超过每秒1000亿次浮点运算。

65438-0999年,国家并行计算机工程技术研究中心研制的峰值运算速度为每秒3840亿次的神威I计算机在国家气象中心投入使用。

2004年,由中国科学院计算技术研究所、曙光公司、上海超算中心研制的曙光4000A,实现了每秒10万亿次运算的速度。

2008年,“沈腾7000”是国内首个异构集群系统,Linpack性能超过每秒106.5万亿次。

2008年,曙光5000A实现峰值速度230万亿次,Linpack值180万亿次。作为面向国家经济建设和社会发展巨大需求的网格超级服务器,曙光5000A可以完成各种大型科学工程计算和商业计算。

2009年6月29日,10,中国首台千万亿次超级计算机“天河一号”诞生。这台计算机的峰值速度为每秒1.206万亿次,Linpack的实测性能为每秒563.1万亿次,这使中国成为继美国之后世界上第二个研制千万亿次超级计算机的国家。

每一项都代表着中国国力和中国国际地位的不断提升!或许你会发现,这些超级计算机虽然来自中国,但处理器都是进口的,真的很尴尬!

4.2中国“龙芯”简介

从上面的介绍,我想大家会问,为什么那么多超级计算机都用微软的处理器?那么中国是不是也应该有自己优秀的处理器?不用担心,中国的“龙芯”是中科院计算所自主研发的通用CPU,采用简单指令集,类似于MIPS指令。

经过多年的研发,中国的“龙芯”已经发射:“龙芯一号”、“龙芯二号”,目前“龙芯三号”也在研发中。目前“龙芯”可以具有灵活可配置的IP核架构、可配置的多接口、可配置的内外时钟关系等多思维特点。龙芯的出现,不仅仅是因为中国自主研发了自己的CPU产品,更是因为它穿透了困扰中国科技人员的一团迷雾。凭借自己的技术研发实力,中国也可以研发生产被国外垄断的产品。目前很多年轻人对国货表现出一致的不信任,尤其是数码产品。日本人非常善于引进外国技术,然后学习、模仿、创新。中国人也有这种精神。中国既然能在困难条件下研制两弹一星,在航天领域与美欧并肩前进,在芯片研制领域当然也能做到!

“干儿子”是我们自己的孩子,我们要用心去爱他,保护他。虽然他现在还不如英特尔,但至少暂时没有几个国家能出这种还不如英特尔的玩意儿!这是我们的骄傲!回顾霍元甲时代,作为香港特别行政区的电子工作者,笔者再次被深深打动。我们是龙的传人,不是东亚病夫!我们坚信龙芯的成功是必然的!我们期待“龙芯”带来更多更大的惊喜!

4.3多核技术的前景

多核技术让计算机领域从“山重水复疑无路,柳暗花明又一村”。进退两难。当单核的发展走到了死胡同,CPU厂商开始改变设计范式。未来所有微处理器都将发展成多核设计的主流,传统单核处理器退居二线。关于双核,我觉得没必要解释,大家都很熟悉。从ALTHON 64 X2系列的出现,到现在酷睿的一家独大,再到双核安腾2的发布,双核已经成为当前市场的主流产品。在服务器领域,双核处理器以其优异的性能和较低的成本被大多数企业所接受。

从软件设计的角度来说,双核/多核也改变了一些现有的观念。英伟达首席科学家大卫·柯克(David Kirk)曾抱怨多核处理器给游戏开发者带来了极大的编程困难。在开发硬件的同时,英特尔在软件方面也做了相应的改进。

在2007年多核应用与英特尔服务器平台大会上,英特尔数字企业集团副总裁兼服务器平台事业部总经理Kirk Skaugem先生表示:“英特尔实际上是全球最大的软件工具公司。我们不仅仅是一家硬件公司。如果你想优化你的多核,不优化是无法实现所有性能的。如果你访问我们的网站,你可以看到我们的未来不会停留在四核,而是会变成几十核甚至更多,所以我们在这里。可以看出,英特尔对多核技术做了充分的准备,这必然导致多核技术成为主流。

今年年初,在由英特尔网络部主办、CSDN协助的英特尔多核平台编程优化大赛中,涌现出了一大批优秀作品,充分利用了双核/多核多线程和并行计算技术,大大提高了代码交付速度。

事实证明,最新的多核和超线程编程工具可以提供丰富的资源供开发者使用。只有抛弃旧的工作习惯,尽快转变观念,跟上时代的进步,多核超线程编程才不会成为不可逾越的障碍。

第五章总结

首先,我要感谢我的老师给我们介绍了一种新技术——多核技术。而且我在学习的过程中锻炼了自己的思维,逐渐形成了并行计算的概念,我觉得这对我以后的生活和工作很有帮助。我从课程中学到了很多,同时也强化了之前的知识。例如,我在编程方面得到了另一种锻炼;从数据结构方面,我懂的算法比较多;从时间复杂度方面,我知道多核算法可以实现以前单核运算不能实现的情况,等等。最终我们以论文投稿的形式毕业,也锻炼了我们查询检索信息的能力。感觉这门课很充实,对这门充满挑战的课也很感兴趣。衷心感谢你。

参考资料:并行计算;

百度:多核技术的历史与现状;

电子工程专辑-多核技术

抽象计算机世界;

新浪科技时代;

CSDN博客