英特尔至强处理器技术简介
至强处理器使用与常规桌面CPU相同的微结构(微内核),但更关注内核数量而不是时钟频率,并为服务器和工作站添加了高级功能,如ECC内存、更多内核、更大的RAM和缓存,以及提供企业级可靠性、可用性和可维护性的机器检查架构(MCA)异常处理机制。此外,一些型号还支持QPI(快速通道互连)和UPI(超级通道互连)总线,从而将多个CPU连接在一起,从而提供2通道、4通道和8通道等多通道处理能力。。
目前有六个系列的至强处理器:
此外,至强还包括至强融核处理器,最新的至强融核处理器基于英特尔?集成众核架构(MIC架构)可以为要求最苛刻的高性能计算应用提供大规模并行处理和矢量化服务,最高支持72个内核和36M L2缓存。
多路互连技术用于在单个主板上安装多个互连的处理器,主要包括:
众核处理器是专为高度并行处理而设计的特殊多核处理器。它不追求流水线深度和超线程来提高单核性能,而是包含大量简单独立的处理器核,因此具有更高的吞吐量或更低的功耗,但延迟更高,单线程性能更低。
缓存一致性是限制多核处理器扩展的难点。众核处理器通过消息传递、临时内存、DMA、分区全局地址空间(PGAS)和只读/非统一高速缓存来解决这一难题。GPU实际上可以被视为具有多个着色器处理单元的众核处理器。
多通道存储技术是一种可以提高存储数据传输性能的技术。通过在DRAM和存储器控制器/芯片组之间增加更多的并行通信通道,可以增加数据传输的带宽。理论上,每增加一个通道,数据传输性能会比单个通道提高一倍。一般来说,多通道对内存规格和插槽都有要求,满足要求才能启用多通道模式。
目前最常见的多声道技术都是双通道设置。例如,两组64位DDR提供128位DDR通道。支持四通道技术的处理器包括英特尔/AMD高端处理器、包含ARM CoreLink CCI-500技术的Cortex-A72处理器以及高通和三星的高端处理器。AMD EPYC和Cavium ThunderX2等服务器处理器支持八通道技术。此外,Intel 2012展示的Haswell-EX架构也支持八通道DDR4。
多线程技术包括同时多线程(SMT)和时间多线程:
时态多线程也叫交叉多线程,即在一个时钟周期内发出一条指令,不同线程的多条指令交替发出。目前时间多线程只出现在CDC 6000(1960s)、TerMTA (1988)、XMOS XCore XS1(2007)等桶型处理器上。
英特尔服务器处理器提供的硬件错误检测和报告机制包括系统总线错误、ECC错误、奇偶校验错误、高速缓存错误、TLB错误等。,包括一组用于设置MCA的MSR寄存器和用于记录硬件错误的附加MSR寄存器。
在ECC技术出现之前,内存中使用最多的另一种错误检查技术是奇偶校验技术,这种技术只能发现错误而不能纠正错误。
ECC内存足以实现错误检查和自动纠错技术,可以自动检测和纠正最常见的内部数据损坏,使系统能够正常运行,不会被错误中断。通常情况下,ECC内存使内存系统保持无单位错误,即使用5位ECC代码纠正8位数据中的1位错误。每次数据位加倍,ECC只增加1位,即数据位为16位时ECC位为6位,数据位为32位时为7位,数据位为64位时为8位,以此类推。
向量处理技术可以直接操作一维数组(向量),这与标量处理一次只能处理一个数据正好相反。矢量处理技术可以在特定的工作环境下大大提高性能,尤其是在数值模拟或类似领域。向量处理技术最早出现于20世纪70年代初,成为70-90年代超级计算机设计的主导方向。由于常规处理器设计的性价比迅速下降,基于向量处理的超级计算机在20世纪90年代后期逐渐放弃了主导地位,目前大多数商用CPU实现都可以提供某种形式的向量处理指令来处理多个矢量化数据集,这被称为SIMD(single instruction multiple data)。此外,还有MIMD(多指令多数据)技术,用于使用多条指令处理多方向量化数据集。