硬技术:什么CPU和GPU外科医生更应该了解AMD 7nm工艺?
本月初,AMD的“Next Horizon”公布了使用台积电7nm工艺CPU和GPU的样品和概要。这也是继20年前的K7时代之后,AMD再次获得超过英特尔的工艺优势。不出意外,AMD首先走的是高单价、高利润的高端产品线:服务器用的EPYC和作为“服务器加速器”的镭龙Instinct MI,作为7nm工艺的第一枪。不过,在“全球首创7nm工艺的x86 CPU和GPU”之外,还有更多弦外之音值得仔细斟酌。
参考文章:
硬技术:Infinity Fabric,使AMD的产品日程准确。
AMD服务器产品走向7nm工艺,发布在单个芯片上,使用Infinity Fabric与多晶硅EPYC“罗马”处理器和AMD镭龙Instinct MI60通信。
相信眼尖的科技部门看到AMD发布会上展示的7nm EPYC样片,必然会注意到它一口气从原来的“四馅饺子”变成了“九馅”:8颗7nm八核芯片,加上1 14nm I/O处理器。
为了节省成本,AMD通过* * * universal“Zeppelin”SoC将Zen家族中的不同产品线堆叠在《口袋妖怪》中。比如有1个标准桌面CPU(不包括APU),4个EPYC,4个Threadripper,但是只有2个可以移动,以此类推。
从内部架构图可以清楚的看到Infinity Fabric的重要性。它不仅用于桥接不同功能单元的“血管”SDF,还用于传输控制信号,连接Zeppelin中多达2700个传感器的“神经”SCF。也是Zen微架构实现精准电源管理功能的基础。
这就是问题所在。AMD为什么不效仿,继续沿用CPU核和I/O在同一个管芯的做法?大概有三个原因:
降低风险:7nm毕竟是全新的工艺,I/O本来就是因为复杂的电气特性而难以引入最先进技术的部分。这个决定真的可以理解。性能考虑:八个处理器管芯基本相当于一个八处理器的环境,缓存数据一致性协议的效率也会成为潜在的性能瓶颈,也可能对内存映射的I/O效率产生负面影响。所以AMD会把I/O集中到一个独立的辅助处理器里,说不定还会偷偷塞一些新的IOMMU在里面,用于虚拟化应用。这个I/O处理器很可能有“其他应用”。商业因素:作为AMD晶圆厂分支的Global Foundries,在“调整发展蓝图”中途放弃了7nm工艺的百米赛跑,把7nm工艺的订单无偿给了新环台积电,但基于风险分散,增加了晶圆代工厂的筹码(别忘了AMD要和苹果竞争产能),给了提供成熟14nm工艺的“旧爱”一单接盘。这个看起来挺大的I/O处理器,实际上是否会由AMD给Global Foundries生产,我们拭目以待。概率应该很高。但有一点需要拭目以待:新的7nm制程CPU SoC块还剩下多少I/O接口?单芯片桌面7nm锐龙不可能有更多的I/O处理器吧?
参考文章:
硬技术:AMD Zen微体系结构和EPYC综述(下)
硬技术:英特尔迈向人工智能芯片的一小步:Knights Mill
至于Zen2本身在微架构层面的改进,比如改进分支预测、增加微指令缓存容量、提高电源效率等。,都属于“自然”甚至是令人瞠目结舌的项目,但有两点引起了作者的注意:
SIMD执行单元从128位扩展到了256位:但是,仍然不支持AVX-512,因为AVX-512已经有了很多向量计算机指令集的概念,比如屏蔽寄存器,用来标记数据寄存器中要处理的元素。不能直接用“512位操作用256位执行单元两次”。反正AMD有GPU,高性能计算和人工智能应用也不缺“替代品”。说白了,只是为了降低成本。参考文章
硬技术:在被英特尔处理器漏洞吓到之前,受试者需要知道什么(下)
加强对“Spectre(图中的Variant 1和Variant 2)”的抵抗:之前来自Google“Project Zero”的研究报告引起了大家对公布和预测的高性能CPU的安全质疑,AMD宣布将在Zen2中推出“解决方案”。让我们拭目以待。写了这么多,各科肯定会问:ㄟ,7nm工艺的GPU怎么样?微缩版的织女星,可以通过Infinity Fabric互联。啊?后面的纳维呢?
其实没什么好谈的。相对于已经工作了10多年,在学术机构无处不在的竞争对手,AMD在GPGPU领域看不到英伟达的尾灯。从来不是硬件不如人,而是缺少软件环境和市场开拓。不然怎么连最新的500强都看不到AMD GPU的鬼呢?
另一方面,历史的教训证明,当NVIDIA的GPU开始“肥大”时,AMD因为削减成本而走向精简功能,缩小现有产品的保守路线,后者反而会找机会发起反击。R300和RV770在过去就是很好的例子。如果7nm工艺的Vega的消费者版本出现,那将是非常令人兴奋的,如果真的有一个的话。