美国旧金山当地时间11月6日上午9点(北京时间11月7日今夜凌晨1点),AMD举办了主题为“Next Horizon”的新品技术沟通会。
美国旧金山当地时间11月6日上午9点(北京时间11月7日今夜凌晨1点),AMD举办了主题为“Next Horizon”的新品技术沟通会。AMD正式公布了新一代采用7nm工艺的CPU、GPU核心,同时还发布了两款Radeon Instinct计算卡,展示了全球首款基于7nm工艺Zen 2架构的第二代数据中心处理器EPYC ROME。
台积电7nm工艺加持
AMD目前的处理器、显卡均采用14/12nm工艺,接下来将跨过10nm而直奔7nm,代工伙伴本来是从AMD独立出去的GlobalFoundries,但是后者不久前已经正式宣布放弃7nm及之后的更先进工艺,因此AMD的7nm CPU/GPU都全面转向台积电代工。
虽然这次宣布很突然,但是种种迹象表明,AMD早早就完成了代工伙伴的迁移,对新产品的研发、发布进程并无明显影响,所以才有了这次的发布会。
根据台积电提供的数据,7nm相比于目前的14/12nm可以将晶体管密度提高一倍,同等频率下功耗可以降低一半,而同等功耗下性能提升可以超过25%。
如果说12nm更多地是在“数字”上领先Intel 14nm,这一次7nm则是在技术上完全实现超越,也能稍微领先Intel仍在难产的10nm。
更先进的制造工艺一直是Intel最强有力的武器,但这次竟然被AMD完全超越,实在是令人唏嘘,即便是Intel一再强调自己的10nm相当于其他家的7nm也无济于事,毕竟人家的产品马上就要出来了。
7nm Zen 2架构
AMD的Zen架构自推出以来,取得了空前成功。而现在我们终于迎来了基于最新的7nm工艺加持的第二代Zen 2架构。
Zen 2这是世界上第一个7nm工艺的高性能x86 CPU,除了新工艺主要变化包括:CPU核心执行增强、更深入的安全增强、模块化设计灵活配置并降低制造难度。
Zen 2实现了两倍于第一代的吞吐能力,这主要得益于执行流水下的改进、浮点单元和载入存储单元的翻番、核心密度的翻番、每操作功耗的减半。
在前端设计上,Zen 2重点改进和优化了分支预测、指令预取、指令缓存、操作缓存。
而在浮点方面,Zen 2将浮点宽度翻了一番达到256-bit,载入存储带宽同样翻了一番,并提升了分发/回退带宽,所有模块都保持着很高的吞吐。
安全性方面,AMD重点强调了新架构可以在硬件层面免疫Spectre幽灵安全漏洞。
Zen 2架构支持更多核心,但并不是单纯地增加核心数量,而是采用了特殊的组合结构:EPYC霄龙最多单路64核心128线程,分为八个Die,每个Die内八个物理核心,同时外部还有一个单独的I/O Die,集成内存控制器、Infinity Fabric高速总线、I/O输入输出,专门负责联络各个Die与物理核心。
这种新的模块化设计更加灵活,可以单独针对每个模块进行优化、调配,同时借助I/O Die大大优化了整体延迟与功耗。
不过注意,CPU Die部分用的是7nm工艺, I/O Die部分则还是14nm,因为后者大部分都是模拟电路,对新工艺并不敏感,即便上了7nm也不会带来集成度、性能、功耗的明显改善,成本却会明显增加,所以采用了这种混合工艺模块组合。
事实上,Intel也正在同一颗芯片内尝试不同工艺的组合,都是出于同样的目的。
以上说的都是Zen 2架构的理论部分,最终落实到EPYC霄龙、Ryzen锐龙产品上,还会有不同的表现,但可以预料,新架构新工艺,必然会带来明显更高的频率、更低的功耗,而且无论桌面还是服务器,AMD这几年都会保持前后代兼容。
此前,AMD已经多次公开强调,7nm工艺Zen 2架构的Ryzen锐龙、EPYC霄龙处理器都会在2019年如期发布,后者已经向客户交付样片。
AMD还首次确认,Zen 3预计在2020年走上7纳米 制程,Zen 4开发已接近尾声,相关产品推出时间上估计至少会在2021年。
基于7nm GPU的Radeon Instinct计算卡
除了CPU处理器转向7nm工艺,AMD GPU图形计算也迎来了7nm时代,但首款产品不是Radeon RX游戏卡,而是Radeon Instinct计算卡!
AMD今天正式宣布了全新一代Radeon Instinct MI60、Radeon Instinct MI50,均基于7nm工艺的升级版Vega架构核心,是全球首个7nm GPU。
AMD表示,7nm Vega核心架构拥有灵活的高性能、世界最快的FP64/FP32 PCI-E浮点性能、机器学习训练和推理、领先的显存和扩展性、唯一的硬件虚拟化、端到端的ECC纠错保护。
7nm Vega核心集成了132亿个晶体管,比目前的14nm Vega 125亿个增加了6.4%,而核心面积为331平方毫米,比现在的484平方毫米缩小了足足31.6%,晶体管密度翻了一番。
同等功耗下,新核心性能提升超过25%,而同等频率下,新核心功耗降低50%。
显存搭配最多32GB HBM2,带宽达1TB/s,內建ECC纠错。
MI60、MI50的具体规格暂未公布,有点类似RX Vega 64/56的区别,不过可以确认MI60的热设计功耗为300W。
7nm Vega还是世界首个支持PCI-E 4.0技术的GPU,双向带宽64GB/s,同时借助带宽高达100GB/s的Infinity Fabric系统总线,支持四路GPU并行,而且扩展性极佳,双路性能提升99%,四路比单路提升298%,八路比单路提升664%,几乎完美。
性能方面,MI60 FP64双精度浮点最高7.4TFlops,FP32单精度最高14.7TFlops,INT整数最高118Tops,相比于同样10nm Vega核心的MI25专业性能提升最多达8.8倍,同时超越或者基本持平NVIDIA目前最强大的Tesla V100。
AMD同时宣布了开源计算平台ROCm 2.0,并继续承诺完全开源。
未来,AMD还将继续推出下一代的MI-NEXT,性能更强,连接性更好,软件兼容性更佳——或许是Navi架构?
全球首款7nm数据中心处理器
AMD还在会上公布了全球首款7nm基于Zen 2架构的数据中心处理器——Rome的部分参数规格:
包括多个7nm的用于运算的x86 chiplet,比Zen 1“Naples”EPYC性能大幅提升
另外,还有一个14纳米的I/O芯片
DDR4,Infinity Fabric,PCIe和其他I/O都在I/O芯片上
支持第四代PCIe
能够连接GPU,并在I/O芯片上通过Infinity Fabric协议进行GPU间通信。因此,对于同一CPU,则不同需要再使用PCIe或NVLink的交换芯片
每个Socket有64核,128线程
▲全球首款7纳米数据中心CPU“Rome”原型
AMD CEO苏姿丰在会上表示:“它是业内最好的数据中心处理器,我们绝对有望在2019年推出Rome。这是我们公司的主要领域,也是我们以后会发展的领域。”
从规格来看,这款7nm的服务器芯片非常强大。而相比之下,英特尔还困在与10nm的苦战里,产品预计推迟到2019年底发布。
如果AMD能够尽早推出7nm数据中心处理器,这将成为该公司在历史上首次超越英特尔,在处理器工艺节点上占据领先地位。AMD的7纳米处理器预计将比英特尔14nm的芯片更快、更密集、能耗也更低。
苏姿丰回顾了AMD EPYC服务器芯片推向市场的历程,上市15个月后,AMD EPYC 的市场表现良好,在高性能计算(HPC)、云、超大规模和虚拟环境中都扮演着重要角色。AMD认为,到2021年他们在数据中心将有290亿美元的机会,随着行业转向人工智能和机器学习,GPU正在发挥越来越大的作用。
至于2017年面市的Radeon Instinct,AMD知道自己在软件方面不行,并表示其发展关键将是力推开源。
不仅如此,亚马逊AWS也宣布采用新的AMD EPYC云服务虚拟机,AWS EC2也将提供从R5、M5a和T3a虚拟机(R5虚拟机是大型内存,M5则是数据库和企业服务的主流应用,T3虚拟机则用于博客和其他低端应用)。据称,这些虚拟机都将比AWS的英特尔虚拟机性价比高出10%。
编辑:NIKI
美国旧金山当地时间11月6日上午9点(北京时间11月7日今夜凌晨1点),AMD举办了主题为“Next Horizon”的新品技术沟通会。