ARM 发布新Neoverse平台发展路线图，瞄准HPC高性能计算-中存储网

2020-09-29 15:32:15 来源：HPCw

中存储网消息，近日外媒报道，英国半导体设计公司Arm近日发布了其Neoverse产品路线图的详细信息，推出了Arm的第二代N系列平台V1（代号Zeus）和N2（代号Perseus）。芯片IP供应商表示，新平台将比Neoverse N1分别提供50％和40％的单线程性能。

Neoverse V1对可伸缩矢量扩展（SVE）的支持-实现为两个256位宽的矢量-允许在更宽的矢量单元上执行SIMD整数，bfloat16或浮点指令。SVE的设计与单元的宽度无关，因此在一个平台上为SVE编译的应用程序可以在任何有效的SVE实现上运行，该实现可以使用128位至2,048位的宽度（以128位为增量）。

“使用SVE，我们可以确保软件代码的可移植性和寿命以及有效的执行，” Arm的基础设施业务部门高级副总裁兼总经理Chris Bergey说。

Arm发布新Neoverse平台发展路线图，瞄准HPC高性能计算

预计的性能提升，较宽的向量可提供更多的应用程序性能

资料来源：Arm

V1 Neoverse核心的新SVE功能借鉴了Arm在A64FX平台上与富士通合作的经验，A64FX平台是世界上排名第一，第一台基于Arm的超级计算机富岳Fugaku的核心，具有SVE功能。

Arm的HPC业务主管Brent Gorda指出，许多Arm合作伙伴正在开发针对数据分析和高性能计算工作负载的基于Neoverse V1的解决方案。其中之一就是SiPearl，它选择了宙斯（Zeus）内核为其第一代服务器处理器提供动力，该处理器是欧洲百亿亿美元计划的基础。

除了超级计算之外，Gorda还引用了SVE在媒体处理，加密/解密，网络处理以及边缘环境中的应用程序。

在上周为媒体举行的预备情况通报中，Arm展示了V1的早期仿真结果，该结果显示在实现级别上比N1更快（请参见上面的条形图）。

Bergey说，硅合作伙伴将完全控制SVE电压和频率转换。正如富士通的A64FX CPU能够做到的那样，这使它们能够在执行SVE代码时全频运行。

伯吉说，Arm继续通过投资CCIX和CXL来推进其互连路线图。

Bergey说，CCIX用于双向相干通信，其使用方式有很多灵活性。

尽管经典情况是多路计算，但小芯片有一个新兴的用例。Bergey说：“您已经听到了好处：芯片尺寸减小，成品率增加，成本降低，并且它使您可以继续增加核心数量和性能。”

Arm还在探索紧密耦合的异构计算。“随着摩尔定律缩放速度的放慢，人们对ARM CPU复合体与各种加速器和内存的芯片间耦合感兴趣，” Bergey说。

N系列，V系列和E系列的比较（来源：Arm）

该公司还计划提供CXL，以提供内存一致性附件。Bergey强调了用例，“最令人期待的（正在）内存池和扩展”。

他说，它可以“在一组连接的节点之间共享大量内存，或者可能意味着将大量新兴内存附加到单个节点上，”他强调了机器学习训练和推理的好处。

V1强调最苛刻工作负载的最佳性能，而N2强调横向扩展性能。Bergey说：“它不会完全具有V1的每个线程的性能，但是它将在恒定的TDP中支持更多的内核。”

他补充说，虽然每个CPU的内核数量没有硬性限制，但是客户有一个要优化的TDP，它与内核数量目标有关。

“我们正在围绕性能进行优化，以提高功率和每个区域的性能。这样一来，您就可以在每个TDP中打包更多的内核。无论是250瓦的云SOC，还是20瓦的5G基站SOC，”他说。

Arm希望其V1 IP可以在7纳米和5纳米工艺节点上实施，不同的客户可以根据其时限利用这两个节点之一。

Bergey指出，他们为V1和N2预测的性能提升是基于IPC的，与节点无关。

Arm服务器芯片的牵引力继续增加。去年，AWS首次推出了基于N1的Graviton2处理器。Ampere将于今年年底提供其128核N1处理器（Altra Max）的样品。Fugaku利用定制的Arm平台（由Fujitsu和Riken开发的A64FX）来设置多个基准记录，并协助对抗COVID-19。Marvell的Arm实施ThunderX取得了一些成功（在2018年宣布了首个Petascale Arm系统，并赢得了其他几项重大设计大奖），但最近宣布了向半定制的转变。

强劲的发展势头引起了芯片暨数据中心公司Nvidia的关注。在加深了对Arm平台的支持之后，Nvidia决定继续自己的公司。在获得监管部门批准之前，英伟达将以400亿美元的价格收购母公司软银的IP芯片部门。

N系列，V系列和E系列的比较（来源：Arm）

继续阅读 ARM HPC市场