/ 中存储网

伯克利实验室主任谈HPC架构的未来,机器应该更小

2019-07-01 23:04:54 来源:中存储

2030年大规模的科学计算会是什么样子?随着摩尔定律的即将消亡,HPC技术的用户和制造商仍然有更多的问题而不是答案,因为他们试图弄清楚他们下一个最佳投资应该是什么。当John Shalf--Lawrence Berkeley国家实验室计算研究部的计算机科学系主任,准备前往德国法兰克福的ISC19发表主题演讲时 , 分享了他对计算技术未来发展的看法以及对百亿亿次(exascale)架构的展望。

伯克利实验室主任谈HPC架构的未来,机器应该更小

您在ISC的主题演讲重点是什么?

计算的前景在摩尔定律结束后会是什么样子。我们已经开始依赖摩尔定律,并且真正期望每一代芯片都能比上一代芯片的速度,性能和效率提高一倍。百亿亿次(exascale将是摩尔定律的最后一次迭代?还是我们将开始为计算机的未来开发一款新的机器?

在摩尔定律之后,你有多久思考/谈论HPC的下一步?

我在2008年参与了Exascale Computing Initiative的讨论,但实际上,我对此的兴趣早于exascale。早在2005年,加州大学伯克利分校的David Patterson小组就在并行计算实验室谈论它,我们花了两年的时间讨论Dennard缩放的结束,最终,我们发表了“并行计算研究的景观:伯克利的观点”, 由于时钟频率不再以指数速率缩放,因此预测并行计算将无处不在。紧随其后的是DARPA 2008年Exascale报告,该报告为HPC的Exascale Initiative奠定了基础。所以Dennard缩放的结束只是其一,另外一点是,当我们不能完全收缩晶体管,这就是摩尔定律的真正结束。Exascale正在解决第一步中的大规模并行性问题,我一直担心在Exascale Computing Initiative和后续项目的整个10年期间第二次下滑,可以参见伯克利报告和DARPA 2008报告。

摩尔定律的放缓如何影响HPC技术和行业本身?

我们看到采购周期已经延长,因此机器的更换速度比历史上更慢。伯克利实验室的Eric Strohmaier一直在密切关注TOP500的替代率,他发现系统更换速度明显放缓。我也从工业界的同事那里听说,这是一个令人不安的发展,将影响他们未来的商业模式。但我们也在大型数据中心领域看到了这些影响,例如谷歌,Facebook和亚马逊。谷歌实际上已经开始设计自己的芯片,专门针对其工作流程的特定部分,例如Tensor Processing Unit(TPU)。我们可能会看到未来更加专业化,

光刻行业是否经历了平行的范式转变?

是的,光刻行业也受到影响,并且需要改变该行业的经济学。我们在过去十年中看到的是,我们已经从近十几家前沿工厂下降到两家。Global Foundries最近退出了一家领先的晶圆厂,英特尔在实现其10nm晶圆生产线方面遇到了巨大的麻烦。很明显,正如我们所说,光刻市场正在发生巨大的构造变化,最终如何解决这一问题仍不清楚。

我们是否必须开始想象一个全新的计算技术开发和生产过程?

我认为必须重新审视我们选择和采购系统的方式。虽然使用用户应用程序代码运行基准来评估新兴系统的性能和可用性是我们选择使用通用处理器的系统的一种很好的方式,但它似乎不是一个非常好的方法来选择可能具有的系统科学的专业特征。在未来,我们需要与供应商更密切地参与机器的设计,以提供对科学工作负载真正有效的机器。这与可持续经济模式同样重要,因为它是设计过程的变化。最传统甚至技术最优雅的解决方案可能无法生存,但是赚很多钱的解决方案将会存在。但我们目前的经济模式正在打破。

展望未来,我看到了前进的三条道路。首先是专业化和更好的包装 - 专业化意味着为目标类应用设计机器。例如,谷歌TPU的成功案例已经证明了这一点。这是最直接的前进道路。

另一个潜在的前进道路是新的晶体管技术,它取代了更节能和可扩展的CMOS。但是,我们从过去的经验中了解到,从实验室演示到生产产品需要大约10年的时间。有很有希望的候选人,但实验室没有明确的替代品,这意味着我们已经晚了10年才能采用摩尔定律失败的方法。我们需要通过更加全面的材料到系统协同设计流程,大大加快该领域的发现过程。

第三种方法是探索替代的计算模型,如量子和神经形态以及其他相关方法。这些都很棒,但它们确实将计算扩展到数字计算表现非常糟糕的领域。它们不一定是数字通用计算的替代技术; 它们只是扩展到数字化开始不太有效的领域。所以我认为这些都值得投资,但它们不是替代技术。他们将占有一席之地,但他们将在多大程度上适用仍在探索中。

新的芯片材料的发展如何 - 它们在HPC架构的未来可能扮演什么角色?

新材料绝对是CMOS替代品的一部分。这不仅仅是新材料; 固态物理学的基本突破将需要创造一个合适的CMOS替代品。现有晶体管技术的基本操作原理不能超出我们今天所看到的程度。因此,要真正实现CMOS替换,将需要一种新的物理原理来进行切换,无论是电气,光学还是磁性切换。需要发现一种全新的物理原理,而这又需要新的材料和新的材料接口来实现有效和可制造的解决方案。

当你看看这个领域现在发生的事情时,有没有积极的一面?

是的,肯定有积极的一面。我们相信协同设计处理器不仅需要软件和硬件人员进行协作,还需要这种协作一直到材料和材料物理层面。对于国家实验室而言,这是我们与各自实验室材料科学部门的同事密切合作的绝佳机会。我在国家实验室工作,因为我对跨学科合作感到兴奋,显然,这是我们在这一领域取得进展的唯一途径。最近的ASCR极端异质性和DOE微电子BRN显示出DOE对这一领域真正需要的深度共同设计和协作研究的浓厚兴趣。所以在这种程度上,这是一个激动人心的时刻。

当您考虑HPC和超级计算架构和技术的未来时,您认为从现在起10年后它们会是什么样子?

我认为我们将拥有更小的机器,这些机器对于他们所针对的工作流程更有效。三十年来,我们已经习惯了不断发展,规模越来越大的机器,但这似乎并不是在后埃尔卡斯里和后摩尔时代创造有效科学的成功方法。