黄仁勋:数据中心将成为巨无霸,但AI加速计算才是未来
- 2019/3/24 7:17:36 作者: 来源:UPS应用
-
相对于前两年英伟达举办的GTC(GPUTechnologyConference)来说,今年GTC在GPU技术架构和硬件创新的进展并不明显。在Keynote环节,英伟达创始人兼CEO黄仁勋发布了一款定价...
相对于前两年英伟达举办的GTC(GPUTechnologyConference)来说,今年GTC在GPU技术架构和硬件创新的进展并不明显。在Keynote环节,英伟达创始人兼CEO黄仁勋发布了一款定价99美元的JetsonNano——除此之外,并没有此前预想中的新架构,或者“大核弹”。
尽管如此,在现场见证了Keynote之后,雷锋网(公众号:雷锋网)依然感受到了黄仁勋的激情,以及他在打造基于现有的GPU技术的应用生态方面的努力。无论是基于图灵架构和RTX技术的NvidiaOmniverse和NVIDIARTXServers服务器,还是七家世界级的厂商将推出基于NVIDIAT4GPU和NVIDIACUDA-XAI加速库的服务器,都让人体会到英伟达在技术应用生态方面的着力。
实际上,黄仁勋依旧在强调这句话:买的(GPU)越多,省的(Money)越多。
在GTC大会正式举行的第二天,黄仁勋出现在包括雷锋网在内的媒体参与的Q&A环节,他首先重点强调了本次GTC的两个核心关键词——Ray-Tracing和DataScience,随后回答了众多外界关注的关键问题,比如说未来的GPU技术路线、对以色列公司Mellanox的收购,数据中心的未来、摩尔定律的终结等。
雷锋网也针对本次Q&A的关键内容进行了提取。
一、关于英伟达对于Mellanox的收购
在本次GTC正式开幕前一周,英伟达宣布了对以色列科技公司收购,这是英伟达历史上以来最大的一笔收购。对此,黄仁勋提到了以下几点:
在摩尔定律放缓的时期,网络软件堆栈必须尽可能转移到架构上,为CPU减负;现在,CPU是一种有限的资源,所以必须尽可能地把工作从CPU中减负出来。Mellanox是CPU减负领域的一流企业。
在数据中心中,计算架构不再停留在节点上,而是将扩展到网络。整个网络都将涉及英伟达的GPU。英伟达有能力与第一大互联技术公司Mellanox紧密合作,整个行业非常欢迎它。
英伟达对Mellanox收购一案获得监管部门的批准表示乐观,这将使得英伟达加速创新并推进技术发展,以更好地服务于客户。因为我们缺乏网络技术,而我们的目标是推进网络技术,为数据中心节省成本。而英伟达的客户普遍表示支持并乐见其成。
英伟达并不经常收购公司,因为它喜欢与别人合作,而英伟达也是一个开放的平台(比如说CUDA、DGX),同时英伟达的业务模式必须是开放的。但是之所以收购Mellanox,是因为双方之间长达10年的合作,而英伟达认为Mellanox在高速、高性能计算和网络设计方面非常擅长。
英伟达为什么愿意以如此高价进行收购呢?因为Mellanox值这个价——这不是成本的问题,而是价值的问题。
二、关于3D和堆叠技术、7nm技术
本次GTC上,英伟达没有推出此前被广泛预测的7nmGPU架构,这也引起外界的质疑:在处理技术放缓的情况下,英伟达将如何看待3D和堆叠技术?而面的AMD已经推出的7nmCPU,英伟达会否会在7nm方面有所动作?
对此,黄仁勋表示:
TeslaV100已经是处理量最大的3D封装硅片,而英伟达也是台积电最大的芯片堆叠客户。事实上,3D堆叠已经有5年的历史了,有些人甚至用它来堆叠手机芯片,这样可以降低封装高度。这种技术已经存在一段时间了,它不是新东西。
但是对于英伟达来说,不仅需要3D堆叠,也需要2D堆叠。而英伟达实现2D堆叠的方法就是NVLink。英伟达也需要一定规模的数据中心,这不再是为了2D堆叠,而是为了提升处理量。为此,英伟达需要通过Mellanox来实现,将多个GPU与大型计算引擎相连。
未来,数据中心将成为一个巨大的计算引擎,而且数据中心的体积也要不断减小,而计算效果却非常惊人——这需要具备高性能技术方面的专长,也是Mellanox擅长的。
而针对外界关注的7nm技术和下一代GPU的发展,黄仁勋表示:
实际上7nm技术已经公开发售,台积电也希望能够卖给我们;我要想买它也非常容易。但是对于英伟达来说,我要考虑的问题是,购买7nm的要义和益处是什么?对NVIDIA来说,从台积电购买7nm处理器技术,并不会让我们成为一家好公司,只会让台积电变得更好。而英伟达的与众不同之处在于,我们在任何时候都能开发最具能效的GPU,而且利用的是最具成本效益的技术。实际上,我们的工程师也是架构师,他们必须开发最具能效的GPU,比如Turing;我们的贡献是兼顾效率与最佳架构——我们为Turing选择了最佳的技术,即12nm。
三、关于软硬件关系、RTX的技术应用
对于本次GTC来说,最新发布的CUDA-X加速库成为一个亮点,同时数据中心和RTX技术成为重中之重,GPU硬件被提及的次数很明显少了很多。当被问及为什么硬件在GTC2019的角色被相对弱化时,黄仁勋表示:
你之所以会听到很多关于软件的内容,是因为:如果我们不为硬件开发软件,那么硬件将没有用武之地;(正是因为有相应的)软件存在,才使硬件变得出色。如果我们不自己开发软件,那么市场上将只有适用于CPU的软件。英伟达的业务是向新市场销售计算机平台,如果我们想这样做,我们必须打造新的软件架构(比如说CUDA-X)。在这方面没人会帮我们,我必须亲力亲为。
而面对外界对于基于图灵架构的RTX市场销售和技术应用情况的质疑,黄仁勋回应称:
RTX在最初八周内的增长几乎比Pascal快50%。然而,人们为什么会觉得RTX的应用放缓?这是因为当我们首次向市场推出该产品时,我们有加密产品的库存,我们不能推出整个系列——我想这样做,但是不能。现在,我们已推出了整个系列,它们都表现得很出色。
另外,伴随着RTX服务器的推出,外界也开始关心RTX技术何时能够纳入到GeforceNow(简称为GFN)中去并面向公众开放,对此,黄仁勋回应了如下要点:
目前新制造的GFN服务器都采用了光线追踪技术。
目前GFN的等待名单里有300000玩家和100万用户。首要挑战是要确保能大规模、高质量地提供这项服务,其次就是必须降低成本,以便减低客户成本,让他们去玩免费的游戏。另外,第三个挑战就是确保GFN能够覆盖全球更多的国家,而不仅仅是西方国家。
预计光线追踪将在2019年第三第四季度开放。
四、关于摩尔定律的终结和数据中心的未来
在本次GTC上,以数据中心为载体的数据科学(DateScience)也是黄仁勋谈到的重点内容。当被问及对英特尔最新架构的看法时,黄仁勋表示:
首先我认为英特尔也认识到了加速计算是未来的发展方向。整个行业不再认为CPU和GPU是互斥的,这当然是件好事,因为那条路已经走不通了。我们要承认,我们需要新的方法去引领行业向前发展。其次,我们仅占全球HPC总量的一小部分在全球超级计算机企业(500强企业)中,英特尔有充分理由占据非常大的份额。英特尔是一家竞争力很强的公司。我期待他们奋勇向前,我们也将积极面对挑战,最后受益的将是全世界的用户和研究人员。第三,我不太确定,英特尔最新架构是设计本身的成功,还是原有技术的延展。但我认为非常好的是,英特尔这个声明基本是在讨论加速计算;它是在说:“来点真格的吧,加速我们的堆栈”。
而关于目前数据中心发展所受的限制,黄仁勋最后表示:
其实很简单,目前对数据中心的唯一限制就是:摩尔定律的终结。我们深知,未来计算负荷呈指数趋势增长。如果摩尔定律已经终结了,唯一的方式将是构建更多的数据中心。我相信,将来的趋势是增加数据中心的工作负荷,这样,数据中心的计算能力将会以10倍的速度提升,其结果是:软件创新将会突飞猛涨,计算能力将进一步增强,而这会推动更多的创新。
编辑:Harris
相对于前两年英伟达举办的GTC(GPUTechnologyConference)来说,今年GTC在GPU技术架构和硬件创新的进展并不明显。在Keynote环节,英伟达创始人兼CEO黄仁勋发布了一款定价...