本篇文章1828字,读完约5分钟
据雷锋:上个月,谷歌发表了一篇关于tpu细节的文章,说“tpu的处理速度比现在的gpu和cpu快15到30倍”,引发了科技界的热议。英伟达首席执行官黄仁勋亲自写了一篇文章进行反击,并发布了特斯拉p40 gpu和tpu之间的性能对比图,显示了指针指向小麦的巨大趋势。在昨天的gtc会议上,英伟达发布了新一代gputesla v100。asic和gpu之间的争论越来越激烈了!
人工智能和机器学习对谷歌的重要性不言而喻。为了抓住人工智能时代的机遇,这个科技巨头已经开始开发和制造自己的芯片。在去年的年度开发者大会上,谷歌宣布了为其特殊人工智能算法优化的tpu芯片。据雷(公开号:雷锋网)介绍,数十种类似的定制化人工智能芯片相继出现。这给nvidia带来了压力,该公司是一家芯片供应商,近年来在深度学习领域占据主导地位。
为了反击,英伟达也开始加强其新gpu芯片的定制化和专业化。
在周三举行的gtc会议上,英伟达发布了特斯拉v100,这是一款基于其下一代图形架构volta的服务器市场新gpu。该芯片拥有超过210亿个晶体管和5120个计算机内核。但是对于人工智能来说,最重要的是特斯拉v100配备了640个张量核心,这些核心是专门设计来运行Deepen学习网络中使用的数学运算。根据官方介绍,这些张量核心为特斯拉v100提供了高达120万亿次浮点运算的惊人深度学习能力。
雷锋。com了解到,与上一代的pascal架构相比,新芯片将深度学习训练的速度提高了12倍,深度学习推理的速度提高了6倍。新架构在运行深度学习应用方面的性能相当于100个中央处理器(如英特尔的中央处理器)。
为了使深度学习应用程序在其硬件上更有效地运行,nvidia提供了许多软件工具。它发布了深度学习框架tensorflow和caffe的编译器TensorRT,以提高推理性能。据英伟达称,特斯拉v100的推理性能比英特尔的skylake cpu架构快15到25倍。
尽管英伟达正试图使其芯片更适合深度学习,但其竞争对手可能会指出,英伟达最大的缺陷是其图形处理器通常必须支持图形生成。Gpu是为图形生成而设计的。由于图形生成必须得到支持,gpu芯片增加了大量的体积,这意味着它在一定程度上比专用芯片效率更低。
谷歌在最近的一篇博客中称,其tpu在推理性能上比现代图形处理器和中央处理器快15-30倍,而功耗低30-80倍。(英伟达反驳道,谷歌正在将tpu与老的gpu进行比较。事实上,这种比较并不完全公平。Gpu是一种通用芯片,可以执行绘图操作,具有多种用途。Tpu属于asic,即为特定目的设计的具有特殊规格的逻辑ic。TPU变得更快是合理的,因为它只完成一项工作。除了tpu和gpu之间的性能竞争,它更代表了asic和通用芯片之间的博弈。
除了英伟达和谷歌,另一个大芯片巨头英特尔也加入了游戏。不久前,英特尔以4亿多美元收购了ai芯片初创公司nervana,并声称在2020年前将深度学习和培训的速度提高了100倍。
英伟达表示,特斯拉v100是一个强有力的证据,表明它更擅长深度学习,能够与这些定制芯片竞争。英伟达图形处理器工程部门高级副总裁乔纳·阿尔本(Jonah alben)在谈到芯片竞争时表示:“当你把构成一个优秀芯片的所有要素都考虑进去进行深度学习训练时,你会发现带宽、输入/输出和数学运算能力都非常重要。在所有这些领域,我们都是专家。只要我们都用同样的画笔,我们就会知道谁更强。”
雷锋认为,尽管谷歌在定制人工智能芯片领域处于领先地位,但英伟达在未来许多年仍将保持竞争力。高德纳(gartner)分析师马克洪(Mark hung)表示:“到目前为止,还没有大规模的人工智能芯片上市。”虽然nvidia总是存在潜在的危险,但在这些公司大规模推出ai芯片之前,它不会对nvidia构成真正的威胁。”
这些即将推出的人工智能芯片和英伟达之间的明争暗斗表明,深度学习计算对更强计算能力的需求越来越大。几年前,gpu爆炸了,因为它将深度学习网络的训练时间从几个月缩短到了几天。最早诞生于20世纪50年代的深度学习,由于其强大的计算能力,终于释放了它的潜力。但是,随着越来越多的企业试图将深度学习融入到他们的产品和服务中,对更快芯片的需求将永无止境。
阿尔本说:“在我看来,人类需要无限的深层计算能力。离无限越近越好。”
雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。
来源:搜狐微门户
标题:谷歌说TPU比GPU更牛,Nvidia表示不服,并朝谷歌扔了一块Tesla V100
地址:http://www.shwmhw.com/shxw/61011.html