https://goo.gl/L4xyhw
【我们为什么挑选这篇文章】三大厂你支持哪一个?尽管现在台面上的王者是 NVIDIA,不
过紧追在后面的 Intel 与 AMD 都有其优势所在,Nvidia 的阿基里斯腱也十分明确,读完
本篇文章,了解三大厂在 AI 芯片领域的此消彼长吧!(责任编辑:陈君毅)
随着 NVDIA Titan V 的发布,我们迈入了深度学习硬件发展的动荡期。
NVIDIA 能否在 2018 年保住深度学习硬件首要供应商的地位还未可知,AMD 和 Intel Nerv
ana 都仍有机会上位。
所以对于想买硬件的消费者,最精明的选择就是等上 3 至 9 个月,到这种不确定的状态过
去之后再决定。
深度学习芯片领域的竞争从未停止过
NVIDIA 决定在竞争初现端倪之前,先将自己的垄断地位变现。通过这种方式,他们希望在
未来 1-2 年内确保行业领先,所以他们的 Titan V 的售价高达 3000 美元(约 15 万元台
币)!
虽然 Titan V 的深度学习专用核心 Tensor Core 有着独特的性能,但性价比实在太糟,使
其市场吸引力不足,只是现阶段除此之外又没有别的选择,所以至少当前就有什么用什么吧
。
AMD 的硬件水平已经赶超 NVIDIA 了 ,而且他们计划再开发出相匹配的深度学习软件。如
果这一步实现的话,其性价比会轻松超越 NVIDIA,并在此领域成为新的标杆。而届时 NVID
IA 就会凭借著雄厚的资金实力来拼市场,所以我们或许会在未来看到非常便宜的 NVIDIA
产品。
广告
注意这种情况是建立在 AMD 推出高质量软件的基础上——如果 AMD 跳票,则丧失了抢走桂
冠的机会,而 NVIDIA 的产品将仍停留在高价位。
市场上还有另一位新晋竞争者:Intel Nervana 的神经网络处理器(NNP)。凭借著几种迎
合 CUDA 开发者需求的独特性能,它表现得还比较有竞争力。NNP 处理器可以解决优化深度
学习的 CUDA 内核中绝大多数的问题,这款芯片才真正称得上第一枚深度学习芯片。
通常意义上, 对于单一芯片之间的排名,我们会按照 Nervana > AMD > NVIDIA 的顺序来
排 ,因为 NVIDIA 的芯片不得不在游戏、深度学习和高性能运算中维持平衡,AMD 也需要
同时考虑游戏和深度学习,只有 Nervana 可以聚焦于深度学习,这是一个巨大的优势,使
得他们的芯片较其他两家少了很多无用的结构设计。
然而,获胜者往往不是取决于纯粹的性能或者性价比,而是要综合考虑 性价比 + 周边生态
+ 深度学习框架 。
让我们来仔细了解一下这三家公司产品的优劣,看看它们到底处于什么位置。
Intel Nervana 的神经网络处理器(NNP)
Intel Nervana NNP:专为 AI 而生。
Intel Nervana NNP:专为 AI 而生。
Nervana 芯片的独特之处在于它为计算扩展出大空间的缓存(类似 CUDA 共享内存),相当
于 GPU 的 10 倍,而单个计算单元的缓存是 GPU 的 50 倍。有了这种设计,其运算速度会
提升至少一个量级,就可以在缓存内完成算法与模型计算并轻松地训练 TB 字节的数据(如
一个带有 200 个单元的多层 LSTM)。
得益于 Flexpoint 这个特殊的数据类型,Nervana 的芯片能够在缓存/RAM 内存储更多的数
据并计算得更快。 所有这些创新都意味着其比当前 NVIDIA 的 GPU 提速了 10 倍 。这已
经获得了初创公司以及一些大公司的关注。但是,所有这些的前提是他们能克服主要的问题
:周边生态以及软件。
普通的用户和研究人员几乎完全依赖于芯片周边的生态系统。如果没有了这些,我们将无法
使用缓存内的算法以及好的软件框架,从而无法更好的利用芯片。
所有人都希望使用可靠过硬的深度学习框架,而 Nervana 的深度学习框架 Neon 是否给力
是值得怀疑的。软件使用优先于硬件支持,如果 Nervana 仅仅出品良好的芯片而不在软件
以及周边生态系统上发力的话,他们将输掉这场竞争。
软件以及生态系统与价格紧密相关。如果 Nervana 家的 NNP 价格定得太高,学生根本
负担不起。虽然行业内的各种企业客户为硬件公司支付了绝大部分的收入,但仅凭产业化的
应用是无法构建繁荣的生态环境的,学生群体才是促使硬件周边生态环境繁荣的主要驱动者
。
只有当广大学生们可以支付得起之后,才会有众多配套软件得以涌现。任何超过 3000 美金
的产品想都不要想;超过 2000 美金而且对学生有额外折扣的产品还凑合,没准会让人用用
,一个 2000 美金的 NNP 还是会有一些接受度的;而如果产品低于 1500 美金,Nervana
在 2-3 年内将会成为市场的主导者。
如果把价钱定在 1000 美金左右,那另两家竞争者将会非常痛苦,而配套的软件就会如雨后
春笋,不再是个问题。
如果 NNP 的价格低于 2500 美金,我是肯定会买的。它的性能比 GPU 好太多,我可以用它
来做好多原来无法在 NVIDIA 产品上实现的事。但如果它超过了 2500 美元,这是我能承受
的上限,我看还是把钱省下来吧,虽然好的硬件非常重要,但我还需要钱来干别的呢。
对于一般的消费者来说,价格不是他们考虑的唯一因素,他们还会考虑到产品的相对应的周
边生态。
如果 Intel 没有快速的将尽可能多的资源投入到该产品的周边生态并打造一个可靠的软件
组成,那么 NNP (The Neural Network Processor) 的发展就会停滞不前并且最终消亡。不
幸的是,Intel 曾经因为对周边生态的管理不善而犯过这样的错误。如果发生了,这将非常
让人失望,因为我真的很希望 Nervana 获得成功。
总体来说, 如果 Nervana 开发的 NNP 可以把价格控制在 2000 美金以下,并且在这个产
品发布之后的短短几个月内快速生成一个强大的周边生态和软件开发环境,那么这款产品将
会击败它的同类竞争者而胜出。如果 NNP 的价格稍高同时周边生态略差,那它依然还是个
不错的产品,只是就性价比和方便程度来说,它不能完胜它的竞争者们。当它的价格高于 4
000 美金或是不具备一个基本的产品周边生态的话,NNP 甚至会完败。
对于高于 2000 美金的 NNP 来说,如果希望它能对于一般学生有很好的新引力,那么该产
品需要对学生有着相当程度的折扣才可以。
AMD:便宜又强大,软件方面还需努力
AMD 的显卡非常的棒。Vega Frontier Edition 系列明显的要优于 NVIDIA 的相应产品,通
过一项类似于对 Volta 和 Pascal 所做的无偏差标准测试,在使用液态冷却的前提下,Veg
a Frontier 的性能要持平甚至优于 Titan V 。值得注意的是,Vega 是基于传统的图形处
理芯片架构,而 Titan V 是全新的。这样,在 2018 第三季度即将发布的新一代 AMD 架构
,将会有更加出彩的表现。
AMD 希望仅仅通过把 32-bit 浮点数运算的图形处理芯片换成 16-bit,从而在深度学习硬
件开发上取得成功。这是一个既简单又有效的策略。这样设计的 GPU,虽然对于高性能计算
没有什么用处,但是对于游戏玩家以及深度学习社群来说,这样的改变会获得更稳定的表现
,同时由于 16-bit 浮点数运算显卡的运算非常直接,芯片的开发成本也会相应降低。
当然,如果单纯依靠性能指标来说,这样的改变不可能优于 Nervana 的 NNP,但是就性价
比来说,市场上所有的产品都无出其右。你可以仅仅花费 700 美元(约 2.1 万台币)就买
到一款液态冷却的 Vega Frontier 显卡,而它的性能比起 3000 美金的 Titan V 仅仅差了
一点而已。
然而最大的问题是软件。即使你拥有了这么强大的 AMD GPU,你却很难使用它——因为目前
没有一款主流的软件框架能够很好支持 AMD GPU。
AMD 自身也处于这个发展过渡期,关于软件的发展过渡期。目前来看,他们打算放弃 OpenC
L 而转向 HIP。但是他们现在官方依然支持 OpenCL 这种方法。
如果他们想推动 HIP 而且在未来九个月内投放一些很好的深度学习软件于市场(不仅仅是
用来计算卷积和矩阵相乘的软件包而是一个完整的深度学习框架,比如说 HIP 可以支持 Py
Torch),那么,他们在 2018 第三季度即将发布的新一代 GPU 会获得巨大的潜力并且击败
所有竞争者。
总体来说,如果 AMD 能够把它在软件方面所有棘手的问题处理好,那么毫无疑问它会成为
深度学习硬件领域的主导力量。
NVIDIA:地位坚固的硬件界大佬
NVIDIA 的江湖大佬地位毋庸置疑。他们拥有最棒的软件系统,最好的工具,他们的硬件很
棒并且产品具备一个庞大,强壮并且完整的生态圈。
NVIDIA 的主要问题在于他们需要服务于多种使用者:高性能计算需求者、深度学习从业者
、还有游戏玩家。这对于他们的硬件是一个巨大的压力。设计这些客户定制的图形处理芯片
是非常昂贵的,因此 NVIDIA 的策略是设计一款多用途,适合所有框架的芯片,这项任务几
乎很难完成。因此 Titan V 只是一个很中庸的产品。
伴随竞争者的出现,NVIDIA 有两种选择。(1)不停的压低价格,直到拖垮对手,或者是(
2)开发出属于自己的专有深度学习图形处理芯片。
NVIDIA 拥有足够的资源去打价格战,并且它也拥有足够数量的专家去执行第二套方案。然
而,设计新型的芯片需要一定的时间,NVIDIA 有可能在此间失去王者的宝座。所以,我们
很有可能看到它会同时执行两套方案:打价格战拖垮推手,从而为自己设计出专属的深度学
习芯片赢得时间。
总体来说,NVIDIA 的王座受到了一定的威胁,但是它有足够的经验和资源去击败出现的竞
争对手。我们很有可能在未来看到一个便宜的 NVIDIA 显卡和专为深度学习打造的产品。不
过如果 NVIDIA 不去降价打价格战的话,它是可能(暂时地)失去王者的地位的。
深度学习硬件的混战意味着目前不是一个投资该领域的最好时机,但是这也同时意味着更便
宜的 NVIDIA 卡,可用性更高的 AMD 卡,以及超快的 Nervana 卡会很快出现。这是一个激
动人心的时代,我们消费者将会从这样的竞争当中获得巨大的利益。但是目前,我们必须耐
心等待。
——
恭请教主obov(a很多葛0)开示!