[转载] AMD 的 Vega 到底改进了什么 KotoriCute PTT批踢踢实业坊

[转载] AMD 的 Vega 到底改进了什么

楼主: KotoriCute (Lovelive!) 2018-02-19 13:37:39

AMD的Vega到底改进了什么
https://www.cool3c.com/article/133168
自从2012年3月22日发表的GeForce GTX680，NVIDIA“Kepler”微架构首发GK104上演“中
驷痛扁上驷”的欢乐剧场，在绘图市场，AMD就一直陷入一路被NVIDIA殴打的困境，至今
已近六年，还曾在2014年独显市占率一度衰落到“十八趴”的历史低点，后来才因GCN第
四代“北极星 (Polaris)”和第五代“织女星 (Vega)”，与莫名其妙的挖矿热潮，才略
有起色，但距离要回到跟NVIDIA平起平坐的地位，仍相当的遥远。
这拉开差距的四年，也刚刚好是独显双雄一起“黏”在台积电28nm的制程迟滞期，考验著
双方在产品设计的定位与取舍，例如要不要为高阶专用应用开发独立芯片，或著需不需要
在消费市场牺牲掉某些不必要性能，一路走来，高下立判。
讲的更白一点，NVIDIA光靠前一代产品都足以对付AMD，所以我们才会看到近两年前就问
世的Pascal家族，到现在还活的爽爽的，爽到NVIDIA在2016年Hot Chips 28几乎只谈
NVLink 1.0，连Pascal微架构的“优异性”都懒得提了，也迟迟未见Volta的降规版。
https://media.cool3c.com/files/media/1/1/11_409.jpg
但这并不代表AMD的Vega就毫无看头，然后各位科科可以多花点时间在这张规格比较表，
我会等你der。
https://media.cool3c.com/files/media/1/2/12_356.jpg
< 更有GPGPU味道的织女星 >
这年头什么厉害芯片都要挂上“系统单芯片 (SoC)”的头衔才能显得比较酷，显示芯片也
不例外，但AMD胆敢这样宣称，是有本钱的。也许这就是AMD兼备CPU与GPU的先天优势吧。
https://media.cool3c.com/files/media/1/3/13_325.jpg
和自己的前代相比，新产品当然会比较好。不过这也让我们不得不认真思考一个问题：越
早导入新技术，其实也不见得会有好结果。Fiji用上了第一代HBM，唯一的成就顶多只有
“让旗舰卡做得很小，可以塞入Mini-ITX机壳”，却没有让AMD一举夺回高阶市场的竞争
力。
https://media.cool3c.com/files/media/1/4/14_297.jpg
回到主题，为何AMD敢宣称自己的最新型GPU是“SoC”呢？主要有五个理由：
理由一：采用更通用的芯片内连结架构“Infinity Fabric”，和Zen微架构处理器同样的
技术，有人戏称这是“AMD的万能胶水”，我们就不深究了。
https://media.cool3c.com/files/media/1/5/15_275.jpg
理由二：更精细的执行绪执行管理，这对虚拟化也很重要。
https://media.cool3c.com/files/media/1/6/16_235.jpg
理由三：更完整的分页式虚拟内存管理，GPGPU必备。
https://media.cool3c.com/files/media/1/7/17_219.jpg
理由四：支援I/O虚拟化，存在已久的SR-IOV。因为显示芯片在先天应用上“众乐乐不如
独乐乐”的特性，让“GPU虚拟化”一直是让芯片厂商感到棘手的发展方向，不过现在是
越来越有样子了。
https://media.cool3c.com/files/media/1/8/18_202.jpg
理由五：可外接SSD，作为主内存的下一层储存空间，这个非常重要，这样Vega非常的
与众不同，值得大书特书。
https://media.cool3c.com/files/media/1/9/19_176.jpg
至于Vega可进行类似SIMD的包裹式 (Packed) 运算，将数个低精度资料打包送作堆，以“
立于人工智能应用”，其实NVIDIA的Pascal和Volta也做得到，只是没明讲，就不特别著
墨了。
https://media.cool3c.com/files/media/2/0/20_152.jpg
< 一举解决GPGPU内存容量限制的HBCC >
AMD重新设计后的高频宽快取内存控制器（HBCC，High Bandwidth Cache Controller）
不仅支援容量更大、速度更快的HBM2主内存，寻址能力更高达高达512TB容量。很明显
的，这绝对不是仅用来应付区区16GB的HBM2，背后必定藏有更大的野心。
https://media.cool3c.com/files/media/2/1/21_134.jpg
为何会将主内存控制器命名为跟快取内存有关？因为不限显示内存，HBCC亦可存取
SSD、网络储存等外部内存元件，将HBM2视为超高频宽的快取内存，对于开发人员，
这些也是等同于可直接使用的显示内存。如此一来，更完整的虚拟内存管理机能就有
其用武之地了。
其实前代的北极星 (Polaris) 系列，就具有透过PCIe交换器PEX8747连结两组M.2界面
512GB Samsung 950 Pro SSD的Radeon Pro SSG专业绘图卡，AMD也在专业绘图盛事
Siggraph 2016发表Vega核心的同系列产品，内建2TB NAND 快闪存储器，也现场展示了不
受16GB HBM容量限制、资料规模“TB层级”的专业绘图渲染场景，其威力不言可喻。
< 更具“系统观”的GPU微架构 >
将望远镜转向“GPU通用运算”的领域，显示卡的内存容量比较少，也难以扩充，相较
于一般的汎用CPU平台，GPGPU应用普遍遭遇内存容量不足的困难。AMD的Vega微架构让
显示卡摇身一变，成为享有多层化储存空间的独立小电脑。
比起大费周章叠床架屋、只为了让GPU可以染指CPU的虚拟寻址空间，HBCC是更加简洁明了
的解决方案，让Vega更能处理更巨量的资料，提供更弹性的GPGPU布署，更让人好奇未来
结合Zen微架构CPU的APU，那激发无限想像空间的可能性。只是在这之前，Intel就抢先用
其“高级胶水技术”EMIB，黏合Kaby Lake和Vega了。
但一路看下来，Vega的重大革新，多半消费者无缘一亲芳泽，造成AMD高阶显卡一卡难求
的挖矿热潮一退潮后，AMD终究还是要面对在独显市场拼不过NVIDIA的困境，像NVIDIA这
样耗费更多研发资源去“分而治之”不同市场，或著硬著头皮打造货真价实的“旗舰APU
”来改变市场游戏规则，还是继续维持现况，各位科科可以等著瞧。

作者: windrain0317 (你在大声啥) 2018-02-19 14:20:00

CUDA作DL那个养太久了，要攻破很难

继续阅读

[菜单] 20K轻度剑灵,sim4游戏机dodi851124 [菜单] 15k内重返苏妈荣耀机a0931990010 Re: [心得] ＡＭＤ卡ＣＰ高——如果你的时间是免费的heaven1123c [请益] 旧电脑升级RX470&1050的抉择love51227 [菜单] 20K轻度游戏绘图机kne101 [请益] 电脑椅求推荐DALUGI Re: [菜单] 120K 跑模拟 ANSYS热流,COMSOL,Matlab j602120204 [开箱] PowerColor AXRX 560 4GBD5-DHADsLove710 [菜单] 60k含萤幕作业系统qtoverthere [闲聊] AMD出Threadripper 2900 APU有没有搞头？Jean011179