[转载] AMD 的 Vega 到底改进了什么

楼主: KotoriCute (Lovelive!)   2018-02-19 13:37:39
AMD的Vega到底改进了什么
https://www.cool3c.com/article/133168
自从2012年3月22日发表的GeForce GTX680,NVIDIA“Kepler”微架构首发GK104上演“中
驷痛扁上驷”的欢乐剧场,在绘图市场,AMD就一直陷入一路被NVIDIA殴打的困境,至今
已近六年,还曾在2014年独显市占率一度衰落到“十八趴”的历史低点,后来才因GCN第
四代“北极星 (Polaris)”和第五代“织女星 (Vega)”,与莫名其妙的挖矿热潮,才略
有起色,但距离要回到跟NVIDIA平起平坐的地位,仍相当的遥远。
这拉开差距的四年,也刚刚好是独显双雄一起“黏”在台积电28nm的制程迟滞期,考验著
双方在产品设计的定位与取舍,例如要不要为高阶专用应用开发独立芯片,或著需不需要
在消费市场牺牲掉某些不必要性能,一路走来,高下立判。
讲的更白一点,NVIDIA光靠前一代产品都足以对付AMD,所以我们才会看到近两年前就问
世的Pascal家族,到现在还活的爽爽的,爽到NVIDIA在2016年Hot Chips 28几乎只谈
NVLink 1.0,连Pascal微架构的“优异性”都懒得提了,也迟迟未见Volta的降规版。
https://media.cool3c.com/files/media/1/1/11_409.jpg
但这并不代表AMD的Vega就毫无看头,然后各位科科可以多花点时间在这张规格比较表,
我会等你der。
https://media.cool3c.com/files/media/1/2/12_356.jpg
< 更有GPGPU味道的织女星 >
这年头什么厉害芯片都要挂上“系统单芯片 (SoC)”的头衔才能显得比较酷,显示芯片也
不例外,但AMD胆敢这样宣称,是有本钱的。也许这就是AMD兼备CPU与GPU的先天优势吧。
https://media.cool3c.com/files/media/1/3/13_325.jpg
和自己的前代相比,新产品当然会比较好。不过这也让我们不得不认真思考一个问题:越
早导入新技术,其实也不见得会有好结果。Fiji用上了第一代HBM,唯一的成就顶多只有
“让旗舰卡做得很小,可以塞入Mini-ITX机壳”,却没有让AMD一举夺回高阶市场的竞争
力。
https://media.cool3c.com/files/media/1/4/14_297.jpg
回到主题,为何AMD敢宣称自己的最新型GPU是“SoC”呢?主要有五个理由:
理由一:采用更通用的芯片内连结架构“Infinity Fabric”,和Zen微架构处理器同样的
技术,有人戏称这是“AMD的万能胶水”,我们就不深究了。
https://media.cool3c.com/files/media/1/5/15_275.jpg
理由二:更精细的执行绪执行管理,这对虚拟化也很重要。
https://media.cool3c.com/files/media/1/6/16_235.jpg
理由三:更完整的分页式虚拟内存管理,GPGPU必备。
https://media.cool3c.com/files/media/1/7/17_219.jpg
理由四:支援I/O虚拟化,存在已久的SR-IOV。因为显示芯片在先天应用上“众乐乐不如
独乐乐”的特性,让“GPU虚拟化”一直是让芯片厂商感到棘手的发展方向,不过现在是
越来越有样子了。
https://media.cool3c.com/files/media/1/8/18_202.jpg
理由五:可外接SSD,作为主内存的下一层储存空间,这个非常重要,这样Vega非常的
与众不同,值得大书特书。
https://media.cool3c.com/files/media/1/9/19_176.jpg
至于Vega可进行类似SIMD的包裹式 (Packed) 运算,将数个低精度资料打包送作堆,以“
立于人工智能应用”,其实NVIDIA的Pascal和Volta也做得到,只是没明讲,就不特别著
墨了。
https://media.cool3c.com/files/media/2/0/20_152.jpg
< 一举解决GPGPU内存容量限制的HBCC >
AMD重新设计后的高频宽快取内存控制器(HBCC,High Bandwidth Cache Controller)
不仅支援容量更大、速度更快的HBM2主内存,寻址能力更高达高达512TB容量。很明显
的,这绝对不是仅用来应付区区16GB的HBM2,背后必定藏有更大的野心。
https://media.cool3c.com/files/media/2/1/21_134.jpg
为何会将主内存控制器命名为跟快取内存有关?因为不限显示内存,HBCC亦可存取
SSD、网络储存等外部内存元件,将HBM2视为超高频宽的快取内存,对于开发人员,
这些也是等同于可直接使用的显示内存。如此一来,更完整的虚拟内存管理机能就有
其用武之地了。
其实前代的北极星 (Polaris) 系列,就具有透过PCIe交换器PEX8747连结两组M.2界面
512GB Samsung 950 Pro SSD的Radeon Pro SSG专业绘图卡,AMD也在专业绘图盛事
Siggraph 2016发表Vega核心的同系列产品,内建2TB NAND 快闪存储器,也现场展示了不
受16GB HBM容量限制、资料规模“TB层级”的专业绘图渲染场景,其威力不言可喻。
< 更具“系统观”的GPU微架构 >
将望远镜转向“GPU通用运算”的领域,显示卡的内存容量比较少,也难以扩充,相较
于一般的汎用CPU平台,GPGPU应用普遍遭遇内存容量不足的困难 。AMD的Vega微架构让
显示卡摇身一变,成为享有多层化储存空间的独立小电脑。
比起大费周章叠床架屋、只为了让GPU可以染指CPU的虚拟寻址空间,HBCC是更加简洁明了
的解决方案,让Vega更能处理更巨量的资料,提供更弹性的GPGPU布署,更让人好奇未来
结合Zen微架构CPU的APU,那激发无限想像空间的可能性。只是在这之前,Intel就抢先用
其“高级胶水技术”EMIB,黏合Kaby Lake和Vega了。
但一路看下来,Vega的重大革新,多半消费者无缘一亲芳泽,造成AMD高阶显卡一卡难求
的挖矿热潮一退潮后,AMD终究还是要面对在独显市场拼不过NVIDIA的困境,像NVIDIA这
样耗费更多研发资源去“分而治之”不同市场,或著硬著头皮打造货真价实的“旗舰APU
”来改变市场游戏规则,还是继续维持现况,各位科科可以等著瞧。
作者: windrain0317 (你在大声啥)   2018-02-19 14:20:00
CUDA作DL那个养太久了,要攻破很难

Links booklink

Contact Us: admin [ a t ] ucptt.com