原文标题:如果 AMD 也支援 AVX-512 指令集会发生什么事?
情报来源:TechNews
原文网址:https://technews.tw/2021/04/07/amd-avx-512/
最近有国外媒体报导某 Twitter 爆料大神,透露 AMD 下世代 Zen 4 核心,将支援 AVX-
512 指令集和人工智能深度学习常用的 bfloat16 浮点格式(接着是 EPYC 核心数会从 64
激增到 96 个),或多或少也间接印证了“AMD 将研发资源集中给 Zen 4,沿用 7 奈米
制程的 Zen 3 只是调校完毕的完善版”的观点。
这就让笔者不得不想到之前在“Linus Torvalds 对 AVX-512 的批评是否公道”一文中,
文末写了三个假设:
假如英特尔(Intel)制程技术维持领先地位,今天还会有这样的“杂音”吗?
如果 AMD 日后也支援 AVX-512,也没碰到英特尔的降低时脉麻烦,Linus Torvalds 的反
应会不会不一样?
从 Alder Lake 开始,Intel“似乎”在主流桌上型处理器,开了取消 AVX-512 第一枪,
是否意味 AVX-512 将淡出个人电脑舞台?
笔者没事看到那种“AVX-512 砍掉就砍掉,淡出就淡出,没什么大不了”的幼稚言论,就
只会纳闷,讲这种话的人到底有没有想过一件事:英特尔真这样干了,哪天 AMD 反过来全
面支援 AVX-512 并标榜“宣称他们家的产品享有最滴水不漏的 x86 软件相容性”反打英
特尔一枪,那该怎么办?顺便一提,VIA Centaur 睽违多年的全新 x86 处理器 CHA,也具
备 AVX-512 了,手脚竟然还比 AMD 还快,至于完整度如何在此不予置评。
总之我们先回稍微回顾一下“始作俑者”英特尔在“x86 义和团之乱”的退潮期,是如何
为了让 Larrabee 的徒子徒孙,有一条转战高效能运算与人工智能的退路,而让 AVX-512
指令集变成“让 x86 指令集再度碎片化”的地雷。
“计算机结构”(Computer Architecture)一词,源自于历史上首款可回溯相容软件的
IBM S/360 大型主机,意味着指令集架构(ISA,Instruction Set Architecture)相同的
电脑,可执行同样软件。基于维护软件相容性和“生态系统一致性”,指令集一向是“易
加难砍”,让资产和包袱成为一枚硬币的两面。
80×86 指令集因长期缺乏业界公定版本标准的关系,而导致碎片化问题,原本随着实质的
玩家只剩下英特尔与 AMD(加上毫无存在感的俄罗斯 Elbrus,与台湾的 VIA),AMD 也放
弃了 SSE5,“皈依”英特尔 AVX,而渐渐云淡风轻。
但英特尔在 Xeon Phi 与 Sky Lake-SP 导入的 AVX-512,不仅吹皱一池春水,在 2018 年
首款“实验性 10 奈米制程”Cannon Lake,首度将 AVX-512 指令集放到个人电脑处理器
,这等于是打开潘朵拉的宝盒,因为这代表当时的英特尔相信他们的制程技术,有办法“
硬吃”AVX-512 激增的电晶体数量与耗电量。
事后证明,英特尔完全失算,放弃行之有年的钟摆(Tick Tock)节奏,进入被外界戏称“
挤牙膏”的“三段论”(新制程→新架构→最佳化)时期后,除了高不可攀的 Skylake-X
与“逆向硬干 Sunny Cove 核心”的 Rocket Lake,没有任何一款桌上型处理器支援 AVX-
512,这等于是对过去自负“我家产品拥有最佳 x86 软件相容性”的英特尔,狠狠打自己
一巴掌。
更糟糕的是,英特尔自己也让 AVX-512 的版本变得混乱不堪,一再上演“新产品不见得相
容旧产品”的戏码。以刚上市的第十一代 Core Rocket Lake 为例,因为 Cypress Cove
核心是“14 奈米制程硬干出 10 奈米制程 Sunny Cove”,所以 Tiger Lake 的 Willow
Cove 核心多出来的 VP2INTERSECT,就这样不见了。
英特尔在 2019 年闹出的“Cooper Lake-SP 腰斩事件”是另一则惨案,为了满足某个“超
级大客户” (据称是 Facebook)的深度学习需求,让第三代 Xeon-SP 平台 Whitley 的
先发处理器 Cooper Lake-SP 支援 bfloat16(然后因不明原因被中途腰斩,保留 Cedar
Island 平台的 Cooper Lake-P),反倒是后面 10 奈米制程的 Ice Lake-SP 却付之阙如
,须等到第四代 Xeon-SP 平台 Eagle Stream 的 Sapphire Rapids。
最欢乐的莫过于“Golden Cove 大核+Gracemont 小核”的 Alder Lake,为了确保大核小
核彼此之间的指令集相容性,Golden Cove 的 AVX-512 直接被“阉割”掉。这就回到另一
个大哉问:假使哪天英特尔被 AMD 逼着所有产品都非得要有 AVX-512 不可,那英特尔真
的也要让新一代 Atom 体系小核支援 AVX-512 吗?
说到最后,这一切的乱象,都是英特尔自己内部一堆“不安定因素(有看过灌篮高手湘北
对陵南那场的读者,一定知道笔者想表达的意思)”累积到一定程度后的“业力引爆”:
抢救 x86 义和团的遗产、一窝蜂猛冲人工智能、制程转换青黄不接,让英特尔在 AVX-512
相容度前脚踩后脚,从头到尾都是自己人搞出来的问题,完全怨不得人。
话说回来,假若 AMD 真的在 Zen 4 靠着台积电 5 奈米制程,实现了“大致完整”的 AVX
-512 相容性,并一举解决过往执行 AVX 指令会大幅降低处理器时脉的宿疾,那英特尔昔
日最自傲的“x86 指令集相容性”就将被 AMD 反将一军。让人不得不期待,这天一旦发生
,英特尔该如何应对,而新任执行长 Pat Gelsinger 又将做何解释。这出好戏,届时一定
非常有趣。