[情报] 辉达澄清:4090D不受美国出口管制限制

楼主: AquaChen1012 (小麦慎二)   2024-04-05 18:18:52
NVIDIA “澄清”美国出口管制
GeForce RTX 4090 D 将不受此限
路透社 3 日报导,美国商务部上月 29 日再次更新高科技出口管制要求,在 ECCN 4A003
0.C 条文中追加了全新限制,超过 70 TFLOPS 都不能出口中国。但 NVIDIA 4 日主动通
知国外媒体,重新澄清指 ECCN4A0030.C 条文的一些字眼被混淆和误解,并确认 GeForce
RTX 4090 D 与 H20 GPU 将不受新限制所影响。
据 Tom's Hardware 5 日报导,ECCN4A0030.C 条文中有閞于“调整后峰值性能”(APP)
和“加权万亿次浮点运算”(WT),限制为 70 TFLOPS 或更低,只适用于“具有内存一
致性 (Memory Consistency) 的系统”,而不是单一 GPU,例如 4 路 DGX H100 系统就
属于此分类。
NVIDIA 主动通知媒体时指出,要符合 ECCN4A0030.C 新修定的要求,该芯片是需要能透
过快取或内存寻址,以硬件方式来存取系统中的任何内存位置,而不需要任何软件机
制的参与,因此 GPU 并不受这项条文所规范。
过快取或内存寻址,以硬件方式来存取系统中的任何内存位置,而不需要任何软件机
制的参与,因此 GPU 并不受这项条文所规范。
此外,条文中另一个重要细节是“调整后峰值性能”只适用于经“加权”的 FP64 吞吐量
,因为该值根据它是向量处理器还是标量(非向量)处理器进行缩放。换句话说,透过 N
vidia Tensor 核心等向量单元完成的 FP64 与透过运行 64 位元计算的 CPU 完成的 FP6
4 不同。
而要确定“加权 teraflops”和“调整后的峰值性能”两项数值,是需要计算系统的 FP6
4 总吞吐量。然后,对于向量处理器乘以 0.9,或对于非向量处理器则乘以 0.3。回到以
4 路 DGX H100 的系统为例,GPU 的 H100 SXM 的向量 FP64 吞吐量为 67 teraflops,
四路合共可提供 268 teraflops 总吞吐量,再乘以 0.9 则得到 241.2 teraflops,因而
远高于 70 加权 teraflops 限制。
GeForce RTX 4090 D 几乎无法提供任何 FP64 吞吐量,只有 1.15 TFLOPS,尽管它仍然
接近 4,800 TPP 限制,但 NVIDIA GeForce RTX 4090 D 因此并没有被禁止出口。
http://i.imgur.com/Rr9Wj9a.jpg
本来前几天传出
4090D卖不了中国
可能改卖其他地方
不过
5090都要出了
除非定价45K
不然也没人想买

Links booklink

Contact Us: admin [ a t ] ucptt.com