[情报] Zen5 AVX512 分析

楼主: SkyPlus (Sky)   2024-08-08 09:39:45
http://www.numberworld.org/blogs/2024_8_7_zen5_avx512_teardown/
虽然 Zen5 初期测试报告有点不尽人意
不过刚刚看到这篇文章大力赞扬 Zen5 AVX512 设计,
和 Zen4 AVX512 相比, Zen5 IPC成长几乎快了 100%
这是因为 Zen4 用 4 x 256-bit 的通道组合出来
连 Intel 只有 server 等级的 Sapphire Rapids 才给的起 2 x 512-bit
但这次 zen5 桌面版大核就很大方的给了 4 x 512-bit
因此反映在效能上就直接爆涨了
另外 Intel 常被诟病 AVX512 需要先花一些时间(约50000 cycle)低速跑,
等电上去,CPU降速才能全速跑。但 Zen5 可能靠设计和制程完全解决这问题,
不需降速也不用等,下指令后几乎立即全速运作。
此外 Intel 在 Tiger Lake 加了 AVX512-VP2INTERSECT 指令,
但速度超级慢 (25 cycle),大家都用别的指令去模拟还比较快,
因此 Intel 在往后的 CPU 也移除他。
这次 Zen5 实作了这个指令,而且只花 1 cycle 就完成。
综合这些分析,他认为Zen5可以说第一次让大家看到完整版的 AVX-512。
反观 Intel 设计了却四处限制...
他还有提到 Cinebench, CPU-Z 都没有很认真测试 AVX-512,
因此看不出Zen5在这方面的优势。
不过有些 Zen4 可以在 1 cycle 做完的非 AVX-512 SIMD,
在 Zen5 反而不明原因退步到 2 cycle,
另外混合 AVX-256,512 指令的顺序不对也会变慢

Links booklink

Contact Us: admin [ a t ] ucptt.com