Re: [情报] 7900XTX 的L3快取竟然比7600还慢58%!?

楼主: oopFoo (3d)   2023-06-08 07:53:52
※ 引述《luvstarrysky ()》之铭言:
: 心得:黏胶水的架构似乎生出了快取延迟的问题,这点在Ryzen CPU靠堆叠3D快取的方式
: 来解决,但AMD为了赚钱是绝对不会在Radeon GPU上复制这种方式的,毕竟现在都
: 只能靠吃NV吃剩的大饼碎屑来充饥,不需要搞得多好也有粉丝买单,财报好看,
: AMD笑哈哈,消费者苦哈哈。
这样的心得真的只是来挑衅的。引述的url也内容空洞。来看最原始的文章吧
先讲L3的latency并不是很重要,GPU的设计本来就是吃bandwidth牺牲latency。
L3在chiplet,latency增加并不是大问题,大问题是data从mcd到gcd需要很大的能耗,所以这是Navi31异常耗能的原因之一。L3真的不应该在chiplet上,N/I扩张L2弃L3是有原因的。
https://chipsandcheese.com/2023/06/04/amds-rx-7600-small-rdna-3-appears/
这篇其实主要是讲VOPD(dual issues)的问题,rdna3在wave32本来就不容易dual issues,旧的wave64模式反而容易dual issues,这是compiler的问题。
rx7600还有另一个大问题,因为用6n而不是5n空间不够,牺牲掉vector registers,这造成dual issues更困难,因为vector registers的不足。
本来rdna的设计就是wave32虽然效能比wave64差但比较容易达到好性能,但现在VOPD的情况下就反过来了。令人感叹wave32真是白忙一场的设计。
https://i.imgur.com/wsGh4b3.png
可以看到,如果能够dual issues,rx7600几乎可以追上rx6900xt。
这篇其实蛮有趣的,如果你想粗浅了解rdna3的架构与问题。

Links booklink

Contact Us: admin [ a t ] ucptt.com