Re: [闲聊] AMD你也有大小核出问题的一天啊

楼主: tint (璇月)   2024-07-31 11:05:05
※ 引述《mayolane (没有人啦)》之铭言:
: Ryzen AI 9 HX 370有Zen5*4+Zen5c*8
: 主要的问题是Zen5和Zen5c在两颗CCD上
: 彼此用Infinity Fabric连接
: https://i.imgur.com/acR8B42.jpeg
: 然后彼此之间通信延迟钢弹180 ns
: 要知道7950X两颗CCD的延迟也才79 ns
在前代Zen4架构
消费级首次用上Zen4+Zen4c大小核的
Phoenix 2 APU(7545U/7440U、Z1、8500G等使用)
Zen4+Zen4c大小核是位于同一个CCX上
https://i.imgur.com/8PqjH3e.jpeg
6个核心共用16MB的L3快取
虽然大核Zen4对比桌面版L3快取缩小
但整个CCX共用16MB的L3
4个Zen4c每核平均也能分配到2.6MB的L3
以桌面的8500G为例
Zen4c小核的最高时脉为3.7GHz
参考一些评测,跨小核的延迟并未明显增加
Phoenix 2 APU的Zen4c
在应用上就是时脉较低的核心
这次的Zen5 Strix Point APU
配置4个Zen5+8个Zen5c大小核,总共12核心
其中4个Zen5大核心
给到和桌面一样完整的L3(每核平均4MB)
但8个Zen5c小核,则精简到仅8MB L3
每核心平均只有1MB L3
依之前AMD公布的投影片说明
https://i.imgur.com/8b3nqmH.jpeg
这次4个Zen5和8个Zen5c
分别为二组独立的CCX
4个Zen5的CCX共用16MB的L3
8个Zen5c的CCX则只共用8MB的L3
二组CCX彼此使用Infinity Fabric相连
有点类似以前Zen2时的设计
Strix Point APU这样的双CCX配置
导致跨二组CCX上核心存取时
会受限于Infinity Fabric的频宽
跨CCX的延迟和频宽可能会受不小影响
而且Zen5c的CCX仅有8MB L3快取
大小核效能的落差可能更凸显出来
在6月时一篇Ryzen AI 9 365偷跑详细测试中
就能看出这次双CCX设计的特征
https://blog.hjc.im/zen5-preliminary-review.html
Ryzen AI 9 365这颗APU为Strix Point核心
遮蔽2个Zen5c小核
为4个Zen5+6个Zen5c总共10核心的配置
文章中跨二组CCX的同步测试
https://i.imgur.com/zIrijeT.jpeg
可观察到跨到CCX时的延迟和频宽
都有明显受影响的情形
延迟增加至170ns
频宽从28000MB/s左右降至9000MB/s等级
Strix Point这次的双CCX设计
在跨CCX的应用上
可能也抵销了一些这次给到4个满规
Zen5核心的性能优势
不过Strix Point的能效表现仍是不错的
Strix Point双CCX的架构
AMD在设计初应就知会有这情形
但Strix Point主要面向移动端产品
配置12核心和16CU RDNA3.5内显
各方面都已有不少提升了
明年还会有一颗面向主流市场
原生8核心Zen5 APU“Kraken Point”推出
配置4个Zen5+4个Zen5c的大小核设计
内显是8CU规模,NPU维持50TOPS算力
看起来非常适合掌机和低功耗装置
到时可以观察看看这一颗APU
大小核会不会回到采用单CCX的设计了

Links booklink

Contact Us: admin [ a t ] ucptt.com