https://github.com/nviennot/core-to-core-latency
https://news.ycombinator.com/item?id=32889337
在 Hacker news 看到 CPU 跨 Core 延迟测试工具。
Github 上可以看到结果,基本上和设计上的限制一样
Intel 12th 有趣的是 CPU 8 (P-core?) 到任一个 Core 都很快
E-Core 之间传输比 P-core 相对慢一点
AMD EPYC 7R13 是8个 core 一组再连接起来,
因此跨 group 的延迟从 23ns 变成 110ns
而 AWS Graviton2 是一个大 Arm 芯片,
64 Core 之间延迟都差不多
Hacker News 上有 Apple M1 Pro 的结果:
https://news.ycombinator.com/item?id=32892164
同样可以看出是分成 4+4+2 三组
但跨 group 延迟比 AMD 高
0 59 231 205 206 206 208 219 210 210
59 0 205 215 207 207 209 209 210 210
231 205 0 40 42 43 180 222 224 213
205 215 40 0 43 43 212 222 213 213
206 207 42 43 0 44 182 227 217 217
206 207 43 43 44 0 215 215 217 217
208 209 180 212 182 215 0 40 43 45
219 209 222 222 227 215 40 0 43 43
210 210 224 213 217 217 43 43 0 44
210 210 213 213 217 217 45 43 44 0