Re: [情报] Core i7之父回归!研发全新高性能CPU架构

楼主: oopFoo (3d)   2021-01-22 13:47:20
※ 引述《KotoriCute (Lovelive!)》之铭言:
: Intel酷睿i7之父回归!研发全新高性能CPU架构
: Glenn Hinton曾经领导研发了Nehalem架构(玩家戏称“你喝了吗”),2008年诞生,当时与Conroe(“扣肉”)齐名,是Intel在经历了奔腾4的挫折之后,重回王者地位的力作。
https://web.stanford.edu/class/ee380/Abstracts/100217-slides.pdf
Nehalem,2003年就开始设计,但构想要更早,当然大部分真正工作在05/06/07年。
当初必须要做非常重要的决定,2 Cores+VSSE+SMT vs 4 Cores。
Intel 选择2 Cores+VSSE+SMT。 那就是Nehalem
AMD 选择 修改版的4 Cores。 那就是Bulldozer
https://i.imgur.com/HXZSBti.png
其实Bulldozer并不差。但Bulldozer有个致命的缺陷,两个Cores分享一个 4-wide decoder
: 有趣的是,Jim Keller这位赫赫有名的CPU架构大神,被很多人视为AMD Zen架构之父,在Intel短暂停留2年后已经离开,但至今不知道他在Intel做了哪些工作。
JK应该有很多设计。但目前我们可以看到的是他给Tremont(Atom)2x3wide decoder但没有uop快取。那是很特别的设计,当初一堆人傻眼不明白
之前realworldtech在讨论为什么M1这么快。
https://www.realworldtech.com/forum/?threadid=198791&curpostid=198791
主要就是统一的超大L2,还有超快的DDR4。就像Zen3 统一L3就飞快起来。
后来有讨论出还有M1超宽的8-wide decoder也有帮助。
由冷门Kernel的Linus Torvalds来解释
https://www.realworldtech.com/forum/?threadid=198791&curpostid=199302
因为实际世界的IPC其实是很低的0.5~2之间。pipeline restart其实蛮常见的,所以fast fetch/decode其实非常重要。
这是Bulldozer失败的一个重要原因,也是Pentium IV(还加上trace cache)无法达到目标的原因。
CPU设计是一大堆的取舍,看看Nehalem的简报。
big.LITTLE可以更好分配不同的取舍。AMD没有big.LITTLE让我很担心。

Links booklink

Contact Us: admin [ a t ] ucptt.com