http://www.expreview.com/46165.html
超能课堂(34):Intel内显进化之路
2016-3-24 15:09
从第一代core处理器Clarkdale到今天的第六代core处理器Skylake,Intel
的整合内显规模正在不断的增大,性能也是以倍数增加,下面我们就来回顾
一下Intel的内显进化历程。
曾经很早的时候,内显给人的印像只是能提供图像输出,玩游戏什么的
就别想了,然后过了些年,NVIDIA和AMD相继推出了高性能集显芯片组,也
就是C61与690G这类经典产品,让大家见识到内显也是能玩大型游戏的,也
就是这些高性能内显成就了当时AMD在低端平台的高性价比,随后这些iGP就
被直接整合到CPU里面了,现在整合显卡的主机板已经很稀有了。
第二代到第五代core处理器内部核显大小变化
http://img.expreview.com/news/2016/03/18/Intel_HDGraphics.jpg
AMD在收购ATI后,首先提出了CPU与GPU融合的概念,然而第一个把实际产品
做出来的却是老对手Intel,早在2010年就推出了第一款整合GPU的CPU,随
后Intel的内显每年都会随core系列处理器一同升级一次,现在已经发展到
了第六代,GPU的规模越长越大,以前是买CPU送GPU,现在都快成买GPU送
CPU了。
http://img.expreview.com/news/2016/03/18/Intel_HDGraphics_02.jpg
从第一代core处理器Clarkdale到今天的第六代core处理器Skylake,可见整
合内显的规模正在不断的增大,性能也是以倍数增加,而CPU每次升级都是
以提高能耗比为主,说真的从Sandy Bridge到Skylake CPU的性能提升幅度
并不算太突出,GPU性能反而成了每代处理器的性能提升重点,下面我们就
来回顾一下Intel的内核进化历程。
首款整合GPU的CPU:Clarkdale
http://img2.expreview.com/img/review/clarkdale/core5.jpg
虽然说Intel的做法有点狡猾,但是2010年推出的Clarkdale处理器确实首款
整合GPU的CPU,这款处理器由32nm制程CPU Die和45nm的GPU Die共同封装在
一块PCB上组成,两颗芯片使用QPI通道相连,通俗点来讲Intel把CPU和北桥
芯片用胶水粘在了一起。
Clarkdale内核结构图,GPU Die上包含了PCI-E控制器和内存控制器,其实
就是一个北桥芯片
http://img2.expreview.com/img/review/clarkdale/clarkdale-scheme.jpg
Clarkdale系列处理器只有双核的型号,有Core i5-600和Core i3-500两个
型号,在LGA 1156时代四核处理器是没有整合GPU的。
当时的Intel把Clarkdale上的GPU统称为“Intel HD Graphics”,这名字一
直用到现在。而这个GPU其实就是G45上的X4500 HD的升级版,EU增加了两个
达到了12个,核心频率最高可以到900MHz,支援Hierarchical Z(层次Z缓
冲算法)与Fast Z Clear(快速Z清除)技术,支援DX10、SM4.0,支持
OpenGL 2.1,移动版处理器的GPU可以通过Turbo Boost动态调整频率,而桌
面版不行。
真正的核显:Sandy Bridge
http://img2.expreview.com/img/review/SandyBridge/Sandy-Bridge-Die-Map.jpg
Sandy Bridge核心图
正在把CPU和GPU做到同一块芯片上的是在2011年上推出的Sandy Bridge架构
处理器,CPU、GPU、内存控制器、PCI-E控制器全部整合到一个核心里面,
它的最大改进在于三级缓存改用了环形总线设计,并且其核心、GFX以及显
示/媒体控制器可共享L3快取内存。
http://img2.expreview.com/img/review/SandyBridge/SNB_GFXs.jpg
Sandy Bridge的GPU主要包含了指令流处理器、媒体处理器、多格式媒体解
码器、执行单元、统一执行单元阵列、媒体取样器、纹理采样器以及指令缓
冲等等,架构与上一代相比有了较大修改。
Sandy Bridge按照型号划分了标准版以及“K”系倍频解锁版本,标准版本
GFX命名为HD Graphics 2000,而唯独K系列所拥有的GFX为等级更高的HD
Graphics 3000,两者的区别是前者拥有6个EU,而后者则达到了12个,全面
支持Turbo Boost动态调整频率,最高频率可达1350MHz,支援DX10.1、
SM4.1,支持OpenGL 3.0,性能上HD Graphics 3000比上一代有了翻倍的增
长。
此外这一代核显还增加了Quick Sync转码加速技术,利用内置的编码器可以
支援MPEG2、VC1和H.264视频各种的硬件编码,Sandy Bridge所整合的图形
核心已实现了视讯解码和编码两部分的硬件加速功能,可为使用者在视讯转码
时节省更多的时间。
迎来DX11时代:Ivy Bridge
Ivy Bridge架构图
http://img2.expreview.com/img/review/i7_3770K/ivy06.jpg
在Ivy Bridge上Intel针对内显的改进还是两个方向,首先是进一步提高GPU
的性能,并且让其支援DX11,第二点则是继续提高内显的功能,多萤幕输出、
高分辨率支援等。
http://img2.expreview.com/img/review/i7_3770K/gpu_05.jpg
Ivy Bridge的GPU增强了几何前端、光栅化、像素后端处理、采样器、寻址
单元的并行运算能力,每周期可以执行2个MAC操作,GPU可以直接读取L3
快取中的数据,图形单元新增两个可编程操作以及一个固定功能单元以支援曲
面细分计算,并在解码与显示功能上做了升级。
同样的内显也分为两种,分别是有16个EU单元的HD 4000和6个EU单元的的HD
2500,“K”系列处理器用的是HD 4000而其他处理器用的是HD 2500,最高
频率与SNB时代一样是1350MHz,支援DX11、SM5.0,OpenGL 3.2,性能
上HD 4000比上一代的HD 3000提升了67%。
Ivy Bridge支援Quick Sync 2.0编码加速技术,与第一代相比,2.0版不仅
速度更快,而且画质也会更高。视讯输出方面也从原来的双萤幕上升到三萤幕输
出,最大分辨率从原来的2560*1600上升到4k*4k级别。
“Iris Graphics”登场:Haswell
Haswell架构图
http://img.expreview.com/review/2013/05/Core_i7_4770K/Haswell_09.JPG
Haswell采用的是Gen 7.5内显,这一代开始Intel的内显开始了模组化、可扩
展的设计,Haswell的显示核心采用两级EU团簇结构设计,上级的叫Slice,
下级的叫Subslice,每个Subslice拥有10个EU,2组Subslice单元组成了1组
Slice单元,这一代在GT1和GT2两个级别之上又诞生了GT3核心,从此Intel
就走上了暴力堆砌内显规格的道路。
http://img.expreview.com/review/2013/05/Core_i7_4770K/Haswell_05.jpg
Haswell的GT1、GT2、GT3内显分别拥有10个、20个和40个EU单元,此外还有
一个带嵌入式eDRAM的GT3e,该内显核心拥有128MB eDRAM,512bit频宽可
达64GB/s ,这个嵌入式eDRAM是作为L4快取存在的,可以同时提升CPU和GPU
性能。
Intel的内显一直以来都用HD Graphics来命名,不过与NVIDIA的GeForce还
有AMD的Radeon相比这个名字还是不够霸气,因此从Haswell处理器的核芯显
卡开始,英特尔将引入新的名字“Iris ”和“Iris Pro”,中文名为“锐
炬”和“锐炬Pro”,分别对应GT3以及GT3e核显,具体型号则是Iris
Graphics 5100和Iris Pro Graphics 5200。
这一代的桌面版core处理器基本上都是使用GT2核显,型号是HD Graphics
4600/4400,后者只用在Core i3-41xx系列处理器上,只有16个EU,对非K系
列处理器来核显性能是较上一代有大幅提升的,而真正需要高性能内显的也
是Core i3那种级别的,高端处理器基本都是配个独显。
奔腾和赛扬处理器配的是GT1核显,而这一代最强的GT3e核显只出现在两款
桌面级处理器上,就是Core i7-4770R和Core i5-4670R,然而这两个都不零
售,是针对OEM市场的产品。
最强桌面核显:Broadwell
Broadwell-H内部结构
http://img.expreview.com/news/2015/06/03/Intel_Broadwell-H.png
Broadwell主要都是面向携带装置市场,在桌面零售市场上其实就只有两个CPU,
Core i7-5775C和Core i5-5675C,配备Intel目前最强的Iris Pro 6200核
显,拥有128MB的eDRAM快取,另外无锁倍频,可进行超频。
Broadwell上的Gen8 GPU架构示意图
http://img.expreview.com/news/2015/07/28/skylake/sl-gpu-02.jpg
Broadwell上使用的是Gen8图形核心,Intel重新设计了Subslice单元,每组
的EU单元从之前的10个下降到了8个,在同样的采样器及调度器下这意味着
每个EU单元的效率提升了,而弥补EU数量可以通过提升Subslice单元总数来
完成,所以Broadwell的1组Slice单元有3组Subslice单元,EU单元总数是24
个,Broadwell的GT1、GT2、GT3核显分别拥有12个、24个和48个EU单元。
桌面零售版那两个配备的Iris Pro 6200属于带eDRAM的GT3e核心,得益于核
心规模的大幅提升,Core i7-5775C的内显性能较上一代Core i7-4790K提升
了将近80%,而已由于现在的Skylake桌面版只有GT2核心,所以Broadwell架
构的这两款处理器成为目前拥有最强内显的桌面级处理器,然而这两个处理
器在中国根本没有正式上市,要买的话比较难找。
越堆越大的GPU:Skylake
Skylake处理器核心
http://img.expreview.com/news/2015/08/19/skylakedie.jpg
Skylake使用的Gen9代GPU其实与Gen8有很多地方都是相似的,每组Subslice
单元依旧是24个EU,但是最多可以扩展到3组Slice单元,也就是说最多会配
备72个EU单元,因此Skylake也多出GT4这个级别的核显。
GT4内显可以支持3组Slice单元,72个EU单元
http://img.expreview.com/news/2015/08/19/SKL_GPU_14.jpg
Skylake的Gen9架构支援DX12、OpenCL 2.x、OpenGL 5.x、Vulkan等图形规
范,支持新的编译器堆栈,功耗范围从4W-65W+不等。此外,Gen9还支持
HEVC/H.265、AVC、SVC、VP8、MJPG硬件加速,支援RAW架构。
多媒体方面,Gen9架构支持单一固定功能单元以降低功耗,Quick Sync转码
单元也设计了固定功能的编码器以降低功耗、延迟。此外,Gen9的视讯解
码、转码加速还支援了HEVC(H.265)、VP8、MJPEG等标准。
Skylake处理器上启用全新的核显命名
http://img.expreview.com/news/2015/07/28/skylake/sl-gpu-03.png
然而GT3/GT3e/GT4e这样的高性能内显只使用在移动版处理器上,桌面版的
Skylake处理器基本上都是使用只有24EU的GT2,虽然较桌面版Haswell来说
性能还是有所提升,但是幅度只有20%。另外还有两个“P”后续的处理器用
的是GT1内显。
http://img.expreview.com/news/2016/03/18/Intel_HDGraphics_03.jpg
从Gen1到Gen9,Intel的图形核心性能有上百倍的提升
Intel这些年来在内显确实下了不少功夫,性能提升幅度相当的大,入门级
显卡基本上都被内显赶尽杀绝了, 而反观CPU,性能提升幅度就没那么明显
了,降低功耗反而成了重点,低功耗的处理器造就了现在超级本和各种
Windows平板的盛行,而这些年来移动设备都上高分辨率萤幕,这对内显又
有了性能上的需求,市场的需求影响了Intel近年来的处理器改进方向,未
来Intel CPU也是以提升内显性能并降低整体功耗为主。
不过跟AMD相比的话,AMD有游戏厂商的加持,可以透过驱动程式来对游戏来作最佳化
所以用AMD的APU来玩游戏似乎比用Intel还要好很多
Intel的内显技术比较偏向商业应用
但是不知道AMD有没有打算在Zen的消费级APU上面实现内显使用HBM的技术....