[情报] 笔电级效能结合手机省电性,ARM 采用 7nm

楼主: Lsamia (samia)   2018-06-01 10:37:05
心得:虽然说这目标是给那些Win10arm笔电
但不知道有没有希望导入到手机这边来使用
毕竟像当年CortexA57原本也没打算来做手机的
不断推高效能至少看跑分也会看的很开心吧
https://goo.gl/oyMP2r
笔电级效能结合手机省电性,ARM 采用 7nm 制程的 Cortex-A76、Mali-G76、Mali-V76
全面登场
在 Computex 前夕,Arm 照例都会有不小的动作,这次一口气推出的处理器 Cortex-A76
、绘图处理器 Mali-G76,以及用作视讯编解码处理的 Mali-V76。Cortex-A76 采用全新
的微架构设计,减少 40% 电力消耗,最高效能还可比 Cortex-A75 多出 35%
剑指笔电市场的 Cortex-A76
进入正题之前,Arm 提出个相当有趣的观点,过去数年以来,每年行动处理器的效能约有
20% 的年增长率,但是笔电处理器却只有个位数的成长。近期 Arm 处理器架构已经成
功吸纳 Microsoft Windows 10,虽然并不完美,但拥有 20 小时的 Office 办公室软件
的作业时间续航力不是问题。透过处理器架构的省电特性,加上 Cortex-A76 效能提升,
该公司乐观看待 2019 年推出第二代采用 Arm 处理器架构的 Windows 笔电,效能相比第
一代 Qualcomm Snapdragon 835 处理器版本成长百分百。
Cortex-A76 相容 Armv8-A 和 Armv8.2-A 延伸指令集,同时也支援过去 A32 和 T32,
The Register 网站则收到另外 1 项资讯,EL0 模式(一般程式运作无需特权的模式)往
下相容 32 位元指令没有问题,EL1(作业系统模式)或是 EL2(虚拟机模式)以上则仅
支援 64 位元,不若前辈还可以在较高的特权模式支援 32 位元指令。The Register 推
测此举可以减少处理器硬件设计复杂度,但对于一些软件开发者较为麻烦。
Cortex-A76 同样支援先前推出的 DynamIQ 多核心组合方式,但由于 Cortex-A76 为大核
心设计,因此在同一 DynamIQ 丛集当中,最多只能放入 4 个核心。L1 快取固定规格为
64KB 4-way 指令快取以及 64KB 4-way 资料快取,每个时脉周期可以从 L2 快取撷取
32Byte 指令进入 L1 指令快取,L1 资料快取则于每时脉周期读取和写入 32Byte 资料
至 L2。L2 快取容量可以选择 256KB 或是 512KB,每个时脉周期同样可以读取和写入
32Byte 资料至 L3。
DynamIQ 设计为 L3 快取由全部处理器核心共用(也可以完全不配置 L3 快取),容量从
512KB~4MB 任君选择,但相对每个核心的吞吐量不变。处理器前端的分支预测和指令撷
取在 Cortex-A76 为分离设计,分支预测每时脉周期撷取 32Byte,而指令撷取每时脉仅
有 16Byte,额外的部分正好可以掩饰分支预测失败的效能损失,有助于提升前端运作效
率,最高每个时脉周期可以撷取 4~8 个指令(16bit 指令为 8 个)。
解码部分则是 Arm 第一款 4-wide 设计,每个时脉周期则能够派发 8 个解码后的微指令
至运算单元和位址产生单元;当然,运算单元支援乱序执行(OoOE、Out-of-Order
Excution)。运算单元整数部分支援 4-issue,内部包含 3 个 ALU 和 1 个分支单元,
浮点/原生 16Byte 向量部分则是 2-issue,Arm 强调输出量为先前任意型号的 2 倍,能
够在低精度机器学习算法提供相较前代 4 倍效能。
Cortex-A76 处理器旗舰型产品预计使用 TSMC 7nm 制程,今年下半年即可见到首批产品
,2019 年开始大量出货。Cortex-A76 在 7nm 制程、3GHz 运作时脉,相对 Cortex-A75
10nm 制程、2.8GHz 时脉,效能增长约 35%(使用 GeekBench v4.1、AArch64);若给
予 2 者相同的电力,则 Cortex-A76 的效能表现为 Cortex-A75 的 1.4 倍。
Mali-G76 微架构小调整
电竞游戏市场持续成长,手机游戏占比也逐年增高,Arm 自然也不会放过此块大饼推出
Mali-G76。相较于前一代 Mali-G72,每单位效能密度增长 30%,能源效率也提升 30%
,机器学习效能则是 2.7 倍。Mali-G76 采用与 Mali-G72 相同的 Bifrost 微架构,但
是内部的执行通道从 Mali-G72 每个引擎 4 条提升至 8 条,换算下来 Mali-G72 最高共
有 384 条(32 核心、每核心包含 3 引擎),而 Mali-G76 则为 480 条(20 核心、每
核心包含 3 引擎)。
Mali-V76 聚焦东京奥运 8K 转播
近期没有值得注意的影片编解码格式出现,Mali-V76 毫无意外地继续加强编解码效能,
已经可以支援 8K/60p 影片解码以及 8K/30p 编码。由于该公司的 IP 设计成品不会立刻
在市场出现,因此 Arm 在设计产品时必须考虑未来支援性,2 年过后正好举行东京夏季
奥运会,日本预计替该场奥运会提供 8K 赛事转播,因此加入 8K/60p 解码能力。
虽然目前 8K 应用并不成熟,Mali-V76 也可将此能力拆成 4 个 4K 影片解码,或是 16
个 Full HD,方便驱动 VR 眼镜或是大型电视墙等应用。若与自家前些日子推出的
Mali-D71 相互合作使用 Assertive Display 5 功能,Mali-V76 可以在传送画面的同时
也传送 Assertive Display 5 所需相关数据,Mali-D71 就不用再次运算,即可以
60FPS 或是 120FPS 的速度,依据使用者所在环境自动调整萤幕画面至最佳状态。

Links booklink

Contact Us: admin [ a t ] ucptt.com