Re: [情报] 4090太强 12900K/5800X3D都成瓶颈

楼主: oopFoo (3d)   2022-10-13 17:41:45
※ 引述《oppoR20 (发情豹纹)》之铭言:
: 已经不只一家评测指出这个问题了
: https://bit.ly/3MnaQNi
: TechSpot:5800X3D
: 1080p/1440p下会有CPU瓶颈
: https://i.imgur.com/ZPHXSHw.png
: Techpowerup/Techspot两家测试都很明显 4k之外都被cpu瓶颈了
: 尤其TPU用更弱的5800X让4090效能无法发挥完全
: https://bit.ly/3yU7Anl
: PCMAG:默认功耗下会让12900K成为瓶颈
: https://bit.ly/3rNegPU
: PcWorld:快到4K以下几乎都会造成瓶颈
https://www.chiphell.com/thread-2450201-1-1.html
https://i.imgur.com/xE4FJkD.png
其实不是CPU跟不上,是4090里面的Front End(FE)跟不上。
了解为什么老黄不愿意改进FE,现在臭打AI更重要,而且Mesh Shader如果普及会减轻FE的压力。
但能把缺点讲成优点,老黄的宣传部门实在厉害。
作者: meicon5566 (妹妹文专家妹控56)   2022-10-13 17:44:00
结果又是老黄的锅
作者: meicon5566 (妹妹文专家妹控56)   2022-10-13 17:44:00
结果又是老黄的锅
作者: sigma9988 (留痕)   2022-10-13 17:51:00
坐等50卡
作者: sigma9988 (留痕)   2022-10-13 17:51:00
坐等50卡
作者: ISAF   2022-10-13 17:53:00
风向又变了 大人
作者: ikarifaye (杀人放火的正义使者)   2022-10-13 17:53:00
什么锅 这是刀法
作者: ISAF   2022-10-13 17:53:00
风向又变了 大人
作者: ikarifaye (杀人放火的正义使者)   2022-10-13 17:53:00
什么锅 这是刀法
作者: joe199277 (~卡摩君~)   2022-10-13 17:55:00
老黄的刀法...真的好强....
作者: joe199277 (~卡摩君~)   2022-10-13 17:55:00
老黄的刀法...真的好强....
作者: Riya520 (GO!!!!!!)   2022-10-13 17:56:00
皮衣刀客正盯着你
作者: Riya520 (GO!!!!!!)   2022-10-13 17:56:00
皮衣刀客正盯着你
作者: dylantu ( ′・ω・‵)   2022-10-13 18:11:00
老黄没有缺点 消费者才有
作者: dylantu ( ′・ω・‵)   2022-10-13 18:11:00
老黄没有缺点 消费者才有
作者: LastAttack (与我无关~~)   2022-10-13 18:14:00
神前刀工,规格冗余是为了4090ti留后路,架构冗余是为了50系列留后路
作者: GermanGerm (菌哥)   2022-10-13 18:17:00
有人可以帮硬件麻瓜解释一下FE是什么以及为什么造成瓶颈吗QAQ
作者: LastAttack (与我无关~~)   2022-10-13 18:14:00
神前刀工,规格冗余是为了4090ti留后路,架构冗余是为了50系列留后路
作者: GermanGerm (菌哥)   2022-10-13 18:17:00
有人可以帮硬件麻瓜解释一下FE是什么以及为什么造成瓶颈吗QAQ
作者: tactics2100 (Ose)   2022-10-13 18:30:00
应该改成 主机卡插显示板了 贵成这样不操个十年说不过去
作者: tactics2100 (Ose)   2022-10-13 18:30:00
应该改成 主机卡插显示板了 贵成这样不操个十年说不过去
楼主: oopFoo (3d)   2022-10-13 18:31:00
fe是前端。现代的gpu虽然vertex/pixel shader是共用的,但前面还有一个专门处理三角形的前端,这个triangles/s就是
作者: tactics2100 (Ose)   2022-10-13 18:32:00
既然强成这样 那就不要焊死 做成像cpu一样可以换芯片
作者: tactics2100 (Ose)   2022-10-13 18:32:00
既然强成这样 那就不要焊死 做成像cpu一样可以换芯片
楼主: oopFoo (3d)   2022-10-13 18:34:00
处理能力。看不见的三角形就在这抛弃,点(vertex)也在这算
楼主: oopFoo (3d)   2022-10-13 18:34:00
处理能力。看不见的三角形就在这抛弃,点(vertex)也在这算
作者: tactics2100 (Ose)   2022-10-13 18:34:00
就算效能会降一些 应该还是卡cpu瓶颈
作者: tactics2100 (Ose)   2022-10-13 18:34:00
就算效能会降一些 应该还是卡cpu瓶颈
作者: friedpig (烤焦棉花糖)   2022-10-13 18:36:00
Ada本来传言就是 ampere 台GG版 靠GG制程规模拉大很多
作者: friedpig (烤焦棉花糖)   2022-10-13 18:36:00
Ada本来传言就是 ampere 台GG版 靠GG制程规模拉大很多
楼主: oopFoo (3d)   2022-10-13 18:36:00
Mesh Shader可以一次处理一堆三角形,可以降低fe的压力,
楼主: oopFoo (3d)   2022-10-13 18:36:00
Mesh Shader可以一次处理一堆三角形,可以降低fe的压力,
作者: friedpig (烤焦棉花糖)   2022-10-13 18:37:00
传统性能部分看起来改变不大 暴力+大而已 其他进步都在
作者: friedpig (烤焦棉花糖)   2022-10-13 18:37:00
传统性能部分看起来改变不大 暴力+大而已 其他进步都在
楼主: oopFoo (3d)   2022-10-13 18:37:00
但现在用Mesh Shader的游戏还很少。
楼主: oopFoo (3d)   2022-10-13 18:37:00
但现在用Mesh Shader的游戏还很少。
作者: MoneyBlue (爱死娘子咪啦!!)   2022-10-13 18:51:00
看来是游戏程式设计跟不上老黄
作者: MoneyBlue (爱死娘子咪啦!!)   2022-10-13 18:51:00
看来是游戏程式设计跟不上老黄
作者: a000000000 (九个零喔)   2022-10-13 18:55:00
干尼老黄
作者: aegis43210 (宇宙)   2022-10-13 18:58:00
主要的改善在即时光追,GPC的主要变动是L2变大
作者: a000000000 (九个零喔)   2022-10-13 18:55:00
干尼老黄
作者: aegis43210 (宇宙)   2022-10-13 18:58:00
主要的改善在即时光追,GPC的主要变动是L2变大
作者: friedpig (烤焦棉花糖)   2022-10-13 18:59:00
看下一代状况吧 下一代还有MCM 整体应该会改更大不过这代用GG已经不错了 可以战蛮久又不热
作者: friedpig (烤焦棉花糖)   2022-10-13 18:59:00
看下一代状况吧 下一代还有MCM 整体应该会改更大不过这代用GG已经不错了 可以战蛮久又不热
作者: aegis43210 (宇宙)   2022-10-13 19:02:00
所以效能爆增几乎都是GG的贡献
作者: aegis43210 (宇宙)   2022-10-13 19:02:00
所以效能爆增几乎都是GG的贡献
作者: hong414 (allen0983)   2022-10-13 19:02:00
游戏厂的问题 不关我们老黄的事 配合nv是他们的责任
作者: hong414 (allen0983)   2022-10-13 19:02:00
游戏厂的问题 不关我们老黄的事 配合nv是他们的责任
作者: nmkl (超级地球)   2022-10-13 19:04:00
看来等苏妈的了
作者: nmkl (超级地球)   2022-10-13 19:04:00
看来等苏妈的了
作者: as6633208 (okokokiknow)   2022-10-13 19:12:00
没逻辑,各大测试结果很明显就是cpu瓶颈的特征。按你说数据会“塞”在gpu前端,不就代表gpu根本还没完成图像运算就请求下一个运算数据?这样的话是不是只要跑个一两小时,前端就会卡一卡车的数据,然后就开始变慢了?你确定?前端问题应该是gpu瓶颈吧?你当那些测试的连gpu瓶颈跟cpu瓶颈都分不出来吗?找个中国论坛不知到什么咖的乡民的废文,就想推翻cpu瓶颈测试结果,我也是笑,资料严谨度比维基百科还废
作者: as6633208 (okokokiknow)   2022-10-13 19:12:00
没逻辑,各大测试结果很明显就是cpu瓶颈的特征。按你说数据会“塞”在gpu前端,不就代表gpu根本还没完成图像运算就请求下一个运算数据?这样的话是不是只要跑个一两小时,前端就会卡一卡车的数据,然后就开始变慢了?你确定?前端问题应该是gpu瓶颈吧?你当那些测试的连gpu瓶颈跟cpu瓶颈都分不出来吗?找个中国论坛不知到什么咖的乡民的废文,就想推翻cpu瓶颈测试结果,我也是笑,资料严谨度比维基百科还废
楼主: oopFoo (3d)   2022-10-13 19:42:00
我开始写3d程式是比老黄的tnt还早。从triangle setup开始T&L,geometry/hull stages,compute, mesh shader,几乎通通都经历过。从cpu做culling,变成coarse culling,现在再变成mesh shader来culling。Mesh Shader 其实跟ps2的vpu与ps3的spu很像。硬件,软件的变化,算是都跟上了。你要说我比那些只会测试的人不懂?
楼主: oopFoo (3d)   2022-10-13 19:42:00
我开始写3d程式是比老黄的tnt还早。从triangle setup开始T&L,geometry/hull stages,compute, mesh shader,几乎通通都经历过。从cpu做culling,变成coarse culling,现在再变成mesh shader来culling。Mesh Shader 其实跟ps2的vpu与ps3的spu很像。硬件,软件的变化,算是都跟上了。你要说我比那些只会测试的人不懂?
作者: keyman2 (edge)   2022-10-13 19:47:00
看不懂但是好厉害的样子
作者: keyman2 (edge)   2022-10-13 19:47:00
看不懂但是好厉害的样子
楼主: oopFoo (3d)   2022-10-13 19:50:00
ada的triangles/s的rate都出来了,瓶颈在那已经很清楚了
楼主: oopFoo (3d)   2022-10-13 19:50:00
ada的triangles/s的rate都出来了,瓶颈在那已经很清楚了
作者: jimmyyang207 (书玮吉米)   2022-10-13 19:52:00
那懂哥可以帮我们科普一下为何有些测试看起来跟CPU的性能有直接关系呢?感恩
作者: jimmyyang207 (书玮吉米)   2022-10-13 19:52:00
那懂哥可以帮我们科普一下为何有些测试看起来跟CPU的性能有直接关系呢?感恩
作者: ddrbox (练网球)   2022-10-13 19:53:00
若是DL/ML用途,是不是FE的压力就没这么大?
作者: ddrbox (练网球)   2022-10-13 19:53:00
若是DL/ML用途,是不是FE的压力就没这么大?
作者: boren (boren)   2022-10-13 19:56:00
我也不明白,所以是只要画面的三角形太多GPU就跑不满?
作者: boren (boren)   2022-10-13 19:56:00
我也不明白,所以是只要画面的三角形太多GPU就跑不满?
作者: a85139138 (Carlos)   2022-10-13 20:01:00
原来有行家啊也想请教一下前端的triangles/s造成的瓶颈,CPU是怎么cover的
作者: a85139138 (Carlos)   2022-10-13 20:01:00
原来有行家啊也想请教一下前端的triangles/s造成的瓶颈,CPU是怎么cover的
作者: a45351 (小便)   2022-10-13 20:05:00
所以是cpu在强也没用吗
作者: a45351 (小便)   2022-10-13 20:05:00
所以是cpu在强也没用吗
楼主: oopFoo (3d)   2022-10-13 20:06:00
dl/ml用不到这个fe。对,太多三角形就shaders在等。现在的triangles很多都是gpu自己在产生的,cpu只是下指令
楼主: oopFoo (3d)   2022-10-13 20:06:00
dl/ml用不到这个fe。对,太多三角形就shaders在等。现在的triangles很多都是gpu自己在产生的,cpu只是下指令
作者: aimlin ( )   2022-10-13 20:08:00
硬件不是nv的问题 是消费者的问题
作者: aimlin ( )   2022-10-13 20:08:00
硬件不是nv的问题 是消费者的问题
楼主: oopFoo (3d)   2022-10-13 20:08:00
而已,很多传统cpu在处理,能转到gpu处理的都转过去。cpu在这能帮助的很有限,基本上现在3d绘图程式的优化都是如何让gpu能全速前进,cpu尽量不要去打扰。
作者: Nonegrame (程式写得好,好人做到老)   2022-10-13 20:10:00
可以开始等5090了
作者: Nonegrame (程式写得好,好人做到老)   2022-10-13 20:10:00
可以开始等5090了
作者: twinkleAshed (香草奶昔先生)   2022-10-13 20:13:00
Ada是不是架构没有跟上整个硬件规模才会卡住?如果简而言之的话?
作者: ileva3324 (yutuop)   2022-10-13 20:14:00
等50+1
作者: twinkleAshed (香草奶昔先生)   2022-10-13 20:13:00
Ada是不是架构没有跟上整个硬件规模才会卡住?如果简而言之的话?
作者: ileva3324 (yutuop)   2022-10-13 20:14:00
等50+1
作者: LiNcUtT (典)   2022-10-13 20:19:00
故意留一手啦,不然50系要出啥XD反正牛肉端一半就打死竞品了,没必要一次全上完吧
作者: LiNcUtT (典)   2022-10-13 20:19:00
故意留一手啦,不然50系要出啥XD反正牛肉端一半就打死竞品了,没必要一次全上完吧
作者: landy0910 (lolicom)   2022-10-13 20:22:00
看不懂(ry
作者: Supasizeit (更大更快更有力)   2022-10-13 20:23:00
不然你要买AMD
作者: ddrbox (练网球)   2022-10-13 20:23:00
了解,换言之,4090的目标客群是专业市场,游戏只是附加的
作者: ddrbox (练网球)   2022-10-13 20:23:00
了解,换言之,4090的目标客群是专业市场,游戏只是附加的
作者: Bencrie   2022-10-13 20:27:00
理想状况就是送很少的资料能画很复杂的图
作者: Bencrie   2022-10-13 20:27:00
理想状况就是送很少的资料能画很复杂的图
作者: BraviaX95j (米其林)   2022-10-13 20:28:00
我就问front End是什么?
作者: BraviaX95j (米其林)   2022-10-13 20:28:00
我就问front End是什么?
作者: huhu12301231 (胜痕)   2022-10-13 20:32:00
既然你懂这么多干嘛要贴对岸文 写一篇提升一下板上水准呀
作者: huhu12301231 (胜痕)   2022-10-13 20:32:00
既然你懂这么多干嘛要贴对岸文 写一篇提升一下板上水准呀
作者: vig077   2022-10-13 20:38:00
昨天还在吹==
作者: vig077   2022-10-13 20:38:00
昨天还在吹==
作者: smallreader (小读者)   2022-10-13 20:38:00
推专业解释 干你老黄
作者: smallreader (小读者)   2022-10-13 20:38:00
推专业解释 干你老黄
作者: commandoEX (卡曼都)   2022-10-13 20:40:00
或许也可以说是4090的目标已经不是fhd这些分辨率不是吗?
作者: commandoEX (卡曼都)   2022-10-13 20:40:00
或许也可以说是4090的目标已经不是fhd这些分辨率不是吗?
作者: intela03252 (intela03252)   2022-10-13 20:41:00
大概就是要你积极启用dlss那些东西吧3080ti dlss开起来也不太容易感觉出画质减损了2077不开dlss真的很难冲高帧数
作者: intela03252 (intela03252)   2022-10-13 20:41:00
大概就是要你积极启用dlss那些东西吧3080ti dlss开起来也不太容易感觉出画质减损了2077不开dlss真的很难冲高帧数
作者: poi96300 (天阿poi)   2022-10-13 20:53:00
13代解禁后 效能提升 GPU使用率提高时 我看你怎么解释
作者: poi96300 (天阿poi)   2022-10-13 20:53:00
13代解禁后 效能提升 GPU使用率提高时 我看你怎么解释
作者: ronald279 (ronald279)   2022-10-13 21:02:00
看不懂QQ
楼主: oopFoo (3d)   2022-10-13 21:20:00
其实就是取舍,AI/RT比较重要,Mesh/Task Shader普及后,FE的瓶颈也就解除了。某方面也是战未来。
作者: ronald279 (ronald279)   2022-10-13 21:02:00
看不懂QQ
楼主: oopFoo (3d)   2022-10-13 21:20:00
其实就是取舍,AI/RT比较重要,Mesh/Task Shader普及后,FE的瓶颈也就解除了。某方面也是战未来。
作者: TaiwanBeijin (台湾北京)   2022-10-13 21:26:00
原po或许是架构上专家 但却不是商业成本的专家 讲的东西经常只看架构而忽略制造成本
作者: TaiwanBeijin (台湾北京)   2022-10-13 21:26:00
原po或许是架构上专家 但却不是商业成本的专家 讲的东西经常只看架构而忽略制造成本
作者: leviva (华丽幻影)   2022-10-13 21:31:00
如果13900K / 7950X / 7800X3D 1080p / 2k 都拉不开跟3090 Ti的差距,证明cpu瓶颈完全是伪概念 ( 而且买4090的,99.99% 开4K画质,完全不受影响)
作者: leviva (华丽幻影)   2022-10-13 21:31:00
如果13900K / 7950X / 7800X3D 1080p / 2k 都拉不开跟3090 Ti的差距,证明cpu瓶颈完全是伪概念 ( 而且买4090的,99.99% 开4K画质,完全不受影响)
作者: KoiKaze (恋风)   2022-10-13 21:56:00
优文
作者: KoiKaze (恋风)   2022-10-13 21:56:00
优文
作者: sx4152 (呵呵)   2022-10-13 21:58:00
合理阿 怎么可能现在这么强的cpu会是瓶颈
作者: sx4152 (呵呵)   2022-10-13 21:58:00
合理阿 怎么可能现在这么强的cpu会是瓶颈
作者: google60411 (MouMou)   2022-10-13 21:59:00
太难懂了 拔草测风向
作者: google60411 (MouMou)   2022-10-13 21:59:00
太难懂了 拔草测风向
作者: ctes940008 (蛤!我只是小兵!?)   2022-10-13 22:07:00
不明觉厉
作者: ctes940008 (蛤!我只是小兵!?)   2022-10-13 22:07:00
不明觉厉
作者: LiNcUtT (典)   2022-10-13 22:23:00
13代解禁后就知道了,剩一个礼拜
作者: LiNcUtT (典)   2022-10-13 22:23:00
13代解禁后就知道了,剩一个礼拜
作者: NodeWay (不由分说)   2022-10-13 22:40:00
看13900k有没有提升就知道了终于等到13900+4090了
作者: NodeWay (不由分说)   2022-10-13 22:40:00
看13900k有没有提升就知道了终于等到13900+4090了
作者: rickie1141   2022-10-13 22:53:00
拔草测风向
作者: rickie1141   2022-10-13 22:53:00
拔草测风向
作者: bbest (CFP-game theory)   2022-10-13 23:26:00
levi大讲到重点,等13代解禁就知道这篇是神预测还是喇叭文了
作者: bbest (CFP-game theory)   2022-10-13 23:26:00
levi大讲到重点,等13代解禁就知道这篇是神预测还是喇叭文了
作者: mrme945   2022-10-13 23:30:00
已经有人拿7950X测过了,一样瓶颈呀
作者: mrme945   2022-10-13 23:30:00
已经有人拿7950X测过了,一样瓶颈呀
作者: gbcg9725 (谢谢你9725)   2022-10-14 00:10:00
等等党又可以等50了
作者: gbcg9725 (谢谢你9725)   2022-10-14 00:10:00
等等党又可以等50了
作者: ddfg (douges)   2022-10-14 00:12:00
因为现在cpu都在剂牙膏
作者: ddfg (douges)   2022-10-14 00:12:00
因为现在cpu都在剂牙膏
作者: kuninaka   2022-10-14 00:12:00
这篇的解释合理啊,FE无能让后端的shader在等
作者: kuninaka   2022-10-14 00:12:00
这篇的解释合理啊,FE无能让后端的shader在等
作者: RaiGend0519 (Named RaiGend)   2022-10-14 00:13:00
大神出没
作者: RaiGend0519 (Named RaiGend)   2022-10-14 00:13:00
大神出没
作者: kuninaka   2022-10-14 00:13:00
以前CPU负责送三角形 现在是GPU自己送
作者: kuninaka   2022-10-14 00:13:00
以前CPU负责送三角形 现在是GPU自己送
作者: ddfg (douges)   2022-10-14 00:14:00
讲得好像13代很神一样,制程没变化还不是12代再捏上去
作者: ddfg (douges)   2022-10-14 00:14:00
讲得好像13代很神一样,制程没变化还不是12代再捏上去
作者: kuninaka   2022-10-14 00:15:00
游戏设计跟不上老黄XDD
作者: kuninaka   2022-10-14 00:15:00
游戏设计跟不上老黄XDD
作者: minipopy0314 (Galaxy)   2022-10-14 00:16:00
我都在等100系了 老黄你快改阿
作者: minipopy0314 (Galaxy)   2022-10-14 00:16:00
我都在等100系了 老黄你快改阿
作者: www123442 (Hibao.)   2022-10-14 00:49:00
CPU占用才20~30%讲CPU瓶颈 不然是要做到单核10GHz吗?
作者: www123442 (Hibao.)   2022-10-14 00:49:00
CPU占用才20~30%讲CPU瓶颈 不然是要做到单核10GHz吗?
作者: tactics2100 (Ose)   2022-10-14 00:53:00
那是因为很多游戏不支援全核运作(常见的就1~4核)游戏会卡但是游戏以外的软件不卡
作者: tactics2100 (Ose)   2022-10-14 00:53:00
那是因为很多游戏不支援全核运作(常见的就1~4核)游戏会卡但是游戏以外的软件不卡
作者: ltytw (ltytw)   2022-10-14 01:35:00
不可质疑你的老黄 你NV价值不足? 难道你要买AMD?
作者: ltytw (ltytw)   2022-10-14 01:35:00
不可质疑你的老黄 你NV价值不足? 难道你要买AMD?
作者: lee988325 (十一仇)   2022-10-14 01:54:00
cpu有可能是单核瓶颈 可是评测的没秀 只能猜测
作者: lee988325 (十一仇)   2022-10-14 01:54:00
cpu有可能是单核瓶颈 可是评测的没秀 只能猜测
作者: wantsu (wantsu)   2022-10-14 01:55:00
你可以买i皇的显卡,弱到CPU绝不可能是瓶颈
作者: wantsu (wantsu)   2022-10-14 01:55:00
你可以买i皇的显卡,弱到CPU绝不可能是瓶颈
作者: fywei (应无所住而生其心)   2022-10-14 01:56:00
敢嘴老黄 你 ...
作者: fywei (应无所住而生其心)   2022-10-14 01:56:00
敢嘴老黄 你 ...
作者: a27417332 (等号卡比)   2022-10-14 02:02:00
有点好奇为什么每周期的三角形处理率变低可以推到瓶颈是在前端的结论?有其他数据证明吗?
作者: a27417332 (等号卡比)   2022-10-14 02:02:00
有点好奇为什么每周期的三角形处理率变低可以推到瓶颈是在前端的结论?有其他数据证明吗?
作者: CORYCHAN (CORY)   2022-10-14 03:12:00
O大好资深
作者: CORYCHAN (CORY)   2022-10-14 03:12:00
O大好资深
作者: a85139138 (Carlos)   2022-10-14 03:23:00
你还是没有解答为何5800X和X3D会有差距,就是因为看到这个差距加上FHD提升非常有限,我们才觉得可能跟CPU有关,如果真的是FE原因那有办法解释这个结果吗
作者: a85139138 (Carlos)   2022-10-14 03:23:00
你还是没有解答为何5800X和X3D会有差距,就是因为看到这个差距加上FHD提升非常有限,我们才觉得可能跟CPU有关,如果真的是FE原因那有办法解释这个结果吗
作者: ipspro (U断脚修不好!)   2022-10-14 05:16:00
等13900k解禁不就知道是不是瓶颈了
作者: ipspro (U断脚修不好!)   2022-10-14 05:16:00
等13900k解禁不就知道是不是瓶颈了
作者: tint (璇月)   2022-10-14 05:37:00
发表会公布的GPC结构图 就可以看出SM结构没什么改变这次ADA的结构没有大改 主要是频率拉高、加大L2、增加SM规模这篇推算出前端的效率 看起来合理 前端效率没跟上规模的增加另外 N卡对于CPU效能较依存的现象 这是从Kepler就开始的因为从Kepler架构开始 NV将Scheduling过程一部分转移给CPU来处理 所以Fermi之后的架构 NV的GPU对CPU的依赖会相对高些但NV这样做的好处是可以大幅降低CUDA执行绪上的延迟架构简化亦能进一步提升GPU的能耗比
作者: tint (璇月)   2022-10-14 05:37:00
发表会公布的GPC结构图 就可以看出SM结构没什么改变这次ADA的结构没有大改 主要是频率拉高、加大L2、增加SM规模这篇推算出前端的效率 看起来合理 前端效率没跟上规模的增加另外 N卡对于CPU效能较依存的现象 这是从Kepler就开始的因为从Kepler架构开始 NV将Scheduling过程一部分转移给CPU来处理 所以Fermi之后的架构 NV的GPU对CPU的依赖会相对高些但NV这样做的好处是可以大幅降低CUDA执行绪上的延迟架构简化亦能进一步提升GPU的能耗比
作者: savagy (天使不打烊)   2022-10-14 05:56:00
终于等到t大开释,虽然还是看不懂
作者: savagy (天使不打烊)   2022-10-14 05:56:00
终于等到t大开释,虽然还是看不懂
作者: tint (璇月)   2022-10-14 06:14:00
当年GTX600系列发售后 就有一些关于新GPU对CPU依赖性的测试http://vga.zol.com.cn/290/2906445.html 当时对岸的测试文#1OubQ0fR (PC_Shopping) 板上有人po过的解析文章https://i.imgur.com/Kq7zjHs.pngKepler架构后Scheduling过程的一部分由驱动交由CPU处理所以原标题依赖CPU和本篇前端处理效率跟不上 觉得都是合理的GPU的发展方向 每隔几年都会有一些变革 现在也许又到变革期
作者: tint (璇月)   2022-10-14 06:14:00
当年GTX600系列发售后 就有一些关于新GPU对CPU依赖性的测试http://vga.zol.com.cn/290/2906445.html 当时对岸的测试文#1OubQ0fR (PC_Shopping) 板上有人po过的解析文章https://i.imgur.com/Kq7zjHs.pngKepler架构后Scheduling过程的一部分由驱动交由CPU处理所以原标题依赖CPU和本篇前端处理效率跟不上 觉得都是合理的GPU的发展方向 每隔几年都会有一些变革 现在也许又到变革期
作者: aegis43210 (宇宙)   2022-10-14 06:26:00
5800x3d表现比较好是因为L3大,指令命中率更高,使GPU前端压力变小
作者: aegis43210 (宇宙)   2022-10-14 06:26:00
5800x3d表现比较好是因为L3大,指令命中率更高,使GPU前端压力变小
作者: tint (璇月)   2022-10-14 06:30:00
早年3D加速芯片->硬件T&L进入GPU时期->统一着色器架构时期绘图芯片从早年狂堆多边形生成效能转为重点摆在着色器效能到现在强化单/半精度效能 强化AI效能和加入光追功能
作者: tint (璇月)   2022-10-14 06:30:00
早年3D加速芯片->硬件T&L进入GPU时期->统一着色器架构时期绘图芯片从早年狂堆多边形生成效能转为重点摆在着色器效能到现在强化单/半精度效能 强化AI效能和加入光追功能
楼主: oopFoo (3d)   2022-10-14 06:46:00
那个解析文章,乱扯一通,完全不懂drawcall的瓶颈是什么。vulkan/dx12很复杂,效能没有提升很多,因为每个游戏都需要一堆PSO(Pipeline State Object)。每个pso都需要编译,编译没办法即时,micro stuttering比以前更厉害,Steam为了解决这个问题,cache pso起来,所以steam cache吃一堆。
楼主: oopFoo (3d)   2022-10-14 06:46:00
那个解析文章,乱扯一通,完全不懂drawcall的瓶颈是什么。vulkan/dx12很复杂,效能没有提升很多,因为每个游戏都需要一堆PSO(Pipeline State Object)。每个pso都需要编译,编译没办法即时,micro stuttering比以前更厉害,Steam为了解决这个问题,cache pso起来,所以steam cache吃一堆。
作者: kuninaka   2022-10-14 06:52:00
上面PO电虾那篇文章被中国人吐槽,乱扯一通XDD"这篇文章属于牛头不对马嘴的典型例子,作者甚至不知道自己在说什么,居然把任务调度和sm内的指令调度混为一谈。"https://i.imgur.com/SuG1ncR.jpg
作者: kuninaka   2022-10-14 06:52:00
上面PO电虾那篇文章被中国人吐槽,乱扯一通XDD"这篇文章属于牛头不对马嘴的典型例子,作者甚至不知道自己在说什么,居然把任务调度和sm内的指令调度混为一谈。"https://i.imgur.com/SuG1ncR.jpg
楼主: oopFoo (3d)   2022-10-14 06:55:00
硬件厂商故意混淆,也是造成大家误解的一大原因。
楼主: oopFoo (3d)   2022-10-14 06:55:00
硬件厂商故意混淆,也是造成大家误解的一大原因。
作者: kuninaka   2022-10-14 06:55:00
低分辨率4090跟3090差不多啊就卡在前面,后面爆干强也没用高负载才有用武之地其实也是好处?低负载买这么强的卡炫富其实没必要
作者: kuninaka   2022-10-14 06:55:00
低分辨率4090跟3090差不多啊就卡在前面,后面爆干强也没用高负载才有用武之地其实也是好处?低负载买这么强的卡炫富其实没必要
作者: tint (璇月)   2022-10-14 09:10:00
https://tinyurl.com/4nb6yr28 后藤弘茂专栏讲解Kepler架构https://i.imgur.com/hpGLask.jpgFermi架构中Scheduling过程是有一部份移交给CPU处理的当年的NV技术文件也有提到 所以那篇解析文的立论是对的只是后面它提的DX12这可能就他自己的观点那个中国人吐槽可能也没去看过NV当年Kepler的技术文件上面第三行没打完整 应是Fermi架构后的Kepler架构SM中的平行处理调度当然还是硬件层 外移的是Pre-Scheduling
作者: tint (璇月)   2022-10-14 09:10:00
https://tinyurl.com/4nb6yr28 后藤弘茂专栏讲解Kepler架构https://i.imgur.com/hpGLask.jpgFermi架构中Scheduling过程是有一部份移交给CPU处理的当年的NV技术文件也有提到 所以那篇解析文的立论是对的只是后面它提的DX12这可能就他自己的观点那个中国人吐槽可能也没去看过NV当年Kepler的技术文件上面第三行没打完整 应是Fermi架构后的Kepler架构SM中的平行处理调度当然还是硬件层 外移的是Pre-Scheduling
楼主: oopFoo (3d)   2022-10-14 14:19:00
kepler只是把job board移出来而已。gpu其实很早就有cpu在里面,Nvidia早在2016年就换RISC-V,比其他人都早。但JobBoard跟Scoring这些东东本来交给主机的CPU是比较适合的。CPU管大的,gpu管sm的thread,各有适合的。但这影响的不是效率,是成本。
楼主: oopFoo (3d)   2022-10-14 14:19:00
kepler只是把job board移出来而已。gpu其实很早就有cpu在里面,Nvidia早在2016年就换RISC-V,比其他人都早。但JobBoard跟Scoring这些东东本来交给主机的CPU是比较适合的。CPU管大的,gpu管sm的thread,各有适合的。但这影响的不是效率,是成本。
作者: kaltu (ka)   2022-10-14 15:00:00
所以是GPU上内建的CPU瓶颈了,不是主板上那颗
作者: kaltu (ka)   2022-10-14 15:00:00
所以是GPU上内建的CPU瓶颈了,不是主板上那颗
楼主: oopFoo (3d)   2022-10-14 15:13:00
瓶颈的是geometry engine,也不是内建的cpu。那个就是专门处理三角形该怎么对应到frame buffer上。以前是归类于前端(FE),但现在中段也会用的到。
楼主: oopFoo (3d)   2022-10-14 15:13:00
瓶颈的是geometry engine,也不是内建的cpu。那个就是专门处理三角形该怎么对应到frame buffer上。以前是归类于前端(FE),但现在中段也会用的到。
作者: ltytw (ltytw)   2022-10-14 15:32:00
推t大
作者: ltytw (ltytw)   2022-10-14 15:32:00
推t大
作者: CharleneTsai (给他200块去吃麦当劳啦)   2022-10-14 18:57:00
结论 等50看看
作者: CharleneTsai (给他200块去吃麦当劳啦)   2022-10-14 18:57:00
结论 等50看看
作者: a85139138 (Carlos)   2022-10-14 19:42:00
感谢o大t 大解释,虽然没看很懂先存起来再说
作者: a85139138 (Carlos)   2022-10-14 19:42:00
感谢o大t 大解释,虽然没看很懂先存起来再说
作者: boren (boren)   2022-10-14 20:54:00
我还好奇的是,为什么4K能比1080P使用率更高?1080P的三角型比较多?应该不是吧?
作者: boren (boren)   2022-10-14 20:54:00
我还好奇的是,为什么4K能比1080P使用率更高?1080P的三角型比较多?应该不是吧?
作者: tint (璇月)   2022-10-14 21:50:00
衡量GPU效能一项指标是填充率 一般主要会指像素和纹理填充率当分辨率愈高 GPU要渲染的像素也愈多 每秒能绘制格数就下降所以boren是指哪方面的使用率?
作者: tint (璇月)   2022-10-14 21:50:00
衡量GPU效能一项指标是填充率 一般主要会指像素和纹理填充率当分辨率愈高 GPU要渲染的像素也愈多 每秒能绘制格数就下降所以boren是指哪方面的使用率?
作者: boren (boren)   2022-10-14 22:07:00
就是工作管理员能看到的GPU使用率,但你这么一说我懂了,分辨率高的时候GPU就加重别的工作了,这时front end就不需要拼命画三角形了
作者: boren (boren)   2022-10-14 22:07:00
就是工作管理员能看到的GPU使用率,但你这么一说我懂了,分辨率高的时候GPU就加重别的工作了,这时front end就不需要拼命画三角形了
作者: LastAttack (与我无关~~)   2022-10-15 00:11:00
CPU瓶颈论者干嘛一直喊13900k==也就多两簇小核、时脉拉一成
作者: LastAttack (与我无关~~)   2022-10-15 00:11:00
CPU瓶颈论者干嘛一直喊13900k==也就多两簇小核、时脉拉一成

Links booklink

Contact Us: admin [ a t ] ucptt.com