楼主:
oopFoo (3d)
2022-10-13 17:41:45※ 引述《oppoR20 (发情豹纹)》之铭言:
: 已经不只一家评测指出这个问题了
: https://bit.ly/3MnaQNi
: TechSpot:5800X3D
: 1080p/1440p下会有CPU瓶颈
: https://i.imgur.com/ZPHXSHw.png
: Techpowerup/Techspot两家测试都很明显 4k之外都被cpu瓶颈了
: 尤其TPU用更弱的5800X让4090效能无法发挥完全
: https://bit.ly/3yU7Anl
: PCMAG:默认功耗下会让12900K成为瓶颈
: https://bit.ly/3rNegPU
: PcWorld:快到4K以下几乎都会造成瓶颈
https://www.chiphell.com/thread-2450201-1-1.html
https://i.imgur.com/xE4FJkD.png
其实不是CPU跟不上,是4090里面的Front End(FE)跟不上。
了解为什么老黄不愿意改进FE,现在臭打AI更重要,而且Mesh Shader如果普及会减轻FE的压力。
但能把缺点讲成优点,老黄的宣传部门实在厉害。
作者: ISAF 2022-10-13 17:53:00
风向又变了 大人
作者:
ikarifaye (杀人放火的正义使者)
2022-10-13 17:53:00什么锅 这是刀法
作者: ISAF 2022-10-13 17:53:00
风向又变了 大人
作者:
ikarifaye (杀人放火的正义使者)
2022-10-13 17:53:00什么锅 这是刀法
作者:
Riya520 (GO!!!!!!)
2022-10-13 17:56:00皮衣刀客正盯着你
作者:
Riya520 (GO!!!!!!)
2022-10-13 17:56:00皮衣刀客正盯着你
作者:
dylantu ( ′・ω・‵)
2022-10-13 18:11:00老黄没有缺点 消费者才有
作者:
dylantu ( ′・ω・‵)
2022-10-13 18:11:00老黄没有缺点 消费者才有
神前刀工,规格冗余是为了4090ti留后路,架构冗余是为了50系列留后路
有人可以帮硬件麻瓜解释一下FE是什么以及为什么造成瓶颈吗QAQ
神前刀工,规格冗余是为了4090ti留后路,架构冗余是为了50系列留后路
有人可以帮硬件麻瓜解释一下FE是什么以及为什么造成瓶颈吗QAQ
应该改成 主机卡插显示板了 贵成这样不操个十年说不过去
应该改成 主机卡插显示板了 贵成这样不操个十年说不过去
楼主:
oopFoo (3d)
2022-10-13 18:31:00fe是前端。现代的gpu虽然vertex/pixel shader是共用的,但前面还有一个专门处理三角形的前端,这个triangles/s就是
既然强成这样 那就不要焊死 做成像cpu一样可以换芯片
既然强成这样 那就不要焊死 做成像cpu一样可以换芯片
楼主:
oopFoo (3d)
2022-10-13 18:34:00处理能力。看不见的三角形就在这抛弃,点(vertex)也在这算
楼主:
oopFoo (3d)
2022-10-13 18:34:00处理能力。看不见的三角形就在这抛弃,点(vertex)也在这算
作者:
friedpig (烤焦棉花糖)
2022-10-13 18:36:00Ada本来传言就是 ampere 台GG版 靠GG制程规模拉大很多
作者:
friedpig (烤焦棉花糖)
2022-10-13 18:36:00Ada本来传言就是 ampere 台GG版 靠GG制程规模拉大很多
楼主:
oopFoo (3d)
2022-10-13 18:36:00Mesh Shader可以一次处理一堆三角形,可以降低fe的压力,
楼主:
oopFoo (3d)
2022-10-13 18:36:00Mesh Shader可以一次处理一堆三角形,可以降低fe的压力,
作者:
friedpig (烤焦棉花糖)
2022-10-13 18:37:00传统性能部分看起来改变不大 暴力+大而已 其他进步都在
作者:
friedpig (烤焦棉花糖)
2022-10-13 18:37:00传统性能部分看起来改变不大 暴力+大而已 其他进步都在
楼主:
oopFoo (3d)
2022-10-13 18:37:00但现在用Mesh Shader的游戏还很少。
楼主:
oopFoo (3d)
2022-10-13 18:37:00但现在用Mesh Shader的游戏还很少。
作者:
friedpig (烤焦棉花糖)
2022-10-13 18:59:00看下一代状况吧 下一代还有MCM 整体应该会改更大不过这代用GG已经不错了 可以战蛮久又不热
作者:
friedpig (烤焦棉花糖)
2022-10-13 18:59:00看下一代状况吧 下一代还有MCM 整体应该会改更大不过这代用GG已经不错了 可以战蛮久又不热
作者: hong414 (allen0983) 2022-10-13 19:02:00
游戏厂的问题 不关我们老黄的事 配合nv是他们的责任
作者: hong414 (allen0983) 2022-10-13 19:02:00
游戏厂的问题 不关我们老黄的事 配合nv是他们的责任
作者: nmkl (超级地球) 2022-10-13 19:04:00
看来等苏妈的了
作者: nmkl (超级地球) 2022-10-13 19:04:00
看来等苏妈的了
作者:
as6633208 (okokokiknow)
2022-10-13 19:12:00没逻辑,各大测试结果很明显就是cpu瓶颈的特征。按你说数据会“塞”在gpu前端,不就代表gpu根本还没完成图像运算就请求下一个运算数据?这样的话是不是只要跑个一两小时,前端就会卡一卡车的数据,然后就开始变慢了?你确定?前端问题应该是gpu瓶颈吧?你当那些测试的连gpu瓶颈跟cpu瓶颈都分不出来吗?找个中国论坛不知到什么咖的乡民的废文,就想推翻cpu瓶颈测试结果,我也是笑,资料严谨度比维基百科还废
作者:
as6633208 (okokokiknow)
2022-10-13 19:12:00没逻辑,各大测试结果很明显就是cpu瓶颈的特征。按你说数据会“塞”在gpu前端,不就代表gpu根本还没完成图像运算就请求下一个运算数据?这样的话是不是只要跑个一两小时,前端就会卡一卡车的数据,然后就开始变慢了?你确定?前端问题应该是gpu瓶颈吧?你当那些测试的连gpu瓶颈跟cpu瓶颈都分不出来吗?找个中国论坛不知到什么咖的乡民的废文,就想推翻cpu瓶颈测试结果,我也是笑,资料严谨度比维基百科还废
楼主:
oopFoo (3d)
2022-10-13 19:42:00我开始写3d程式是比老黄的tnt还早。从triangle setup开始T&L,geometry/hull stages,compute, mesh shader,几乎通通都经历过。从cpu做culling,变成coarse culling,现在再变成mesh shader来culling。Mesh Shader 其实跟ps2的vpu与ps3的spu很像。硬件,软件的变化,算是都跟上了。你要说我比那些只会测试的人不懂?
楼主:
oopFoo (3d)
2022-10-13 19:42:00我开始写3d程式是比老黄的tnt还早。从triangle setup开始T&L,geometry/hull stages,compute, mesh shader,几乎通通都经历过。从cpu做culling,变成coarse culling,现在再变成mesh shader来culling。Mesh Shader 其实跟ps2的vpu与ps3的spu很像。硬件,软件的变化,算是都跟上了。你要说我比那些只会测试的人不懂?
作者:
keyman2 (edge)
2022-10-13 19:47:00看不懂但是好厉害的样子
作者:
keyman2 (edge)
2022-10-13 19:47:00看不懂但是好厉害的样子
楼主:
oopFoo (3d)
2022-10-13 19:50:00ada的triangles/s的rate都出来了,瓶颈在那已经很清楚了
楼主:
oopFoo (3d)
2022-10-13 19:50:00ada的triangles/s的rate都出来了,瓶颈在那已经很清楚了
那懂哥可以帮我们科普一下为何有些测试看起来跟CPU的性能有直接关系呢?感恩
那懂哥可以帮我们科普一下为何有些测试看起来跟CPU的性能有直接关系呢?感恩
作者:
ddrbox (练网球)
2022-10-13 19:53:00若是DL/ML用途,是不是FE的压力就没这么大?
作者:
ddrbox (练网球)
2022-10-13 19:53:00若是DL/ML用途,是不是FE的压力就没这么大?
作者:
boren (boren)
2022-10-13 19:56:00我也不明白,所以是只要画面的三角形太多GPU就跑不满?
作者:
boren (boren)
2022-10-13 19:56:00我也不明白,所以是只要画面的三角形太多GPU就跑不满?
原来有行家啊也想请教一下前端的triangles/s造成的瓶颈,CPU是怎么cover的
原来有行家啊也想请教一下前端的triangles/s造成的瓶颈,CPU是怎么cover的
作者:
a45351 (小便)
2022-10-13 20:05:00所以是cpu在强也没用吗
作者:
a45351 (小便)
2022-10-13 20:05:00所以是cpu在强也没用吗
楼主:
oopFoo (3d)
2022-10-13 20:06:00dl/ml用不到这个fe。对,太多三角形就shaders在等。现在的triangles很多都是gpu自己在产生的,cpu只是下指令
楼主:
oopFoo (3d)
2022-10-13 20:06:00dl/ml用不到这个fe。对,太多三角形就shaders在等。现在的triangles很多都是gpu自己在产生的,cpu只是下指令
作者:
aimlin ( )
2022-10-13 20:08:00硬件不是nv的问题 是消费者的问题
作者:
aimlin ( )
2022-10-13 20:08:00硬件不是nv的问题 是消费者的问题
楼主:
oopFoo (3d)
2022-10-13 20:08:00而已,很多传统cpu在处理,能转到gpu处理的都转过去。cpu在这能帮助的很有限,基本上现在3d绘图程式的优化都是如何让gpu能全速前进,cpu尽量不要去打扰。
作者:
Nonegrame (程式写得好,好人做到老)
2022-10-13 20:10:00可以开始等5090了
作者:
Nonegrame (程式写得好,好人做到老)
2022-10-13 20:10:00可以开始等5090了
作者: twinkleAshed (香草奶昔先生) 2022-10-13 20:13:00
Ada是不是架构没有跟上整个硬件规模才会卡住?如果简而言之的话?
作者: ileva3324 (yutuop) 2022-10-13 20:14:00
等50+1
作者: twinkleAshed (香草奶昔先生) 2022-10-13 20:13:00
Ada是不是架构没有跟上整个硬件规模才会卡住?如果简而言之的话?
作者: ileva3324 (yutuop) 2022-10-13 20:14:00
等50+1
作者:
LiNcUtT (典)
2022-10-13 20:19:00故意留一手啦,不然50系要出啥XD反正牛肉端一半就打死竞品了,没必要一次全上完吧
作者:
LiNcUtT (典)
2022-10-13 20:19:00故意留一手啦,不然50系要出啥XD反正牛肉端一半就打死竞品了,没必要一次全上完吧
作者:
ddrbox (练网球)
2022-10-13 20:23:00了解,换言之,4090的目标客群是专业市场,游戏只是附加的
作者:
ddrbox (练网球)
2022-10-13 20:23:00了解,换言之,4090的目标客群是专业市场,游戏只是附加的
作者: BraviaX95j (米其林) 2022-10-13 20:28:00
我就问front End是什么?
作者: BraviaX95j (米其林) 2022-10-13 20:28:00
我就问front End是什么?
既然你懂这么多干嘛要贴对岸文 写一篇提升一下板上水准呀
既然你懂这么多干嘛要贴对岸文 写一篇提升一下板上水准呀
作者: vig077 2022-10-13 20:38:00
昨天还在吹==
作者: vig077 2022-10-13 20:38:00
昨天还在吹==
或许也可以说是4090的目标已经不是fhd这些分辨率不是吗?
或许也可以说是4090的目标已经不是fhd这些分辨率不是吗?
大概就是要你积极启用dlss那些东西吧3080ti dlss开起来也不太容易感觉出画质减损了2077不开dlss真的很难冲高帧数
大概就是要你积极启用dlss那些东西吧3080ti dlss开起来也不太容易感觉出画质减损了2077不开dlss真的很难冲高帧数
作者:
poi96300 (天阿poi)
2022-10-13 20:53:0013代解禁后 效能提升 GPU使用率提高时 我看你怎么解释
作者:
poi96300 (天阿poi)
2022-10-13 20:53:0013代解禁后 效能提升 GPU使用率提高时 我看你怎么解释
作者:
ronald279 (ronald279)
2022-10-13 21:02:00看不懂QQ
楼主:
oopFoo (3d)
2022-10-13 21:20:00其实就是取舍,AI/RT比较重要,Mesh/Task Shader普及后,FE的瓶颈也就解除了。某方面也是战未来。
作者:
ronald279 (ronald279)
2022-10-13 21:02:00看不懂QQ
楼主:
oopFoo (3d)
2022-10-13 21:20:00其实就是取舍,AI/RT比较重要,Mesh/Task Shader普及后,FE的瓶颈也就解除了。某方面也是战未来。
原po或许是架构上专家 但却不是商业成本的专家 讲的东西经常只看架构而忽略制造成本
原po或许是架构上专家 但却不是商业成本的专家 讲的东西经常只看架构而忽略制造成本
作者:
leviva (华丽幻影)
2022-10-13 21:31:00如果13900K / 7950X / 7800X3D 1080p / 2k 都拉不开跟3090 Ti的差距,证明cpu瓶颈完全是伪概念 ( 而且买4090的,99.99% 开4K画质,完全不受影响)
作者:
leviva (华丽幻影)
2022-10-13 21:31:00如果13900K / 7950X / 7800X3D 1080p / 2k 都拉不开跟3090 Ti的差距,证明cpu瓶颈完全是伪概念 ( 而且买4090的,99.99% 开4K画质,完全不受影响)
作者:
KoiKaze (恋风)
2022-10-13 21:56:00优文
作者:
KoiKaze (恋风)
2022-10-13 21:56:00优文
作者:
sx4152 (呵呵)
2022-10-13 21:58:00合理阿 怎么可能现在这么强的cpu会是瓶颈
作者:
sx4152 (呵呵)
2022-10-13 21:58:00合理阿 怎么可能现在这么强的cpu会是瓶颈
作者:
LiNcUtT (典)
2022-10-13 22:23:0013代解禁后就知道了,剩一个礼拜
作者:
LiNcUtT (典)
2022-10-13 22:23:0013代解禁后就知道了,剩一个礼拜
作者:
NodeWay (不由分说)
2022-10-13 22:40:00看13900k有没有提升就知道了终于等到13900+4090了
作者:
NodeWay (不由分说)
2022-10-13 22:40:00看13900k有没有提升就知道了终于等到13900+4090了
作者: rickie1141 2022-10-13 22:53:00
拔草测风向
作者: rickie1141 2022-10-13 22:53:00
拔草测风向
作者:
bbest (CFP-game theory)
2022-10-13 23:26:00levi大讲到重点,等13代解禁就知道这篇是神预测还是喇叭文了
作者:
bbest (CFP-game theory)
2022-10-13 23:26:00levi大讲到重点,等13代解禁就知道这篇是神预测还是喇叭文了
作者:
gbcg9725 (谢谢你9725)
2022-10-14 00:10:00等等党又可以等50了
作者:
gbcg9725 (谢谢你9725)
2022-10-14 00:10:00等等党又可以等50了
作者:
ddfg (douges)
2022-10-14 00:12:00因为现在cpu都在剂牙膏
作者:
ddfg (douges)
2022-10-14 00:12:00因为现在cpu都在剂牙膏
这篇的解释合理啊,FE无能让后端的shader在等
这篇的解释合理啊,FE无能让后端的shader在等
作者:
ddfg (douges)
2022-10-14 00:14:00讲得好像13代很神一样,制程没变化还不是12代再捏上去
作者:
ddfg (douges)
2022-10-14 00:14:00讲得好像13代很神一样,制程没变化还不是12代再捏上去
CPU占用才20~30%讲CPU瓶颈 不然是要做到单核10GHz吗?
CPU占用才20~30%讲CPU瓶颈 不然是要做到单核10GHz吗?
那是因为很多游戏不支援全核运作(常见的就1~4核)游戏会卡但是游戏以外的软件不卡
那是因为很多游戏不支援全核运作(常见的就1~4核)游戏会卡但是游戏以外的软件不卡
作者:
ltytw (ltytw)
2022-10-14 01:35:00不可质疑你的老黄 你NV价值不足? 难道你要买AMD?
作者:
ltytw (ltytw)
2022-10-14 01:35:00不可质疑你的老黄 你NV价值不足? 难道你要买AMD?
作者:
wantsu (wantsu)
2022-10-14 01:55:00你可以买i皇的显卡,弱到CPU绝不可能是瓶颈
作者:
wantsu (wantsu)
2022-10-14 01:55:00你可以买i皇的显卡,弱到CPU绝不可能是瓶颈
作者:
fywei (应无所住而生其心)
2022-10-14 01:56:00敢嘴老黄 你 ...
作者:
fywei (应无所住而生其心)
2022-10-14 01:56:00敢嘴老黄 你 ...
有点好奇为什么每周期的三角形处理率变低可以推到瓶颈是在前端的结论?有其他数据证明吗?
有点好奇为什么每周期的三角形处理率变低可以推到瓶颈是在前端的结论?有其他数据证明吗?
你还是没有解答为何5800X和X3D会有差距,就是因为看到这个差距加上FHD提升非常有限,我们才觉得可能跟CPU有关,如果真的是FE原因那有办法解释这个结果吗
你还是没有解答为何5800X和X3D会有差距,就是因为看到这个差距加上FHD提升非常有限,我们才觉得可能跟CPU有关,如果真的是FE原因那有办法解释这个结果吗
作者:
ipspro (U断脚修不好!)
2022-10-14 05:16:00等13900k解禁不就知道是不是瓶颈了
作者:
ipspro (U断脚修不好!)
2022-10-14 05:16:00等13900k解禁不就知道是不是瓶颈了
作者:
tint (璇月)
2022-10-14 05:37:00发表会公布的GPC结构图 就可以看出SM结构没什么改变这次ADA的结构没有大改 主要是频率拉高、加大L2、增加SM规模这篇推算出前端的效率 看起来合理 前端效率没跟上规模的增加另外 N卡对于CPU效能较依存的现象 这是从Kepler就开始的因为从Kepler架构开始 NV将Scheduling过程一部分转移给CPU来处理 所以Fermi之后的架构 NV的GPU对CPU的依赖会相对高些但NV这样做的好处是可以大幅降低CUDA执行绪上的延迟架构简化亦能进一步提升GPU的能耗比
作者:
tint (璇月)
2022-10-14 05:37:00发表会公布的GPC结构图 就可以看出SM结构没什么改变这次ADA的结构没有大改 主要是频率拉高、加大L2、增加SM规模这篇推算出前端的效率 看起来合理 前端效率没跟上规模的增加另外 N卡对于CPU效能较依存的现象 这是从Kepler就开始的因为从Kepler架构开始 NV将Scheduling过程一部分转移给CPU来处理 所以Fermi之后的架构 NV的GPU对CPU的依赖会相对高些但NV这样做的好处是可以大幅降低CUDA执行绪上的延迟架构简化亦能进一步提升GPU的能耗比
作者:
savagy (天使不打烊)
2022-10-14 05:56:00终于等到t大开释,虽然还是看不懂
作者:
savagy (天使不打烊)
2022-10-14 05:56:00终于等到t大开释,虽然还是看不懂
5800x3d表现比较好是因为L3大,指令命中率更高,使GPU前端压力变小
5800x3d表现比较好是因为L3大,指令命中率更高,使GPU前端压力变小
作者:
tint (璇月)
2022-10-14 06:30:00早年3D加速芯片->硬件T&L进入GPU时期->统一着色器架构时期绘图芯片从早年狂堆多边形生成效能转为重点摆在着色器效能到现在强化单/半精度效能 强化AI效能和加入光追功能
作者:
tint (璇月)
2022-10-14 06:30:00早年3D加速芯片->硬件T&L进入GPU时期->统一着色器架构时期绘图芯片从早年狂堆多边形生成效能转为重点摆在着色器效能到现在强化单/半精度效能 强化AI效能和加入光追功能
楼主:
oopFoo (3d)
2022-10-14 06:46:00那个解析文章,乱扯一通,完全不懂drawcall的瓶颈是什么。vulkan/dx12很复杂,效能没有提升很多,因为每个游戏都需要一堆PSO(Pipeline State Object)。每个pso都需要编译,编译没办法即时,micro stuttering比以前更厉害,Steam为了解决这个问题,cache pso起来,所以steam cache吃一堆。
楼主:
oopFoo (3d)
2022-10-14 06:46:00那个解析文章,乱扯一通,完全不懂drawcall的瓶颈是什么。vulkan/dx12很复杂,效能没有提升很多,因为每个游戏都需要一堆PSO(Pipeline State Object)。每个pso都需要编译,编译没办法即时,micro stuttering比以前更厉害,Steam为了解决这个问题,cache pso起来,所以steam cache吃一堆。
楼主:
oopFoo (3d)
2022-10-14 06:55:00硬件厂商故意混淆,也是造成大家误解的一大原因。
楼主:
oopFoo (3d)
2022-10-14 06:55:00硬件厂商故意混淆,也是造成大家误解的一大原因。
低分辨率4090跟3090差不多啊就卡在前面,后面爆干强也没用高负载才有用武之地其实也是好处?低负载买这么强的卡炫富其实没必要
低分辨率4090跟3090差不多啊就卡在前面,后面爆干强也没用高负载才有用武之地其实也是好处?低负载买这么强的卡炫富其实没必要
楼主:
oopFoo (3d)
2022-10-14 14:19:00kepler只是把job board移出来而已。gpu其实很早就有cpu在里面,Nvidia早在2016年就换RISC-V,比其他人都早。但JobBoard跟Scoring这些东东本来交给主机的CPU是比较适合的。CPU管大的,gpu管sm的thread,各有适合的。但这影响的不是效率,是成本。
楼主:
oopFoo (3d)
2022-10-14 14:19:00kepler只是把job board移出来而已。gpu其实很早就有cpu在里面,Nvidia早在2016年就换RISC-V,比其他人都早。但JobBoard跟Scoring这些东东本来交给主机的CPU是比较适合的。CPU管大的,gpu管sm的thread,各有适合的。但这影响的不是效率,是成本。
作者:
kaltu (ka)
2022-10-14 15:00:00所以是GPU上内建的CPU瓶颈了,不是主板上那颗
作者:
kaltu (ka)
2022-10-14 15:00:00所以是GPU上内建的CPU瓶颈了,不是主板上那颗
楼主:
oopFoo (3d)
2022-10-14 15:13:00瓶颈的是geometry engine,也不是内建的cpu。那个就是专门处理三角形该怎么对应到frame buffer上。以前是归类于前端(FE),但现在中段也会用的到。
楼主:
oopFoo (3d)
2022-10-14 15:13:00瓶颈的是geometry engine,也不是内建的cpu。那个就是专门处理三角形该怎么对应到frame buffer上。以前是归类于前端(FE),但现在中段也会用的到。
作者:
ltytw (ltytw)
2022-10-14 15:32:00推t大
作者:
ltytw (ltytw)
2022-10-14 15:32:00推t大
作者:
boren (boren)
2022-10-14 20:54:00我还好奇的是,为什么4K能比1080P使用率更高?1080P的三角型比较多?应该不是吧?
作者:
boren (boren)
2022-10-14 20:54:00我还好奇的是,为什么4K能比1080P使用率更高?1080P的三角型比较多?应该不是吧?
作者:
tint (璇月)
2022-10-14 21:50:00衡量GPU效能一项指标是填充率 一般主要会指像素和纹理填充率当分辨率愈高 GPU要渲染的像素也愈多 每秒能绘制格数就下降所以boren是指哪方面的使用率?
作者:
tint (璇月)
2022-10-14 21:50:00衡量GPU效能一项指标是填充率 一般主要会指像素和纹理填充率当分辨率愈高 GPU要渲染的像素也愈多 每秒能绘制格数就下降所以boren是指哪方面的使用率?
作者:
boren (boren)
2022-10-14 22:07:00就是工作管理员能看到的GPU使用率,但你这么一说我懂了,分辨率高的时候GPU就加重别的工作了,这时front end就不需要拼命画三角形了
作者:
boren (boren)
2022-10-14 22:07:00就是工作管理员能看到的GPU使用率,但你这么一说我懂了,分辨率高的时候GPU就加重别的工作了,这时front end就不需要拼命画三角形了
CPU瓶颈论者干嘛一直喊13900k==也就多两簇小核、时脉拉一成
CPU瓶颈论者干嘛一直喊13900k==也就多两簇小核、时脉拉一成