[新闻] 外媒称联发科 SoC 效能分数造假,官方否

楼主: wahaha23 (请勿拍打喂食)   2020-04-11 16:00:59
外媒称联发科 SoC 效能分数造假,官方否认但反驳又来了
TechNews
https://technews.tw/2020/04/10/mobile-benchmark-cheating/
现在的手机跑分,是否真的不能信。手机厂商、芯片厂商越来越追求芯片的跑分数值,
Benchmark(基准性能测试)逐渐成为衡量装置性能的重要标准。
但在一味追求分值的同时,厂商们也逐渐深陷“分值禁锢”之中,近期的联发科,就是如
此。
联发科芯片 Benchmark 造假
事情的开始,要从 OPPO Reno3 说起。
外媒 Anandtech 发现,搭载 P95 CPU 的欧洲版 OPPO Reno3 Pro 的跑分数值比搭载性能
更强大的最新 Dimensity 1000L CPU 的国行版 Reno3 的高,这引起 Anandtech 的质疑

由此,Anandtech 分别使用匿名版(可帮助分值作弊)和常规版的 PCMark 对 MediaTek
P95 CPU 进行跑分。
https://is.gd/mkdGeX
(Source:Anandtech,下同)
结果显示,P95 CPU 的真实总分比匿名版得分低 30%;在写入负载方面,两者得分的差异
甚至达到 75%。
同时,Anandtech 指出,透过对 OPPO Reno3 Pro 进行测试,结果表明并非是 OPPO
Reno3 Pro 导致的跑分差异。也就是说,造成跑分差异的根源在于联发科芯片。
为了证明这个结论,Anandtech 对 Reno3 搭载的联发科芯片做进一步调查。结果发现,
在手机的韧体(/vendor/etc 文件夹)中,包含一个“power_whitelist_cfg.xml”文件

该文件中存在一个涵盖各种基准测试的列表,包括 GeekBench、AnTuTu、3 dbench,、
PCMark、鲁大师、AndroBench2 等。不仅如此,列表中还新增了人工智能基准测试,包括
Master Lu AIBench、ZTH AI 。
https://is.gd/lFliCZ
▲ Reno3 Pro“运动模式”基准白名单部分截图。
在这其中,Anandtech 找到了 PCMark 的 APK ID,发现 ID 中采用了一些电源管理提示
,其中一个共同的提示为“运动模式”。
该模式能够修正 SoC 芯片的一些 DVFS (动态电压频率调整)特性,比如始终以最大频
率执行内存控制器。另外,在负载跟踪方面,排程也被更改了设置,在工作负载时
CPU 核心的频率能够更快地上升,并停留更长时间。
不仅如此,其 APK ID 还包含了企业版的 GFXBench,虽然在清单中没有配置“运动模式
”提示,但在使用应用程式是会改为默认的 DVFS、热力和调度器设置。
值得注意的是,“power_whitelist_cfg.xml”文件不仅存在于 OPPO 装置上,
Anandtech 还在其他装置上(搭载联发科芯片的装置)发现了类似文件以及几乎相同的基
准清单条目。如表所示(表中缺少 AI 测试,并非完整的基准测试列表):
https://is.gd/kHvSfg
巧合的是,在 Anandtech 解压文件之后,OPPO 向手机推送了一个韧体更新,文件中原有
的基准列表消失了。Anandtech 认为该文件列表仅是被移动了位置,因为基准测试中依然
能够触发“运动模式”,从而使性能大大提升。
联发科回应
对于 Anandtech 提出的质疑,联发科方面也给出正面回应。以下为回应声明:
联发科技遵循公认的行业标准,并且对基准测试准确地代表了我们芯片组的功能充满信心。
在测试和基准测试由我们的芯片组驱动的装置时,我们与全球装置制造商紧密合作,但最终
,品牌商可以灵活地配置自己认为合适的装置。许多公司将装置设计为在进行基准测试时以
最高性能执行,以显示芯片组的全部功能。这揭示了任何给定芯片组的性能能力的最高端。
当然,在现实世界中,有许多因素决定芯片组的性能。联发科技的芯片组旨在优化功耗和性
能,以在尽可能延长电池寿命的同时提供最佳的用户体验。如果有人正在执行诸如要求苛刻
的游戏之类的计算密集型程式,则该芯片组将智慧地适应计算模式以提供持续的性能。
这意味着,随着芯片组根据出色的用户体验所需的功能和性能动态管理 CPU、GPU 和内存
资源,用户将从不同的应用程式中看到不同的性能水平。此外,某些品牌在不同地区具有不
同类型的模式,因此装置性能可能会因地区市场需求而异。
我们认为,在基准测试中展示芯片组的全部功能与其他公司的做法是一致的,并且可以为消
费者提供有关装置性能的准确资讯。
但这个回应遭到 Anandtech 的反驳。Anandtech 认为,联发科并无回应出问题的本质。
其具有欺骗性的 Benchmarks 不仅针对的是与 SoC 相关的跑分软件(例如 GeekBench、
GFXBench),而且面向了与用户体验相关的跑分软件,也就是前文提到的 PCMark。
Anandtech 解释称,PCMark 是一个系统基准测试,其分值代表了芯片的工作负载和装置
响应能力。虽然 PCMark 反映的是芯片的性能,但会受 DVFS 和调度程式等软件和机制的
影响;这也印证了前文提及“运动模式”会修正 SoC 芯片的 DVFS 特性,进而影响
Benchmarks 分值。
另外,Anandtech 指出,PCmark 分值反映的是用户使用体验,而不仅是芯片组的性能。
也就是说,Anandtech 认为联发科干涉 PCmark 分值已超出了芯片跑分的范围。
用产品说话,才掷地有声
事实上,在联发科之前,三星、华为都曾因欺骗 Benchmark 结果陷入舆论中心。
2014 年,测试人员发现三星透过添加原始码在基准测试中作弊,该原始码能够检测基准
测试应用程式是否在手机上执行,一旦发现,则以更快的速度(532MHz,正常情况下为
480MHz)执行手机。
由此,三星遭遇集体诉讼,且该诉讼长达 4 年。2019 年 9 月 30 日,三星败诉,承认
在基准测试中作弊,同意向 Galaxy S4 的购买者支付 10 美元赔偿。
同样的事情在华为身上也发生了。Anandtech 发现,华为会在新装置中配备基准检测机制
,为 SoC 提供了更高的功率限制。最终,在某些白名单应用程式中,装置的性能会更高

不过,这种做法会带来一些负面影响,包括消耗电能、降低机组效率、降低电池寿命等。
对此,华为表示,仅凭一个单一的基准数字并不能显示完整体验。但对于部分项目,进行
基准测试是整个行业中被认可的方式,每个公司都在朝着更好的客观结果而努力。同时,
华为消费者 BG 软件工程部总裁王成录表示,其他厂商都在进行同样的测试获得高分,华
为不能保持沉默。
不难看出,Benchmark 的高分值正成为芯片制造商追求的目标,也逐渐成为了行业的行销
手段。Benchmark 分值固然能反映装置的性能,但为了行销、数值攀比而进行跑分造假不
应是业界常态。
且不论“你做我也做”追求 Benchmark 高分值的盲目性,就跑分造假这个行径而言,其
分值只能在短时间内获取用户体验的好感度,但从长期视角来看,追求高分值会带来装置
性能的损耗,这并不是与用户建立良好关系的正确途径。
正如 AnandTech 在文中提及,更好地与用户体验建立联系的唯一方式,就是让每个常规
游戏在标准的功率范围内执行。也就是说,性能最具说服力的表现不是分值,而是产品本
身。
作者: KimJongUn (金正恩)   2020-04-11 16:24:00
benchmark有问题 没把发热电池寿命耗电放进考量歪掉的benchmark 就吸引人去特化作跑分
作者: brightest (fff)   2020-04-11 16:25:00
要回200了?
作者: boss0405 (boss)   2020-04-11 16:26:00
老实说很多chip vendor都这样作,侦测到在跑评测软件或是PK就进入turbo mode,你不这样搞,就是跑输别人,不过B和Q更厉害的是在他的稳定性
作者: brightest (fff)   2020-04-11 16:28:00
作弊没关系 作弊被抓到就GG 档名还直接写白名单...
作者: a000000000 (九个零喔)   2020-04-11 16:31:00
这种是早就见怪不怪惹 手机就比cpu萤幕相机
作者: momoChuChu   2020-04-11 16:31:00
用这个档名...是没藏过A片吗
作者: a000000000 (九个零喔)   2020-04-11 16:32:00
照相还一堆买榜的 跑分算还比较客观一咪咪
作者: KimJongUn (金正恩)   2020-04-11 16:32:00
"my_hentai_porn_mom_donot_open.xml"
作者: jiansu (me)   2020-04-11 16:36:00
随时开着调整状态叫做优化 因为他就反应你日常使用 如果只针对测试就作弊了 针对白名单的优化是设定强化模式都ㄦ不可能达到的针对性优化
作者: acebruce (ace)   2020-04-11 16:50:00
哈哈哈 白名单被发现惹
作者: tabrisPTT   2020-04-11 17:01:00
应该是假的,前人已经被抓包过,不敢再这样搞吧
作者: Eric0605 (我还有点饿)   2020-04-11 17:46:00
真的吧
作者: pf775 (pf775)   2020-04-11 17:52:00
韩国货不意外
作者: littlethree (祥)   2020-04-11 17:54:00
其实手机厂也都会这样 不作弊才是新闻 cemera dxo测试也是 那家厂商敢说没作弊的?
作者: boss0405 (boss)   2020-04-11 18:10:00
不要说手机啦,只要和效能有关的chip,几乎都有作弊模式
作者: xam (听说)   2020-04-11 18:39:00
这就是要看分数是要代表"硬件效能"或是"使用效能"的差别..
作者: gn01216674 (Dog)   2020-04-11 18:48:00
这不叫作弊吧,就像跑步我慢慢跑以跑得更远,测一百公尺时,我当然他妈全力冲爆啊。我平常慢跑这样冲还得了?要嘛app就限制2w内看谁算的快啊 不然你叫人全力冲又不给冲是怎样
作者: crazycy (LCY)   2020-04-11 19:26:00
是不是一堆人不看内文阿 都说是测使用者体验了只是让芯片侦测不出是在跑分 分数就掉了 这样算正常?测试内容完全相同 只有程式识别上不一样 行为就不一样了
作者: han77920   2020-04-11 20:04:00
翻译:不是我干的. 客户自己搞我也管不了
作者: leoloveivy (cried)   2020-04-11 20:11:00
等等那个s4陪十亿美金我要怎么领
作者: Eric0605 (我还有点饿)   2020-04-11 20:13:00
有啊 iphone就没有搞dx0测试啊所以iphone拍照才是最强的没有任何针对评测的调校就可以排前面
作者: SkyShih (天行者)   2020-04-11 20:23:00
以前老师说:作弊不可耻,抓到才可耻
作者: h7705060 (邪恶小猫)   2020-04-11 20:42:00
说实在 跑分软件 有给chip vendor spec 吗?不然大家各凭本事 不是吗?
作者: zhe23129 (寒)   2020-04-11 21:11:00
安兔兔
作者: KimJongUn (金正恩)   2020-04-11 21:14:00
重点还是测试有毛病 你也测温度耗电 不就行了别给几分几秒的速度评分 而是给速度/温度/稳定/耗电的一个综合评分分数 而且不列速度 就行了
作者: Meow0129 (喵0129)   2020-04-11 21:15:00
取这档名的484要PDCA一下
作者: zerobx (随意)   2020-04-11 21:24:00
就被发现了啊 下一步是M拿律师要胁提告 看那个外媒要不要拿和解金在宣告道歉 照SOP走
作者: kkmoon5566 (56小弟)   2020-04-11 22:18:00
就跟吃禁药一样啊,完全开放大家都吃,看谁有本事,吃完后仍最强
作者: kkbbs (逃离这里)   2020-04-11 22:57:00
这还好吧,进入turbo mode就不管耗电啦
作者: HardyJJ (JJHardy)   2020-04-11 23:02:00
台湾保时捷跟德国保时捷的差别...
作者: Mensholaten (REAL)   2020-04-12 00:00:00
赢了跑分能对销售多大影响
作者: Datochi (忘记带吸管)   2020-04-12 00:16:00
跑分对销售没影响;但对RD考绩有影响
作者: KennethC (Smith)   2020-04-12 02:02:00
o.o
作者: becalm (小宅工程师)   2020-04-12 08:45:00
iphone有测dxomark啊… 只是排名稍后 毕竟他的isp 镜头都比前面几家慢上来
作者: kktop1979 (123)   2020-04-12 09:42:00
小粉红快来护主
作者: sunboy183 (蓝天)   2020-04-12 11:25:00
作者: cates (键盘万事通)   2020-04-12 13:33:00
很正常啊 有什么市场就开发什么功能
作者: godhand3 (cutefive)   2020-04-12 17:39:00
限制power让大家都跑基本不就好了又要比谁快 又不让人冲 是在哈囉? 要不然就定好spec 大家都不要冲比其他的就好
作者: rootpresent (本礼)   2020-04-13 06:35:00
去克念的ati
作者: ANava (只发优文)   2020-04-13 07:30:00
别人作弊你就跟著作弊? 这什么道理
作者: boss0405 (boss)   2020-04-13 08:31:00
你不作弊被别人打趴,客户就不愿你的啊,你以为客户都能理性沟通喔,市场上量大的客户就是道理
作者: mike0327 (小麦)   2020-04-13 08:32:00
我是不信Q跟A就没作弊啦没限制功耗的跑分凭什么要求这么多
作者: JustinCy (Step by step)   2020-04-13 11:54:00
华为作弊一堆 mtk学坏?跑benchmark本来就是要冲高cpu使用难道要不用cpu去跑?
作者: crazycy (LCY)   2020-04-16 17:30:00
真的一堆人看不懂内文 你要针对负载调整效能可以只针对App名字调整 当然就算作弊人家现在就是用两个几乎一样的测试App 只差在程式名称跑分就不一样了 这样明显有问题好吗

Links booklink

Contact Us: admin [ a t ] ucptt.com