[心得] GN 13、14代问题影片重点整理

楼主: mrme945   2024-07-21 14:20:52
https://youtu.be/gTeubeCIwRw
在此之前Intel 13、14代CPU问题总结:
-Raptor Lake家族CPU故障灾情目前持续传出,时间至少从
六个月前开始,最早在2023年3月就出现可能属于此问题的
案例
-这些故障的CPU会产生各式不同的错误,其中几个已辨识出
来的问题包含但不限于:程式/游戏错误使用过多的VRAM造
成崩溃、CPU的错误造成AntiCheat误ban、系统重复BSOD、
解压缩错误,过多不同的问题造成难以debug找出问题根源
-这次的故障不代表CPU完全死去、无法开机,而是代表着这
些CPU无法再运行时达到规格上的表现或是运行时会产生各
种错误
-根据Level 1 Techs的Wendell,他接触的服务器厂商,约
有50%的CPU会产生不稳定,但他认为其中的一半是有机会
恢复的,所以推估故障率约为25%
-目前Intel的作为只有推出微码(Microcode)更新,但根据
Hardware Unboxed的测试,此更新会造成10%~25%的效能
损失,并且也并非根绝问题的办法
本次影片的新资讯:
-现阶段GN不推荐Intel所有CPU,除非Intel作为第一方把整
件事情解释清楚并且承诺后续处理事宜,或是第三方辨识
出问题,并且清楚界定受影响的范围
-如果你拥有13、14代CPU,无论是否有出问题,请协助GN调
查,问卷需填入CPU上的编号,以帮助GN锁定是否有特定范
围内的CPU受影响,Google问卷网址:
https://geni.us/INTELFAIL
https://iili.io/dnOkwtn.png
-GN得到内线消息(此内线为Intel前几大的客户,应为OEM厂
商),光他们的企业中就有超过800万颗CPU可能受到此次事
件影响,其中有超过610万颗*CPU的型号集中于
i5-13600K、13600KF
i7-13700、13700T、13700K、13700KF
i9-13900、13900F、13900T、13900K、13900KF
此企业当中不同团体的故障率估计为10%~25%,没有给出实
际故障的数量,但简单计算后数字应落在60万到200万之间
*我前篇推文是错的,我写成600万颗故障,但这个数字只是
此企业认为可能受影响的范围,实际数字应为60万~200万
以下为Intel内部流出的资讯:
-目前对于问题根源最有力的推测**,是抗氧化涂层在生产过
程(fabrication)中出错了,造成CPU当中不同层之间的连结
(via)氧化
-Intel目前正持续更新微码,此微码会进一步降低CPU频率,
应能缓解问题发生,但仍无法根绝问题
-有一个Intel的大客户目前发现将CPU降低到5.3GHz以下,能
够缓解问题
-目前有复数的大客户正在因为此事件清理库存,并从他们的
企业客户回收CPU
-Intel可能会把官方支援内存频率1DPC最高从DDR5-5600降
到DDR5-4800(非XMP)
-此次事件影响到的大客户包含许多Intel的资金来源及投资团
体,而这些团体是能够显著地对Intel施加财务上的压力,其
中一个团体为Citadel
**注意,这目前只是推论,实际如何要等到GN送专业实验室做
检验(Failure Analysis)的结果出来之后才知道可能的原因
以下为前述大客户内线流出关于此故障事件的叙述:
-这次事件的根源,是作为抗氧化的隔离涂层氮化钽(TaN)在原
子层沉积(Atomic Layer Deposition, ALD)的过程中出错了,
造成CPU当中via里的纯铜氧化,使得电阻提升,并造成后续故
障***
-之前PL限制的事件并非造成此次问题的原因,这是芯片生产的
问题,因为PL问题能够透过微码解决,目前还不确定Meteor
Lake是否受到影响
-在CPU腐蚀/污染太严重之前,关掉Turbo Boost能够让CPU保持
暂时的稳定
***这点结合了GN联系的实验室对此事件推测的解释,碍于我不
是专业,详细解释请看影片
关于故障率:
-Intel告知客户的故障率约为0.035%
-GN联系的OEM厂商估计约为10%~25%
-Wendell联系的服务器商推估故障率约为25%
-GN联系的系统整合商在进货时统计约有12%的CPU无法通过QA
(并且这已经是降低标准后的结果)
最后GN给出的提醒:
-目前还不知道真正造成故障的原因
-目前还不确定是否有多重因素造成此次事件
-目前流传的解决办法,或许可以解决部分问题,但都无法解决
所有问题
-GN目前还没证实关于生产瑕疵的推论
-调整Boosting可以短暂解决问题(或至少让CPU活得更久)
-Intel可能会更改官方规格表上CPU的最高频率,但或许不会像
OEM或SI厂商那么激进(降到5.3GHz~5.5GHz)
-Wendell:1.目前有数据显示约有50%的13900KS确认不受影响。
2.受影响的CPU平均寿命约为16个月。

Links booklink

Contact Us: admin [ a t ] ucptt.com