[情报] Grok答不出柏德之门3问题 马斯克怒冻结模

楼主: Winux (Windows X Linux)   2026-02-27 21:40:26
Grok 答不出〈柏德之门 3〉问题,马斯克怒冻模型更新、抽调工程师紧急救火T
https://reurl.cc/vKyevN
伊隆‧马斯克(Elon Musk)旗下 AI 公司 xAI 去年曾因聊天机器人 Grok 无法准确回答
〈柏德之门〉(Baldur’s Gate)游戏细节问题,延迟数天推出模型更新。xAI 更紧急抽
调多名高级工程师放下手头项目,专门协助改善 Grok 游戏知识库。
工程师临时被抽调 游戏问题触发内部混乱
Business Insider 深度调查报导披露,Elon Musk 对 Grok 回答〈柏德之门 3〉(
Baldur’s Gate 3)细节问题表现强烈不满,下令延迟推出相关模型更新。他要求高级工
程师放下手头项目,转而处理游戏知识不足问题。部分前 xAI 员工形容公司工作氛围犹
如无休止消防演习 。xAI 位于帕罗奥图(Palo Alto)总部设有多个作战室,随时应对各
种紧急情况 。Elon Musk 对游戏知识执著程度不只于此。他同时要求工程师提升 Grok
在〈英雄联盟〉(League of Legends)游戏能力,目标更是达到最高挑战者(
Challenger)段位。
Larian Studios 开发〈柏德之门 3〉,以龙与地下城(Dungeons & Dragons)为背景。
游戏剧情复杂且机制丰富,广受 RPG 玩家好评。由于网络上有大量相关攻略可供参考,
业界对 Grok 当时连这款游戏细节问题也答错感到相当意外。
Grok 成绩大翻身 准确率现达 92%
事发后 Grok 于〈柏德之门 3〉相关知识表现明显改善。TechCrunch 于 2026 年 2 月报
导,Grok 现时已能准确回答〈柏德之门〉相关问题。有测试机构以 BaldurBench 为名,
向 Grok、ChatGPT、Claude 及 Gemini 各提出 5 条〈柏德之门〉相关问题进行比较。结
果显示 Grok 整体胜任,准确率据报达 92%。
四大 AI 风格各异
测试结果显示各 AI 回答游戏问题时风格截然不同。Grok 偏好以表格形式呈现资料,并
大量使用 save-scumming 及 DPS 等玩家术语,不熟悉游戏用户较难理解。ChatGPT 倾向
以重点列表简洁作答 。Gemini 着重以粗体标示关键词。Claude 则对剧透极为谨慎,建
议玩家自行探索游戏。由于各 AI 大多从相同网上攻略资源汲取知识,回答风格差异比内
容差异更为明显。
这次事件突显 xAI 内部管理混乱。这同时反映 Elon Musk 对 Grok 能力有极高要求,最
终让 Grok 游戏知识领域能力得到大幅提升。
作者: error405 (流河=L)   2026-02-27 21:43:00
之后就是说要让grok去打电竞了
作者: guogu   2026-02-27 21:43:00
内部管理混乱(X 上头脑门一拍想啥做啥(O回答游戏内问题很重要吗== 今天马投顾关心柏德之门明天他玩了其他游戏发现有错又要工程师改吗这就像马投顾他的推特触及率下降去电工程师一样
作者: error405 (流河=L)   2026-02-27 21:46:00
没人用grok干正事 那专注娱乐用途也好
作者: guogu   2026-02-27 21:46:00
从那之后我的为你推荐时不时就会出现他的推文靠北我平常根本就不看英文推文! 我推特就是看图而已
作者: shigurew (shigure)   2026-02-27 21:47:00
如果他能在所有电玩知识领域大幅超越其他AI那会挺有趣的有任何电玩问题就问grok,这样也不错
作者: XZXie (微软新注音败坏国文水平)   2026-02-27 21:48:00
这么严格
作者: bladesinger   2026-02-27 21:48:00
重点是马投顾要求改善的可否一法通万法通
作者: aaronhkg (阿金)   2026-02-27 21:49:00
电玩攻略问AI要答对不难啊 抓特定网站资料就行
作者: error405 (流河=L)   2026-02-27 21:50:00
真正有用的应该是实际打电玩能力 能够练综合智商
作者: attacksoil (击壤)   2026-02-27 21:50:00
笑死 那我可以问他SB最佳兼职策略吗
作者: kopune (無限期支持 i☆Ris)   2026-02-27 21:51:00
希望也能加强偶像大师的正确率 别在偶大和LL和Hololive都搞混了
作者: Amulet1 (AmuletHeart)   2026-02-27 21:51:00
笑鼠
作者: ssarc (ftb)   2026-02-27 21:53:00
能不能报个明牌让我知道台股哪只成本最低又涨的最高
作者: e446582284 (ef225633)   2026-02-27 21:54:00
柏德3说实话很考验AI统整能力,设定超细一堆支线,攻略区一把抓很容易出错
作者: kaj1983   2026-02-27 21:56:00
被老板抓到bug了,不改不行啊XD
作者: GAOTT (杜鹃)   2026-02-27 21:56:00
能不能先搞瑟瑟
作者: Xration (胤盛家ノ家庭事情)   2026-02-27 21:56:00
重点XAi要转军用 这点程度不能不会吧
作者: johnny3 (キラ☆)   2026-02-27 21:57:00
因为这个在网络上能找到精准答案 这都回答不好表示很烂
作者: aaronhkg (阿金)   2026-02-27 21:57:00
只要抓BG3 Wiki的资料基本上就解答了 会出错就是抓到讨论区的白痴AI
作者: Israfil (赎罪圣音)   2026-02-27 21:59:00
AI明显在有很多登场人物的作品都会搞错 他不是搞错身高几公分几岁这种细节问题 而是在大部份资料都正确的情况下冷
作者: qaz630210 (皓)   2026-02-27 22:00:00
grok生成色图被阉割,连翻译av字幕都比gemini差,价格还比较贵,完全没订阅的理由了
作者: Israfil (赎罪圣音)   2026-02-27 22:02:00
不及防给你来一个对作品内容都不太深入的人都不会犯的错而且中文名和翻译名居然是分开的 有可能会发生原文译名正
作者: guogu   2026-02-27 22:04:00
翻译图片内容目前gemini应该是最强的
作者: Israfil (赎罪圣音)   2026-02-27 22:04:00
确但中文译名错误的情形 若非亲眼看到窝直觉也是怎么可能
作者: guogu   2026-02-27 22:05:00
在B站上不少那种假错视图测试 几乎都只有gemini能过
作者: GAOTT (杜鹃)   2026-02-27 22:05:00
能不能先搞瑟瑟
作者: winda6627 (Fallen Wing)   2026-02-27 22:07:00
至少敢承认不能回答BG3问题的AI就是垃圾。
作者: poke001 (黑色双鱼)   2026-02-27 22:17:00
笑死
作者: ruby080808 (zzz5583)   2026-02-27 22:19:00
上次我记得板上有人用ai问中国法律,也是错很大,但想不起来是那一家的ai==
作者: t77133562003 (我是一只山羊)   2026-02-27 22:39:00
能正确答才有问题吧... 资料去那边干来的
作者: a25785885 (SuperbbMan)   2026-02-27 23:46:00
讨论区有些人都乱讲 版本也有差
作者: amd7356 (哭哭喔)   2026-02-28 05:41:00
这种烂AI公司还是快点倒闭好了不能色谁用你grok?
作者: hololive45P (MIKO-MIKO-MI)   2026-02-28 06:12:00
让AI可以打上LOL我觉得是有点困难==
作者: gp3lucky (gp3lucky)   2026-02-28 09:17:00
ai仍然会去找错误的旧资料
作者: zerox123456 (苍流俊)   2026-02-28 09:31:00
某楼 用AI问股票很多人在用了吧

Links booklink

Contact Us: admin [ a t ] ucptt.com