楼主:
Winux (Windows X Linux)
2026-02-27 21:40:26Grok 答不出〈柏德之门 3〉问题,马斯克怒冻模型更新、抽调工程师紧急救火T
https://reurl.cc/vKyevN
伊隆‧马斯克(Elon Musk)旗下 AI 公司 xAI 去年曾因聊天机器人 Grok 无法准确回答
〈柏德之门〉(Baldur’s Gate)游戏细节问题,延迟数天推出模型更新。xAI 更紧急抽
调多名高级工程师放下手头项目,专门协助改善 Grok 游戏知识库。
工程师临时被抽调 游戏问题触发内部混乱
Business Insider 深度调查报导披露,Elon Musk 对 Grok 回答〈柏德之门 3〉(
Baldur’s Gate 3)细节问题表现强烈不满,下令延迟推出相关模型更新。他要求高级工
程师放下手头项目,转而处理游戏知识不足问题。部分前 xAI 员工形容公司工作氛围犹
如无休止消防演习 。xAI 位于帕罗奥图(Palo Alto)总部设有多个作战室,随时应对各
种紧急情况 。Elon Musk 对游戏知识执著程度不只于此。他同时要求工程师提升 Grok
在〈英雄联盟〉(League of Legends)游戏能力,目标更是达到最高挑战者(
Challenger)段位。
Larian Studios 开发〈柏德之门 3〉,以龙与地下城(Dungeons & Dragons)为背景。
游戏剧情复杂且机制丰富,广受 RPG 玩家好评。由于网络上有大量相关攻略可供参考,
业界对 Grok 当时连这款游戏细节问题也答错感到相当意外。
Grok 成绩大翻身 准确率现达 92%
事发后 Grok 于〈柏德之门 3〉相关知识表现明显改善。TechCrunch 于 2026 年 2 月报
导,Grok 现时已能准确回答〈柏德之门〉相关问题。有测试机构以 BaldurBench 为名,
向 Grok、ChatGPT、Claude 及 Gemini 各提出 5 条〈柏德之门〉相关问题进行比较。结
果显示 Grok 整体胜任,准确率据报达 92%。
四大 AI 风格各异
测试结果显示各 AI 回答游戏问题时风格截然不同。Grok 偏好以表格形式呈现资料,并
大量使用 save-scumming 及 DPS 等玩家术语,不熟悉游戏用户较难理解。ChatGPT 倾向
以重点列表简洁作答 。Gemini 着重以粗体标示关键词。Claude 则对剧透极为谨慎,建
议玩家自行探索游戏。由于各 AI 大多从相同网上攻略资源汲取知识,回答风格差异比内
容差异更为明显。
这次事件突显 xAI 内部管理混乱。这同时反映 Elon Musk 对 Grok 能力有极高要求,最
终让 Grok 游戏知识领域能力得到大幅提升。
作者:
guogu 2026-02-27 21:43:00内部管理混乱(X 上头脑门一拍想啥做啥(O回答游戏内问题很重要吗== 今天马投顾关心柏德之门明天他玩了其他游戏发现有错又要工程师改吗这就像马投顾他的推特触及率下降去电工程师一样
作者:
guogu 2026-02-27 21:46:00从那之后我的为你推荐时不时就会出现他的推文靠北我平常根本就不看英文推文! 我推特就是看图而已
作者: shigurew (shigure) 2026-02-27 21:47:00
如果他能在所有电玩知识领域大幅超越其他AI那会挺有趣的有任何电玩问题就问grok,这样也不错
作者:
XZXie (微软新注音败坏国文水平)
2026-02-27 21:48:00这么严格
作者:
kopune (ç„¡é™æœŸæ”¯æŒ i☆Ris)
2026-02-27 21:51:00希望也能加强偶像大师的正确率 别在偶大和LL和Hololive都搞混了
作者:
Amulet1 (AmuletHeart)
2026-02-27 21:51:00笑鼠
作者:
ssarc (ftb)
2026-02-27 21:53:00能不能报个明牌让我知道台股哪只成本最低又涨的最高
柏德3说实话很考验AI统整能力,设定超细一堆支线,攻略区一把抓很容易出错
作者:
GAOTT (杜鹃)
2026-02-27 21:56:00能不能先搞瑟瑟
作者:
Xration (胤盛家ノ家庭事情)
2026-02-27 21:56:00重点XAi要转军用 这点程度不能不会吧
作者:
johnny3 (キラ☆)
2026-02-27 21:57:00因为这个在网络上能找到精准答案 这都回答不好表示很烂
只要抓BG3 Wiki的资料基本上就解答了 会出错就是抓到讨论区的白痴AI
作者:
Israfil (赎罪圣音)
2026-02-27 21:59:00AI明显在有很多登场人物的作品都会搞错 他不是搞错身高几公分几岁这种细节问题 而是在大部份资料都正确的情况下冷
grok生成色图被阉割,连翻译av字幕都比gemini差,价格还比较贵,完全没订阅的理由了
作者:
Israfil (赎罪圣音)
2026-02-27 22:02:00不及防给你来一个对作品内容都不太深入的人都不会犯的错而且中文名和翻译名居然是分开的 有可能会发生原文译名正
作者:
guogu 2026-02-27 22:04:00翻译图片内容目前gemini应该是最强的
作者:
Israfil (赎罪圣音)
2026-02-27 22:04:00确但中文译名错误的情形 若非亲眼看到窝直觉也是怎么可能
作者:
guogu 2026-02-27 22:05:00在B站上不少那种假错视图测试 几乎都只有gemini能过
作者:
GAOTT (杜鹃)
2026-02-27 22:05:00能不能先搞瑟瑟
作者:
winda6627 (Fallen Wing)
2026-02-27 22:07:00至少敢承认不能回答BG3问题的AI就是垃圾。
作者:
poke001 (黑色双鱼)
2026-02-27 22:17:00笑死
作者: ruby080808 (zzz5583) 2026-02-27 22:19:00
上次我记得板上有人用ai问中国法律,也是错很大,但想不起来是那一家的ai==
作者:
a25785885 (SuperbbMan)
2026-02-27 23:46:00讨论区有些人都乱讲 版本也有差
作者:
amd7356 (哭哭喔)
2026-02-28 05:41:00这种烂AI公司还是快点倒闭好了不能色谁用你grok?
作者:
gp3lucky (gp3lucky)
2026-02-28 09:17:00ai仍然会去找错误的旧资料