Re: [闲聊] 让AI判断野菇能不能吃，结果中毒 arrenwu PTT批踢踢实业坊

Re: [闲聊] 让AI判断野菇能不能吃，结果中毒

楼主: arrenwu (键盘的战鬼) 2025-11-23 10:25:23

※ 引述《Rimowa (德国品质)》之铭言：
: 我想现在AI遇到最大的问题有两个
: 一个是很多人提的 AI讲错也不用扛责所以讲错也不会怎样
: 另一个是因为AI怎么样都会掰出一套说法给你
: 如果相信了就可能有这次的吃毒菇案件
: 但如果还是怀疑坚持不信要自己求证那又何必问AI?
: 可是很多场景是没有专业人士的或是说若有专业人士又何必问AI?
这中间有个盲点就是：人并不是只有专业人士或超级外行
还有一种是入门水平或中间偏低
比如我们来看一个 2024 指定科目考试数学甲的问题：
一游戏厂商将举办抽奖活动，
厂商公告每次抽奖需使用掉一个代币，
且每次抽奖的中奖机率皆为0.1。

某甲决定先存若干个代币，
并在活动开始后进行抽奖，
直到用完所有代币才停止。

下列五个选项：

(1) 某甲中奖一次所需要抽奖次数的期望值为10

(2) 某甲抽奖两次就中奖一次以上的机率为0.2

(3) 某甲抽奖10次都没中奖的机率小于抽奖1次就中奖的机率

(4) 某甲至少要存22个代币，才能保证中奖的机率大于0.9

(5) 某甲只要存足够多的代币，就可以保证中奖的机率为1

请问哪几个选项是正确的？
这问题称不上很难，但是要具备一定程度训练和熟练度的人，
才能解这问题。
但如果你用 Gemini 3 Pro去问这问题，
可以得到下面的结果：
============== Gemini 开始 ================
这是一个经典的机率与期望值问题。
我们逐一分析这五个选项，找出正确的答案。
基本设定
单次中奖机率：p = 0.1
单次没中奖机率：1 - p = 0.9
抽奖次数（代币数）：n
选项分析
(1) 某甲中奖一次所需要抽奖次数的期望值为 10
判定：正确
分析：这是“几何分布”（Geometric Distribution）的概念，即计算直到第一次成功所需的试验次数。
计算：期望值 E = 1/p
代入 p=0.1，则 E = 1/0.1 = 10
这意味着平均来说，确实需要抽 10 次才会中奖一次。
(2) 某甲抽奖两次就中奖一次以上的机率为 0.2
判定：错误
分析：“中奖一次以上”的机率 = 1 - “两次都没中”。
计算：
两次都没中的机率：0.9 * 0.9 = 0.81
至少中一次的机率：1 - 0.81 = 0.19
注：此选项的陷阱在于直接将两次机率相加 ($0.1 + 0.1$)，这是错误的算法。
(3) 某甲抽奖 10 次都没中奖的机率小于抽奖 1 次就中奖的机率
判定：错误
分析：我们需要比较 10次全杠龟与 1次就中的机率
计算：
抽 10 次都没中的机率：0.9^10 ~= 0.3487
抽 1 次就中奖的机率：0.1
显然 0.3487 > 0.1
(4) 某甲至少要存 22 个代币，才能保证中奖的机率大于 0.9
判定：正确
分析：我们要找出最小的整数 n，使得“至少中一次”的机率 > 0.9。
1 - (0.9)^n > 0.9
计算：
(0.9)^n < 0.1
两边取对数（log）：
n > (-1)/(-0.04576) ~= 21.85
因为 n 必须是整数，故 n 至少要为 22。
(5) 某甲只要存足够多的代币，就可以保证中奖的机率为 1
判定：错误
分析：虽然随着次数增加，中奖机率会无限趋近于 1，但在有限的次数内，它永远不会“等于”1。
数学上，1 - (0.9)^n 永远小于 1，只要 n 是有限数值，就存在“全部没中”的微小可能性。
正确的选项是
(1) 某甲中奖一次所需要抽奖次数的期望值为10
(4) 某甲至少要存22个代币，才能保证中奖的机率大于0.9
============== Gemini 结束 ================
我帮大家确认过了，这结果没问题。
显然，有了Gemini提供的过程后，即便是程度较差的人，
也可以解决这个问题。
因为现在只要能看得懂过程即可。
但这并不表示Gemini说正确的选项是(1),(4)，使用者就直接买单，
因为Gemini也可能是错的。
所以这结果，对数学麻瓜是没用的。
我本人对于“有了Copilot后不用学程式”或
“AI解题力达到奥数金牌，以后不用学数学”
是相当不以为然的。
反而是有了这些工具之后，人类比起从前更应该学这些东西。
只要学一点点，就可以获得巨大成果，何乐而不为呢 :D
@tree_isu
https://x.com/tree_isu/status/1990543628004176001/photo/1
https://pbs.twimg.com/media/G5_U4RNacAARxLG.jpg

作者: ssarc (ftb) 2025-11-23 10:28:00

我都拿AI翻译小说，至少他比机翻可靠，我也不担心他出错

作者: gox1117 (月影秋枫) 2025-11-23 10:33:00

AI翻译就不是机翻一样==

作者: Cishang (辞..) 2025-11-23 10:34:00

问题不就是现在这种行为都是素人在用,甚至用AI去回答别人自己根本就不知道然后说AI讲的

作者: spfy (spfy) 2025-11-23 10:35:00

不要激动现在讨论的情况软件工程师都先帮大家走过一次了但软件工程方便的是ai正不正确马上能验证...部分啦

作者: tony15899 (急速せんこ~) 2025-11-23 10:43:00

整理给定有限范围资料还可以直接让AI找...出来的结果直接用后果自负

作者: judge54532 (阿诚) 2025-11-23 10:46:00

是的，这才是现在这版本AI的正确使用方式