Re: [闲聊] 让AI判断野菇能不能吃,结果中毒

楼主: arrenwu (键盘的战鬼)   2025-11-23 10:25:23
※ 引述《Rimowa (德国品质)》之铭言:
: 我想现在AI遇到最大的问题有两个
: 一个是很多人提的 AI讲错也不用扛责 所以讲错也不会怎样
: 另一个是因为AI怎么样都会掰出一套说法给你
: 如果相信了就可能有这次的吃毒菇案件
: 但如果还是怀疑坚持不信要自己求证 那又何必问AI?
: 可是很多场景 是没有专业人士的 或是说 若有专业人士 又何必问AI?
这中间有个盲点就是:人并不是只有 专业人士 或 超级外行
还有一种是 入门水平 或 中间偏低
比如我们来看一个 2024 指定科目考试数学甲的问题:
一游戏厂商将举办抽奖活动,
厂商公告每次抽奖需使用掉一个代币,
且每次抽奖的中奖机率皆为0.1。

某甲决定先存若干个代币,
并在活动开始后进行抽奖,
直到用完所有代币才停止。

下列五个选项:

(1) 某甲中奖一次所需要抽奖次数的期望值为10

(2) 某甲抽奖两次就中奖一次以上的机率为0.2

(3) 某甲抽奖10次都没中奖的机率小于抽奖1次就中奖的机率

(4) 某甲至少要存22个代币,才能保证中奖的机率大于0.9

(5) 某甲只要存足够多的代币,就可以保证中奖的机率为1

请问哪几个选项是正确的?
这问题称不上很难,但是要具备一定程度训练和熟练度的人,
才能解这问题。
但如果你用 Gemini 3 Pro去问这问题,
可以得到下面的结果:
============== Gemini 开始 ================
这是一个经典的机率与期望值问题。
我们逐一分析这五个选项,找出正确的答案。
基本设定
单次中奖机率:p = 0.1
单次没中奖机率:1 - p = 0.9
抽奖次数(代币数):n
选项分析
(1) 某甲中奖一次所需要抽奖次数的期望值为 10
判定:正确
分析:这是“几何分布”(Geometric Distribution)的概念,即计算直到第一次成功所需的试验次数。
计算:期望值 E = 1/p
代入 p=0.1,则 E = 1/0.1 = 10
这意味着平均来说,确实需要抽 10 次才会中奖一次。
(2) 某甲抽奖两次就中奖一次以上的机率为 0.2
判定:错误
分析:“中奖一次以上”的机率 = 1 - “两次都没中”。
计算:
两次都没中的机率:0.9 * 0.9 = 0.81
至少中一次的机率:1 - 0.81 = 0.19
注:此选项的陷阱在于直接将两次机率相加 ($0.1 + 0.1$),这是错误的算法。
(3) 某甲抽奖 10 次都没中奖的机率小于抽奖 1 次就中奖的机率
判定:错误
分析:我们需要比较 10次全杠龟 与 1次就中 的机率
计算:
抽 10 次都没中的机率:0.9^10 ~= 0.3487
抽 1 次就中奖的机率:0.1
显然 0.3487 > 0.1
(4) 某甲至少要存 22 个代币,才能保证中奖的机率大于 0.9
判定:正确
分析:我们要找出最小的整数 n,使得“至少中一次”的机率 > 0.9。
1 - (0.9)^n > 0.9
计算:
(0.9)^n < 0.1
两边取对数(log):
n > (-1)/(-0.04576) ~= 21.85
因为 n 必须是整数,故 n 至少要为 22。
(5) 某甲只要存足够多的代币,就可以保证中奖的机率为 1
判定:错误
分析:虽然随着次数增加,中奖机率会无限趋近于 1,但在有限的次数内,它永远不会“等于”1。
数学上,1 - (0.9)^n 永远小于 1,只要 n 是有限数值,就存在“全部没中”的微小可能性。
正确的选项是
(1) 某甲中奖一次所需要抽奖次数的期望值为10
(4) 某甲至少要存22个代币,才能保证中奖的机率大于0.9
============== Gemini 结束 ================
我帮大家确认过了,这结果没问题。
显然,有了Gemini提供的过程后,即便是程度较差的人,
也可以解决这个问题。
因为现在只要能看得懂过程即可。
但这并不表示Gemini说正确的选项是(1),(4),使用者就直接买单,
因为Gemini也可能是错的。
所以这结果,对数学麻瓜是没用的。
我本人对于“有了Copilot后不用学程式”或
“AI解题力达到奥数金牌,以后不用学数学”
是相当不以为然的。
反而是有了这些工具之后,人类比起从前更应该学这些东西。
只要学一点点,就可以获得巨大成果,何乐而不为呢 :D
@tree_isu
https://x.com/tree_isu/status/1990543628004176001/photo/1
https://pbs.twimg.com/media/G5_U4RNacAARxLG.jpg
作者: ssarc (ftb)   2025-11-23 10:28:00
我都拿AI翻译小说,至少他比机翻可靠,我也不担心他出错
作者: gox1117 (月影秋枫)   2025-11-23 10:33:00
AI翻译就不是机翻一样==
作者: Cishang (辞..)   2025-11-23 10:34:00
问题不就是现在这种行为都是素人在用,甚至用AI去回答别人自己根本就不知道然后说AI讲的
作者: spfy (spfy)   2025-11-23 10:35:00
不要激动 现在讨论的情况 软件工程师都先帮大家走过一次了但软件工程方便的是ai正不正确马上能验证...部分啦
作者: tony15899 (急速せんこ~)   2025-11-23 10:43:00
整理给定有限范围资料还可以 直接让AI找...出来的结果直接用后果自负
作者: judge54532 (阿诚)   2025-11-23 10:46:00
是的,这才是现在这版本AI的正确使用方式
作者: shadowblade (影刃)   2025-11-23 11:06:00
讲到底还是"你必须要具备能判定AI资料正确性的知识"
作者: mouscat (Das ist ein buch)   2025-11-23 11:25:00
我觉得问题不是这个 我相信对AI有基本认知的都知道他的限制跟正确使用方式 但目前潜在的社会现象是 人手都有智慧型手机 就能用AI 普及的速度远超过被正确认知的速度变成一堆人拿着自己根本不懂的工具乱用这种模式更想之前内容农场跟至今仍猖獗的诈骗讯息
作者: tony15899 (急速せんこ~)   2025-11-23 11:26:00
有"专业知识"的人乱用的案例都有了美国律师用AI写法律文件被法官抓包好几次
作者: mouscat (Das ist ein buch)   2025-11-23 11:28:00
我觉得单纯的无知跟盲信还是不太一样
作者: ssarc (ftb)   2025-11-23 11:29:00
方便,方便治百病,你把AI换成专家和名嘴也是一样
作者: mouscat (Das ist ein buch)   2025-11-23 11:29:00
无知是睡着了 盲信是装睡
作者: shadowblade (影刃)   2025-11-23 11:30:00
那个现象我觉得很贴切的形容是 让猴子都有枪现在恶意资讯跟垃圾资讯的散布速度有了AI完全不是一个档次
作者: mouscat (Das ist ein buch)   2025-11-23 11:31:00
没人会去看服务条款不是常识吗XD
作者: tony15899 (急速せんこ~)   2025-11-23 11:32:00
麻烦的是没人发现的话AI搞出的垃圾资讯就会被混进正常数据库里炼蛊 垃圾进垃圾出虽然在那之前网络资讯就已经是垃圾场了
作者: shadowblade (影刃)   2025-11-23 11:34:00
以前要搞出恶意资讯至少还要点门槛
作者: mouscat (Das ist ein buch)   2025-11-23 11:34:00
基本上只有对output内容下手才有用啦 警语什么的 大多数人都会轻易选择性忽略实际上就没有那么多 你把大众想得太理性了
作者: tsubasawolfy (悠久の翼)   2025-11-23 12:08:00
这代AI出来前大家都觉得可以帮助所有人进步。但事实上用个一两年后的观察心得是强者更强弱者更弱,因为工具成效还是取决使用者本身。现在这种程度AI就有这样分野了,更难想像真的AGI出来会是怎样。
作者: b2202761 (岚水滴)   2025-11-23 12:41:00
使用AI让强者更强是因为,强者有打好基础,AI只是辅助,AI用完自己本身会在检查验证修改,弱者更弱是因为本身没本事只靠者AI。
作者: takanasiyaya (cloud)   2025-11-23 13:44:00
可是,麻瓜之所有是麻瓜就是因为他是麻瓜,现阶段反而更是加强会正确用的人跟乱用的人的差距
作者: mouscat (Das ist ein buch)   2025-11-23 17:28:00
弱者至少能用AI产出点东西 这之前屁都生不出来不是

Links booklink

Contact Us: admin [ a t ] ucptt.com