Re: [闲聊] Gemini的ACG超自信幻觉更严重了

楼主: wei115 (ㄎㄎ)   2026-04-24 14:28:36
这就现在大模型的问题惹
模型是无状态的,他的知识量只截止到训练前
之后跑起来后,他都不会更新
特别是模型越来越大,知识量越来越多的情况下
模型会越来越自信
他觉得他是对的,就算有搜寻工具可以使用,他也倾向直接回答,而不是去用工具
反而一些参数比较小的模型
会更积极的去使用搜寻工具
但小模型的指令遵循性更差,理解力也不如大模型
所以更有可能胡言乱语,或是把搜寻结果与提示词搞混
这之间的度还是很难把握的
作者: error405 (流河=L)   2026-04-24 14:32:00
https://www.youtube.com/watch?v=bMFFpAN2cWU稍早刷到这个在讲类似问题
作者: kirimaru73 (雾丸)   2026-04-24 14:33:00
现在容易出现下面这种问题:使用者:你必须使用搜寻工具,根据找到的最新资料回答这个问题,不要只依赖你原本有的资讯AI:好的,我一定会使用搜寻工具,根据找到的最新资料来回答问题,关于你想知道的事情实际上是......
作者: DendiQ (貔貅)   2026-04-24 14:35:00
Gemini的问题,我ChatGPT Plus用很久了就不像Gemini那样
作者: kirimaru73 (雾丸)   2026-04-24 14:35:00
然后你如果知道什么叫做文字接龙,就能想像前面这句话的可靠性了当然你可以用训练防止光说不练,但终究无法避免
作者: rgbff ( ̄▽ ̄)   2026-04-24 14:41:00
人也是一样吧,如果你自信答案是正确的可能也会省去求证
作者: EXTECH (EXTECH)   2026-04-24 14:41:00
请查一下网络,关于balabala...我想问...
作者: webermist (岚湘)   2026-04-24 14:43:00
你叫Gemini先做搜寻 就会抓到新资料了
作者: vsepr55 (vsepr55)   2026-04-24 14:46:00
一堆prompt真的有比直接查快吗==
作者: necrophagist (Hogong-Yeah)   2026-04-24 14:48:00
所以你可以依照需求建立不同系统题词模板
作者: kirimaru73 (雾丸)   2026-04-24 14:48:00
你可以叫他一定要搜寻,但各家模型的可靠度不太一样然后身为一个情绪价值模型,他一定会承诺他有遵命
作者: necrophagist (Hogong-Yeah)   2026-04-24 14:49:00
跟他聊天打屁 和 写专业报告 不会使用同一个操作模板
作者: GenShoku (放课后PLAY)   2026-04-24 14:49:00
现在要搜东西grok都比gemini好 常常提示要先搜寻了 结果第一次就是不爱搜 非要错一次被指正才肯乖乖调用搜寻
作者: Adlem (王告海龙神)   2026-04-24 14:51:00
可以贴截图打脸Gemini 请他检讨自己 至少可以看哪步有问题
作者: ap525922 (奀人)   2026-04-24 14:52:00
越来越像人了,我知道的事情干嘛还要再搜寻
作者: kirimaru73 (雾丸)   2026-04-24 14:53:00
打脸检讨环节就类似人工智能教学中“让我们看看AI有没有自我反省能力”的环节了,这是很有意思的事情没错但你如果要做的事情很单纯,你自己不是早就菇狗完了吗
作者: maria001 (maria)   2026-04-24 14:54:00
Google关键字搜寻比较快,出来的结果不一定能直接用需要自己阅读理解重构,AI回复比较慢,但出来的结果可以直接用不过不一定正确,赢在不用动脑丢给AI重做就好
作者: h0103661 (路人喵)   2026-04-24 14:54:00
检讨没用,AI下次还敢
作者: ap525922 (奀人)   2026-04-24 14:55:00
用gemini就是要不停的质询他,也是挺有意思的
作者: Adlem (王告海龙神)   2026-04-24 14:56:00
有时就省时间而已 丢个问题就先去做别的事情了整理出来的排版也比翻一堆网站来的好吸收
作者: bheegrl   2026-04-24 15:06:00
AI老害
作者: aegius1r (SC)   2026-04-24 15:06:00
https://i.urusai.cc/21iOK.png 昨天还前天遇到的一题gpt抓不到网址内容 直接猜答案www
作者: onionandy (かよう)   2026-04-24 15:09:00
Gemini不一定 我最近会直接要他从指定网站捞资料而不是他自己不知哪来的结果 但她根本没管
作者: arrenwu (键盘的战鬼)   2026-04-24 15:10:00
"可以直接用不过不一定正确" <-- 这句话前后矛盾了吧=D=
作者: maria001 (maria)   2026-04-24 15:14:00
可以丢下去跑,但结果不一定对这样用指令烧token的方式,正确率似乎可以随着信用卡燃烧的速度提升
作者: smart0eddie (smart0eddie)   2026-04-24 16:16:00
想搜寻的话用 google AI mode 吧

Links booklink

Contact Us: admin [ a t ] ucptt.com