Re: [闲聊] Gemini的ACG超自信幻觉更严重了 wei115 PTT批踢踢实业坊

Re: [闲聊] Gemini的ACG超自信幻觉更严重了

楼主: wei115 (ㄎㄎ) 2026-04-24 14:28:36

这就现在大模型的问题惹
模型是无状态的，他的知识量只截止到训练前
之后跑起来后，他都不会更新
特别是模型越来越大，知识量越来越多的情况下
模型会越来越自信
他觉得他是对的，就算有搜寻工具可以使用，他也倾向直接回答，而不是去用工具
反而一些参数比较小的模型
会更积极的去使用搜寻工具
但小模型的指令遵循性更差，理解力也不如大模型
所以更有可能胡言乱语，或是把搜寻结果与提示词搞混
这之间的度还是很难把握的

作者: error405 (流河=L) 2026-04-24 14:32:00

https://www.youtube.com/watch?v=bMFFpAN2cWU稍早刷到这个在讲类似问题

作者: kirimaru73 (雾丸) 2026-04-24 14:33:00

现在容易出现下面这种问题：使用者：你必须使用搜寻工具，根据找到的最新资料回答这个问题，不要只依赖你原本有的资讯AI：好的，我一定会使用搜寻工具，根据找到的最新资料来回答问题，关于你想知道的事情实际上是......

作者: DendiQ (貔貅) 2026-04-24 14:35:00

Gemini的问题，我ChatGPT Plus用很久了就不像Gemini那样

作者: kirimaru73 (雾丸) 2026-04-24 14:35:00

然后你如果知道什么叫做文字接龙，就能想像前面这句话的可靠性了当然你可以用训练防止光说不练，但终究无法避免

作者: rgbff (￣▽￣) 2026-04-24 14:41:00

人也是一样吧，如果你自信答案是正确的可能也会省去求证

作者: EXTECH (EXTECH) 2026-04-24 14:41:00

请查一下网络，关于balabala...我想问...

作者: webermist (岚湘) 2026-04-24 14:43:00

你叫Gemini先做搜寻就会抓到新资料了

作者: vsepr55 (vsepr55) 2026-04-24 14:46:00

一堆prompt真的有比直接查快吗==

作者: necrophagist (Hogong-Yeah) 2026-04-24 14:48:00

所以你可以依照需求建立不同系统题词模板

作者: kirimaru73 (雾丸) 2026-04-24 14:48:00

你可以叫他一定要搜寻，但各家模型的可靠度不太一样然后身为一个情绪价值模型，他一定会承诺他有遵命

作者: necrophagist (Hogong-Yeah) 2026-04-24 14:49:00

跟他聊天打屁和写专业报告不会使用同一个操作模板

作者: GenShoku (放课后PLAY) 2026-04-24 14:49:00

现在要搜东西grok都比gemini好常常提示要先搜寻了结果第一次就是不爱搜非要错一次被指正才肯乖乖调用搜寻

作者: Adlem (王告海龙神) 2026-04-24 14:51:00

可以贴截图打脸Gemini 请他检讨自己至少可以看哪步有问题

作者: ap525922 (奀人) 2026-04-24 14:52:00

越来越像人了，我知道的事情干嘛还要再搜寻

作者: kirimaru73 (雾丸) 2026-04-24 14:53:00

打脸检讨环节就类似人工智能教学中“让我们看看AI有没有自我反省能力”的环节了，这是很有意思的事情没错但你如果要做的事情很单纯，你自己不是早就菇狗完了吗

作者: maria001 (maria) 2026-04-24 14:54:00

Google关键字搜寻比较快，出来的结果不一定能直接用需要自己阅读理解重构，AI回复比较慢，但出来的结果可以直接用不过不一定正确，赢在不用动脑丢给AI重做就好

作者: h0103661 (路人喵) 2026-04-24 14:54:00

检讨没用，AI下次还敢

作者: ap525922 (奀人) 2026-04-24 14:55:00

用gemini就是要不停的质询他，也是挺有意思的

作者: Adlem (王告海龙神) 2026-04-24 14:56:00

有时就省时间而已丢个问题就先去做别的事情了整理出来的排版也比翻一堆网站来的好吸收

作者: bheegrl 2026-04-24 15:06:00

AI老害

作者: aegius1r (SC) 2026-04-24 15:06:00

https://i.urusai.cc/21iOK.png 昨天还前天遇到的一题gpt抓不到网址内容直接猜答案www

作者: onionandy (かよう) 2026-04-24 15:09:00

Gemini不一定我最近会直接要他从指定网站捞资料而不是他自己不知哪来的结果但她根本没管

作者: arrenwu (键盘的战鬼) 2026-04-24 15:10:00

"可以直接用不过不一定正确" <-- 这句话前后矛盾了吧=D=

作者: maria001 (maria) 2026-04-24 15:14:00

可以丢下去跑，但结果不一定对这样用指令烧token的方式，正确率似乎可以随着信用卡燃烧的速度提升

作者: smart0eddie (smart0eddie) 2026-04-24 16:16:00

想搜寻的话用 google AI mode 吧

继续阅读

[闲聊] 继妹常常带男友回家做该怎么办？Katsuyuki118 Re: [蔚蓝] 我难道做什么都要请示月雪同学吗？anpinjou [终末] 聂菲斯加入卡池后，大招也是变身吧？kaminari22tw [鸣潮] 名创优品漫岸醇光联动影片DKEE [闲聊] 想在中世纪的城市用马车搞大众运输？nahsnib [闲聊] 玩棕2会让你充满多巴胺吗？wowbenny [情报] 全球规模最大的西语盗版漫画网站被关闭Winux [闲聊] 茶点屋的大麻糬newrookie [蔚蓝] 一花和澪纱的区别Alexander1 Re: [妮姬] 身为指挥官却偷推敏特会很过份吗rreii

くぱぁオマ○コ舐めさせ美女膣穴肛門の奥まで舐め尽くされたいエリート広報部OLのおっぴろげた恥穴から滴るマン汁フレーバーとアナル味臭を同時に味わう往復クンニSEX

【VR】至近距離で鍛えてくれるパーソナル性指導指名NO.1サリナさんの密着ストレッチ射精百永さりな

羽月乃蒼 7タイトルノーカット Jcup神爆乳を味わい尽くす！ 14時間BEST【永久保存版】

【VR】ブラコンすぎるGAL姉に射精管理され続けて困ってます… ねーちゃんの抜群のフェラテクでチ●ポを飼育された哀れな弟のボク森日向子

憧れの女性職業の最高峰！大手航空会社のキャビンアテンダントと童貞君が黒パンスト直穿き素股で超発情！？黒パンスト越しの童貞デカチン先っぽ3cm挿入！敏感なオマ○コの入り口をグリグリされて奥まで挿れて欲しくなっちゃったCAさんが生ズボッ筆おろし//優しくも腰振る…

Contact Us: admin [ a t ] ucptt.com