Re: [讨论] 大家会担心 ai 写 code 让工程师饭碗不 AmosYang PTT批踢踢实业坊

Re: [讨论] 大家会担心 ai 写 code 让工程师饭碗不

楼主: AmosYang (泛用人型编码器) 2024-11-02 10:14:10

※ 引述《angus850503 (安格斯)》之铭言：
: 不过之前就一直对生成式 AI 有个疑问
: 就是"幻觉"到底有没有根本上的解决方法?
目前还没人能证明“有”，也还没人能证明“没有”。
有兴趣的话可以追踪这个“ LLM 幻觉排行榜”：
* https://github.com/vectara/hallucination-leaderboard/
* HN 相关讨论： https://news.ycombinator.com/item?id=38286761
有兴趣可以翻翻这排行榜的 Git 历史，看看各 LLM 的进化历程。然而，这排行
榜的评鉴方式也是公开的，各 LLM 也有可能 (不自觉地) 针对这类评鉴方式去优
化，所以这些资料只能做为参考。

作者: angus850503 (å°ç¶ å°å¸½) 2024-11-02 10:23:00

Cool 感谢提供网站

作者: shortoneal (不告诉你咧) 2024-11-02 19:21:00

竟然还有这种榜

作者: abc21086999 (呵呵) 2024-11-03 01:42:00

我记得昨天才在Reddit上面的OpenAI AMA串看到谁回复说幻觉很难解决，因为人类也是有同样的状况

作者: gino0717 (gino0717) 2024-11-03 01:46:00

云观众也是一种幻觉

作者: abc21086999 (呵呵) 2024-11-03 01:49:00

https://i.imgur.com/772P8fS.png

作者: angus850503 (å°ç¶ å°å¸½) 2024-11-03 13:30:00

这就是我想询问的幻觉没解决 AI的下一步到底在哪

作者: DrTech (竹科管理处网军研发人员) 2024-11-03 15:41:00

幻觉为什么一定要解决才能做AI产生生产力？不用解决也可以啊。不是所有任务都要靠LLM生成不可靠的资讯。例如很多人做RAG+QA问答，都无脑用搜候选结果，然后用LLM生成最后答案，当然一堆幻觉。架构上改成拿LLM当选择器，或限定nexttokens，只能输出选择1.2.3.4。在多个答案里面挑一个，最后靠程式输出完全没关键的答案。立刻解决幻觉问题。LLM当特定task模组(不要拿来当最后输出结果),结合传统NLP各种解决方案，任何一个功能任务，都可以"完全没幻觉"，能力又比传统NLP强很多。

作者: neo5277 (I am an agent of chaos) 2024-11-03 16:33:00

楼上这个有专有名词叫做rerank 我开发系统时有设计

作者: Chinwei8562 2024-11-04 14:22:00

酷

继续阅读

Re: [讨论] Terry新创不考Leetcode 走回头路wuyiulin [讨论] Terry新创不考Leetcode 走回头路empliu Re: [讨论] 大家会担心 ai 写 code 让工程师饭碗不angus850503 Re: [讨论] 大家会担心 ai 写 code 让工程师饭碗不AmosYang Re: [心得] 理工人的升迁之道AmosYang Re: [请益] 转职iOS工程师需要技能AmosYang Re: [讨论] 大家会担心 ai 写 code 让工程师饭碗不SkankHunt42 Re: [讨论] 大家会担心 ai 写 code 让工程师饭碗prag222 [征才] 瑞达联征前端工程师10-20万/月全远距PINKYNINIA Re: [讨论] 大家会担心 ai 写 code 让工程师饭碗brucetu