Re: [讨论] 大家会担心 ai 写 code 让工程师饭碗不

楼主: AmosYang (泛用人型编码器)   2024-11-02 10:14:10
※ 引述《angus850503 (安格斯)》之铭言:
: 不过之前就一直对生成式 AI 有个疑问
: 就是"幻觉"到底有没有根本上的解决方法?
目前还没人能证明“有”,也还没人能证明“没有”。
有兴趣的话可以追踪这个“ LLM 幻觉排行榜”:
* https://github.com/vectara/hallucination-leaderboard/
* HN 相关讨论: https://news.ycombinator.com/item?id=38286761
有兴趣可以翻翻这排行榜的 Git 历史,看看各 LLM 的进化历程。然而,这排行
榜的评鉴方式也是公开的,各 LLM 也有可能 (不自觉地) 针对这类评鉴方式去优
化,所以这些资料只能做为参考。
作者: angus850503 (小綠小帽)   2024-11-02 10:23:00
Cool 感谢提供网站
作者: shortoneal (不告诉你咧)   2024-11-02 19:21:00
竟然还有这种榜
作者: abc21086999 (呵呵)   2024-11-03 01:42:00
我记得昨天才在Reddit上面的OpenAI AMA串看到谁回复说幻觉很难解决,因为人类也是有同样的状况
作者: gino0717 (gino0717)   2024-11-03 01:46:00
云观众也是一种幻觉
作者: abc21086999 (呵呵)   2024-11-03 01:49:00
作者: angus850503 (小綠小帽)   2024-11-03 13:30:00
这就是我想询问的 幻觉没解决 AI的下一步到底在哪
作者: DrTech (竹科管理处网军研发人员)   2024-11-03 15:41:00
幻觉为什么一定要解决才能做AI产生生产力?不用解决也可以啊。不是所有任务都要靠LLM生成不可靠的资讯。例如很多人做RAG+QA问答,都无脑用搜候选结果,然后用LLM生成最后答案,当然一堆幻觉。架构上改成拿LLM当选择器,或限定nexttokens,只能输出选择1.2.3.4。在多个答案里面挑一个,最后靠程式输出完全没关键的答案。立刻解决幻觉问题。LLM当特定task模组(不要拿来当最后输出结果),结合传统NLP各种解决方案,任何一个功能任务,都可以"完全没幻觉",能力又比传统NLP强很多。
作者: neo5277 (I am an agent of chaos)   2024-11-03 16:33:00
楼上这个有专有名词叫做rerank 我开发系统时有设计
作者: Chinwei8562   2024-11-04 14:22:00

Links booklink

Contact Us: admin [ a t ] ucptt.com