Re: [心得] AI的人性

楼主: oopFoo (3d)   2026-04-07 03:06:40
二月后,anthropics改了一些东东
https://news.ycombinator.com/item?id=47664442
adaptive thinking default (Feb 9)
Medium effort (85) default on Opus 4.6 (Mar 3)
事情闹大是因为
https://github.com/anthropics/claude-code/issues/42796
说Claude变很笨,这段时间写的codes现在正在靠Codex5.4重新改写。
写issue的人说,那些defaults都改过,还是一样笨。八点档继续演
※ 引述《cateran (云川闲步)》之铭言:
: 最近工作上解一个问题用opus 4.6发生一个快让我笑死的状况
: 背景是本公司巨大的c++应用程式在某个情况下crash
: 喂log请AI检查后很快就查查资料改好一版
: 说是因为某某某情况所以本来的map找不到查询的指标
: 回传一个out of bound的index value
: 新程式新增了一段进阶检查的循环应对特殊状况
: 改好后跑原本测资还是crash
: 把log喂回AI请他再看看
: 结果第二版竟然把之前的修改全部拿掉
: 只在上层呼叫端加一个fallback说指标找不到就直接回传0
: 还沾沾自喜跟我说 阿这样就绝对不会crash了 很棒吧
: 我只好质问agent 阿你这样只是把问题掩盖住 这样对吗?
: AI也毫不掩饰的说 你说得没错 我不该这样
: 最后AI给出的第三版总算把问题从底层修好
: 不禁在想第二版那种天兵解法的思路到底是怎么出来的
: 是因为训练资料也包含一些菜鸟工程师的程式吗
: 有没有AI大神可以解释这种状况
你确定有改好?其实埋了更多炸弹?
news.ycombinator 那篇很精彩,一堆人事后诸葛说我也发现Claude变笨了,然后一推人说reddit早就吵翻了。
其实还满惨烈的。这么多人用的ai,变笨,使用的人埋了一堆炸弹,现在要如何拆弹?
作者: jobintan (Robin Artemstein)   2026-04-07 07:43:00
往好的方向思考,这是给人类工程师制造机会,给想着用AI去人类的惯老板们赏一巴掌。wwwww
作者: yamakazi (大安吴彦祖)   2026-04-07 10:36:00
装笨让你优越感一下
作者: Obama19 (^_^)   2026-04-07 10:40:00
有新模型快出来都会变笨 都演几次了
作者: yamakazi (大安吴彦祖)   2026-04-07 10:44:00
就跟新手机新芯片新的方案出发出发之前,旧的偷降速降频一样,挤牙膏
作者: freeunixer (御剑客)   2026-04-07 13:20:00
还好我前两个月都在打混没用 ai (~误
作者: sarsman (DeNT15T♠)   2026-04-07 13:25:00
说到底不就没在review才导致这样==
作者: USD5566 (美金五千五百六十六)   2026-04-07 15:35:00
重点不是笨不笨 而是你们是工程师然后居然跟一般人一样在讨论语言模型根本不存在的人格人性zzzzz 拜托这个板是认真的吗
作者: zxc8787 (摸斗哈压库)   2026-04-07 15:54:00
楼上说的有道理==
作者: peterturtle (peter_turtle2000)   2026-04-07 17:54:00
我们还在机台上放乖乖呢,讨论个人格人性怎么了 www
作者: ManInBlack (阿阙)   2026-04-07 18:54:00
把物体拟人化确实是有帮助大家了解抽象的东西啦一本正经胡说/取悦使用者/降低思考强强度真的蛮“人”的XD
作者: yamakazi (大安吴彦祖)   2026-04-07 21:05:00
这不是脑补Karpathy用自动补全不是用agent的原Po吗?之前还脑补使用claude code只是下prompt不是用agent把claude code想成下prompt和自动补全
作者: abccbaandy (敏)   2026-04-07 21:18:00
笨不笨难说,但Opus确实贵...
作者: superpandal   2026-04-07 22:32:00
对于工程师而言本来就有更适合的工具 除非本来就不会把这类工具当浮木的才会一直吹 效率工具本身也是工程师私有远控CP值才高

Links booklink

Contact Us: admin [ a t ] ucptt.com