楼主:
oopFoo (3d)
2025-10-14 08:06:07最近Andrej Karpathy 贴了一个meme
https://x.com/karpathy/status/1976082963382272334
虽然他说,他只是要夸大强调太多exceptions
https://chatgpt.com/share/68e82db9-7a28-8007-9a99-bc6f0010d101
上面是对话。
Karpthy是ai大神,"vibe coding"这词也是他发明的,但写程式不是他的强项。
这短短的几行程式里,有多余的程式码,有无效的程式码,有dead codes。太多的exceptions只是其中一个问题
我把简化的prompt丢到gemini,好一点,但一样大有问题。
这其实就是我的ai coding经验。ai slop,浪费时间。真的junior起码不敢乱写。ai就是倒垃圾码出来让你一直纠正。
之前我在本版说ai coding写的程式有微妙的问题。但这么久了,现在的评语就是垃圾,"ai slop"不是讲假的。
※ 引述《yamakazi (大安吴彦祖)》之铭言:
: 抱歉,但你这做法有改进空间
: 如果是做算法,优先用python 写
: 现在主流AI写python几乎不可能错
: 写完后叫AI自己生一些测资再画图给你看
: 图看完没问题后再叫他改写成C++
: 要特别跟他说不要乱猜
: 不懂的api和算法去看完python原始码再来改写
: 如果有看完原始码再改写的
: 我体感上几乎不可能出错
: 99趴没问题
你被ai网军洗脑太成功了,真的做了,就知道完全不是这么回事。
Python改写c++?你是认真的?本来只有一个问题,现在你有两个大问题。
Cython搞那么久,为什么还是那么少人用?
typeless, gc, reference/ptr。光是这些差异就难搞死了。
: 剩下一趴你跟他对话也能改到好
: 再用刚刚的测资对一下bit true
: 轻松解决
: 要进去看扣吗?
: 几乎不用
这真是最大笑话。
现在的ai best practices就是请你一定要看程式码。因为错了不是ai的问题是你的问题。
还是要强调,ai不是没有用,但现在genAi走的方向是错的。这些ai公司要赚钱,强推各种solutions。
workslop,ai slop最近流行起来不是没有原因的。
最后讲个故事。有人在网络抱怨,说他外包程式很久了,他不期待2x或10x的ai产值,但他现在变成ai prompter,他要花很多时间去解释为什么回来的程式码有问题。现在他是0.1x的发包商。
作者:
yamakazi (大安吴彦祖)
2025-10-14 08:21:00Www
我再上篇文提到要一直问不如自己写就是这原因我Py跟C++都写,这两个程式语言思路差异很大用AI根据上文给建议还不错,但用问的我觉得比自己写还累,因为要一直修正。但也可能是因为我用copilot,没近期其他模型先进
作者:
MoonCode (MoonCode)
2025-10-14 10:21:00想太多了 一年两年后这些问题不存在
作者:
NDark (溺于黑暗)
2025-10-14 10:39:00推楼上,是变化太快,任何认知都很快过时就我个人不擅长的领域是蛮好用的,但永远也不会到达专精的程度如果我的问题是专精才能理解的地步,那我也看不出来有错
推 ‘错了不是AI的问题是你的问题’ 光这点就不可能被AI取代了
作者:
yamakazi (大安吴彦祖)
2025-10-14 12:02:00https://i.imgur.com/rsh7rWG.jpeg你没仔细看,这是他下的prompt,故意用极端的prompt来测试才会这样,而且其实还是能用只是太多防御性代码而已我就问你各位谁会下“extraordinarily cautious, you never knows what could go wrong”
compiler 跟 transpiler 是不同概念 compiler是某个语言实作的 不代表能无痛转成那个实作语言
作者:
yamakazi (大安吴彦祖)
2025-10-14 12:22:00我同意不可能百分百无痛,但99趴无痛应该几乎办得到,而且我拿的例子是前一个人说的自适应滤波器,这几乎百分百可以无痛转而且自适应滤波器这东西早就出来几十年了,搞不好年代还比python早,你说怎么可能没办法用C/C++写出来?而且你这例子和我内容天差地别,我是说有现成的python算法代码,再请他生成测试资料,转成C++还要做bit true,才不用审查代码。你这例子没有现成的代码让他阅读,也没有测资做bit true,天差地别我拿leetcode 举例好了,线上打这种程式竞赛,几乎测资过就可以,再来不要exception不要TLE,不要memory leak,时间复杂度不要太夸张就过了,这种比赛哪有什么评审去检查你代码?再来你自己写算法也是要靠测资抓错,写leetcode大家都有经验,一堆人一开始写前几笔测资ok,等到大点的测资一样TLE,没测资光靠人眼review根本看不出有什么错误。
让AI写写method还行的吧,poc也能丢给他做出错难免,但整体的确能省下满多时间
作者: WTS2accuracy (宝钟海贼団の一味) 2025-10-14 13:08:00
光说不用检查ai产的扣就能end了 0价值言论
楼主:
oopFoo (3d)
2025-10-14 13:08:00"vibe coding"之父,ai大神,没办法用ai来写程式,你不觉的,你需要考虑一下你的假设。
作者:
yamakazi (大安吴彦祖)
2025-10-14 13:27:00你给的连结是长这样
https://i.imgur.com/EJYrtCZ.jpeg你的AI之父只用auto complete,根本没用Claude codex agent好不好只用tab autocomplete生成的code?跟我假设天差地别也有可能我英文不好啦,不过看起来只用tab autocomplete?他的“没办法用ai写”好像跟我们认知的“没办法用ai写”不太一样,他说Claude agent didn’t work well,所以没办法写,但具体怎样不work也没讲清楚终于看懂前后文了,他是说他写nanochat不用vibe coding,不过你光讲某个大神做某个专案不用Claude agent其实没什么太大说服力,不过你高兴就好
作者:
gino0717 (gino0717)
2025-10-14 14:54:00南无阿弥陀佛
作者:
yamakazi (大安吴彦祖)
2025-10-14 17:57:00作者: abraxas (Abr.) 2025-10-14 18:28:00
英文都看不懂也出来跟人喊 99% 哦?
作者:
yamakazi (大安吴彦祖)
2025-10-14 18:56:00拜托随便给个X就要马上看懂哦?
作者:
DrTech (竹科管理处网军研发人员)
2025-10-14 18:59:0099%能取代推文又来了,拜托提出哪个论文或benchmark验证出99%,别靠 vibe 推文耶。理性客观讨论,而不是靠"我感觉",来认为你的感觉是全世界的事实。拿一个滤波器算法,来感觉全世界的程式码都这样,满难说服大家的。
作者:
yamakazi (大安吴彦祖)
2025-10-14 19:49:00上面不都有98 100趴的了?
AI就工具 难用就不要用 用下去变0.1还在用 那是人的问题还是工具问题 AI现在就是在快速进化 刚用多少要磨合磨合期抓短点 几小时看不得效果就可以丢了 因为下个月会有更好的
作者:
yamakazi (大安吴彦祖)
2025-10-14 19:54:00而且很吊诡的一件事,你找软件工程师也不会说要求这个工程师一定要通过什么benchmark 99%,实务上也几乎没有人类有办法benchmark 99
作者:
alihue (wanda wanda)
2025-10-14 20:02:00其实现在LLM写程式的能力已经遇到瓶颈了,不存在几年后就会更好的问题,除非推出新的AI且不需要大量资料训练就能自己推理
auto complete 没用? 叫他写小scope的function没用?复杂功能现在的确还是很烂 因为他不会主动问 不会查不会反抗 就算他不懂他还是会凑一个给你 因为AI训练就是有猜有分想你对话那个问题 现在最法就是先叫他去survey 任何可能意外 然后再解决说实话你问一个人那个问题他大概只会问你要防啥 甚至直接叫你滚一边去
作者:
alihue (wanda wanda)
2025-10-14 20:05:00其实看领域,如果是前端LLM来做是从从容容游刃有余,出 bug 通常不致命;后端出 bug 很多是很惨的
作者:
DrTech (竹科管理处网军研发人员)
2025-10-14 20:11:00上面benchmark不都有98 100趴的了? 喔,某人真的看不懂英文耶,快笑死。那个98% 100%的,都不是coding的测试阿。
作者:
yamakazi (大安吴彦祖)
2025-10-14 20:15:00你人去做coding测试也不会99 100趴,如果限制时间搞不好人类还0趴举个例,10分钟写三题leetcode hard,就算很强的工程师可能一题都写不出来,但十分钟对AI来说绰绰有余几乎可以全对
作者:
DrTech (竹科管理处网军研发人员)
2025-10-14 20:21:00所以AI可以完成99%的问题,到底在哪? 看不懂英文闹笑话,还跳针不回答大家疑问。
作者:
yamakazi (大安吴彦祖)
2025-10-14 20:24:00奇怪了,我明明原文有下一些假设才能99趴,你都很喜欢自动放大解读
作者:
DrTech (竹科管理处网军研发人员)
2025-10-14 20:25:00AI大师 yamakazi真是超越OpenAI的强者,OpenAI的模型,都做不到的事情,coding benchmark通过率99%,yamakazi光靠下prompt就超越了。真神人。
作者:
yamakazi (大安吴彦祖)
2025-10-14 20:26:00有什么好疑问的?反正不想用的人就继续手写我又无所谓。全世界最聪明的资料科学家和软件工程师在开发的工具,我用就好了,少一个人用我少一个竞争对手很好啊觉得不到99趴就不要用很好啊,我干嘛要帮你证明他有99趴然后还劝你去用XD
作者:
DrTech (竹科管理处网军研发人员)
2025-10-14 20:28:00现在又跳针:不是99%是大家误解了。跳针:我说99%是对的,但我干嘛证明99%是对的。真是笑死人。
作者:
yamakazi (大安吴彦祖)
2025-10-14 20:29:00你开心就好XD
作者:
Romulus (Säubern Mode)
2025-10-14 20:40:00蛤 上面那张图和准确率完全无关耶 那是Benchmark比较耶应该说那是比赛的准确率 俗称满分100分得几分这和你内文讲的99%准确也差太多了 根本移花接木等级而且每项表现不一样 每项每个AI又不一样 拿这个表出来说这漏陷了吧 本来啥都不讲还能把人唬的一愣一愣的现在不就被看破手脚在超级乱吹我工作上用Vibe做没接触过的领域&生架构然后review修用得很高兴也很好用 就不懂为什么这群人要一直拿AI现在根本还做不好的领域一直膨风
我自己也是认为工具多碰,但是要上production这种事情
作者:
Romulus (Säubern Mode)
2025-10-14 20:50:00然后戳他牛皮就说好啊那你就不要用 讲的好像他们的AI用法才是对的 不照他们的用法没那么神就是不会用&不要用
作者:
Romulus (Säubern Mode)
2025-10-14 20:51:00不熟的SDK叫AI生code比自己一个一个查文件那可快太多了还不需要自己去喂食文件 反正Microsoft Learn上都有
作者:
wuyiulin (龙破坏剑士-巴斯达布雷达)
2025-10-14 23:20:00讲 LeetCode 就是没遇过 edge case我觉得现在刷 LeetCode 最大的好处就是让自己面对更难的问题、写程式考虑更周全现实中比 LeetCode复杂的问题难了去,一般 LLM 还解不了新周赛问题。humble 啦 dude
楼主:
oopFoo (3d)
2025-10-15 07:13:00也不是吵,只是想纠正被洗脑的部份,就像aime 2025是100%但那不是写程式的benchmark,tau2-bench的telecom是98%,但那是agent tool的benchmark。现在agent coding其实是乱枪打鸟的方法。反正ai不会累,就一直乱打,写到程式passedtest为止。想纠正没有真正操作ai coding的人的错误认知。其实ai coding还蛮有意思的,作为辅助蛮适合的,但想取代人还要等下个突破。我等自驾等10年了,再等10年看看。
作者:
DrTech (竹科管理处网军研发人员)
2025-10-15 08:41:00yamakazi 连tool use是什么都不知到,就在喊 AI coding是98%了。认真讨论他也看不懂啦。Claude 在 swe-bench verified 资料集,最高跑到82%通过率。台湾y大神超越世界知名公司,达到99%。真神人。
作者:
lwecloud (CloudEX)
2025-10-15 09:10:00纠正被洗脑(X 宗教战争(O
作者:
yamakazi (大安吴彦祖)
2025-10-15 09:13:00纠正被洗脑XD我claude 4,4.5用到现在,每一行都有review ,这样叫没用过ai coding XD99趴是相对人类啦,AI 82,一般人类去写还不知道多少勒
作者:
sperma (sperma)
2025-10-15 09:17:00对某些人来说实事求是很困难的 承认自己错了就好像自己输了 低人一等一样 妙的是这种人通常都是半桶水 连基本英文阅读都有问题 跟我说多会写 code 骗鬼吧XD
作者:
yamakazi (大安吴彦祖)
2025-10-15 09:36:00人类方也没提数据啊,人类有SWE bench可以看分数?人类自己都没有benchmark 却可以觉得人类自己做得比ai好才奇怪吧一堆东欧俄罗斯人英文不好,code照样写得吓吓叫好吗
作者:
brucetu (sec)
2025-10-15 10:10:00写扣跟英文相关性真的没那么强技术文件的英文都很清晰直白 真的看不懂还可以翻译英文社群媒体的内容或是新闻理解能力就只是看你有没有常在看而已 没什么好骄傲的 一天15分钟滑几篇废文就练起来了
作者:
yamakazi (大安吴彦祖)
2025-10-15 10:13:00人类写扣某种程度也是试错乱枪打鸟,很少有人类可以一次写对的,还不是要靠编译器检查,测资纠错,上网查算法或用法
作者: WTS2accuracy (宝钟海贼団の一味) 2025-10-15 11:43:00
也没有洗脑不洗脑啦 AI无脑吹也就那几个没料的剩下的都在看笑话而已XDD 是要怎么被洗脑
一个 type hint 能解决的事情,ai 竟然不知道...?
作者:
DrTech (竹科管理处网军研发人员)
2025-10-15 16:01:00所以AI写程式正确率99%,到底在哪? 讲半天一直跳针不回答。
作者: HaHadog 2025-10-15 16:47:00
python底层是c所以转起来很容易 怎么不说所有语言底层都是1跟0大家都一样 想转随便转笑死
作者:
expiate (夜露死苦)
2025-10-16 10:18:00真的佩服你们这些人浪费时间跟杠精讨论,我都是看笑话的。
作者:
Romulus (Säubern Mode)
2025-10-16 10:54:00讲不过就开始避重就轻,转移焦点,顾左右而言他超级标准的完全没料ptt牛王
作者:
NDark (溺于黑暗)
2025-10-16 11:05:00之前是 不是百分之百就是没取代现在有退让了 1% 算是努力有成果
作者:
yamakazi (大安吴彦祖)
2025-10-16 19:16:00楼上XD
算力最终会解决一切啦,产一段扣,自动refine个千万次,99%真的不是问题,问题是浪费算力
作者:
NDark (溺于黑暗)
2025-10-18 22:12:00这个世界浪费的事还少做吗希望这辈子看得见 核融合/戴森环的世界
作者:
pot1234 (锅子)
2025-10-19 21:07:00即便很烂,我还是觉得写的比我们新人好
作者:
yamakazi (大安吴彦祖)
2025-10-14 16:21:00Www
我再上篇文提到要一直问不如自己写就是这原因我Py跟C++都写,这两个程式语言思路差异很大用AI根据上文给建议还不错,但用问的我觉得比自己写还累,因为要一直修正。但也可能是因为我用copilot,没近期其他模型先进
作者:
MoonCode (MoonCode)
2025-10-14 18:21:00想太多了 一年两年后这些问题不存在
作者:
NDark (溺于黑暗)
2025-10-14 18:39:00推楼上,是变化太快,任何认知都很快过时就我个人不擅长的领域是蛮好用的,但永远也不会到达专精的程度如果我的问题是专精才能理解的地步,那我也看不出来有错
推 ‘错了不是AI的问题是你的问题’ 光这点就不可能被AI取代了
作者:
yamakazi (大安吴彦祖)
2025-10-14 20:02:00https://i.imgur.com/rsh7rWG.jpeg你没仔细看,这是他下的prompt,故意用极端的prompt来测试才会这样,而且其实还是能用只是太多防御性代码而已我就问你各位谁会下“extraordinarily cautious, you never knows what could go wrong”你去叫一个本科新人写一样的东西,跟他说特别小心cornercase,他大概也会写出类似东西,因为AI跟人类学的还有python 底层就是C++,你觉得python写的东西不可能转成C++?
compiler 跟 transpiler 是不同概念 compiler是某个语言实作的 不代表能无痛转成那个实作语言
作者:
yamakazi (大安吴彦祖)
2025-10-14 20:22:00我同意不可能百分百无痛,但99趴无痛应该几乎办得到,而且我拿的例子是前一个人说的自适应滤波器,这几乎百分百可以无痛转而且自适应滤波器这东西早就出来几十年了,搞不好年代还比python早,你说怎么可能没办法用C/C++写出来?而且你这例子和我内容天差地别,我是说有现成的python算法代码,再请他生成测试资料,转成C++还要做bit true,才不用审查代码。你这例子没有现成的代码让他阅读,也没有测资做bit true,天差地别我拿leetcode 举例好了,线上打这种程式竞赛,几乎测资过就可以,再来不要exception不要TLE,不要memory leak,时间复杂度不要太夸张就过了,这种比赛哪有什么评审去检查你代码?再来你自己写算法也是要靠测资抓错,写leetcode大家都有经验,一堆人一开始写前几笔测资ok,等到大点的测资一样TLE,没测资光靠人眼review根本看不出有什么错误。
让AI写写method还行的吧,poc也能丢给他做出错难免,但整体的确能省下满多时间
作者: WTS2accuracy (宝钟海贼団の一味) 2025-10-14 21:08:00
光说不用检查ai产的扣就能end了 0价值言论
楼主:
oopFoo (3d)
2025-10-14 21:08:00"vibe coding"之父,ai大神,没办法用ai来写程式,你不觉的,你需要考虑一下你的假设。
作者:
yamakazi (大安吴彦祖)
2025-10-14 21:27:00你给的连结是长这样
https://i.imgur.com/EJYrtCZ.jpeg你的AI之父只用auto complete,根本没用Claude codex agent好不好只用tab autocomplete生成的code?跟我假设天差地别也有可能我英文不好啦,不过看起来只用tab autocomplete?他的“没办法用ai写”好像跟我们认知的“没办法用ai写”不太一样,他说Claude agent didn’t work well,所以没办法写,但具体怎样不work也没讲清楚终于看懂前后文了,他是说他写nanochat不用vibe coding,不过你光讲某个大神做某个专案不用Claude agent其实没什么太大说服力,不过你高兴就好
作者:
gino0717 (gino0717)
2025-10-14 22:54:00南无阿弥陀佛
作者:
yamakazi (大安吴彦祖)
2025-10-15 01:57:00作者: abraxas (Abr.) 2025-10-15 02:28:00
英文都看不懂也出来跟人喊 99% 哦?
作者:
yamakazi (大安吴彦祖)
2025-10-15 02:56:00拜托随便给个X就要马上看懂哦?
作者:
DrTech (竹科管理处网军研发人员)
2025-10-15 02:59:0099%能取代推文又来了,拜托提出哪个论文或benchmark验证出99%,别靠 vibe 推文耶。理性客观讨论,而不是靠"我感觉",来认为你的感觉是全世界的事实。拿一个滤波器算法,来感觉全世界的程式码都这样,满难说服大家的。
作者:
yamakazi (大安吴彦祖)
2025-10-15 03:49:00上面不都有98 100趴的了?
AI就工具 难用就不要用 用下去变0.1还在用 那是人的问题还是工具问题 AI现在就是在快速进化 刚用多少要磨合磨合期抓短点 几小时看不得效果就可以丢了 因为下个月会有更好的
作者:
yamakazi (大安吴彦祖)
2025-10-15 03:54:00而且很吊诡的一件事,你找软件工程师也不会说要求这个工程师一定要通过什么benchmark 99%,实务上也几乎没有人类有办法benchmark 99
作者:
alihue (wanda wanda)
2025-10-15 04:02:00其实现在LLM写程式的能力已经遇到瓶颈了,不存在几年后就会更好的问题,除非推出新的AI且不需要大量资料训练就能自己推理
auto complete 没用? 叫他写小scope的function没用?复杂功能现在的确还是很烂 因为他不会主动问 不会查不会反抗 就算他不懂他还是会凑一个给你 因为AI训练就是有猜有分想你对话那个问题 现在最法就是先叫他去survey 任何可能意外 然后再解决说实话你问一个人那个问题他大概只会问你要防啥 甚至直接叫你滚一边去
作者:
alihue (wanda wanda)
2025-10-15 04:05:00其实看领域,如果是前端LLM来做是从从容容游刃有余,出 bug 通常不致命;后端出 bug 很多是很惨的
作者:
DrTech (竹科管理处网军研发人员)
2025-10-15 04:11:00上面benchmark不都有98 100趴的了? 喔,某人真的看不懂英文耶,快笑死。那个98% 100%的,都不是coding的测试阿。
作者:
yamakazi (大安吴彦祖)
2025-10-15 04:15:00你人去做coding测试也不会99 100趴,如果限制时间搞不好人类还0趴举个例,10分钟写三题leetcode hard,就算很强的工程师可能一题都写不出来,但十分钟对AI来说绰绰有余几乎可以全对
作者:
DrTech (竹科管理处网军研发人员)
2025-10-15 04:21:00所以AI可以完成99%的问题,到底在哪? 看不懂英文闹笑话,还跳针不回答大家疑问。
作者:
yamakazi (大安吴彦祖)
2025-10-15 04:24:00奇怪了,我明明原文有下一些假设才能99趴,你都很喜欢自动放大解读
作者:
DrTech (竹科管理处网军研发人员)
2025-10-15 04:25:00AI大师 yamakazi真是超越OpenAI的强者,OpenAI的模型,都做不到的事情,coding benchmark通过率99%,yamakazi光靠下prompt就超越了。真神人。
作者:
yamakazi (大安吴彦祖)
2025-10-15 04:26:00有什么好疑问的?反正不想用的人就继续手写我又无所谓。全世界最聪明的资料科学家和软件工程师在开发的工具,我用就好了,少一个人用我少一个竞争对手很好啊觉得不到99趴就不要用很好啊,我干嘛要帮你证明他有99趴然后还劝你去用XD
作者:
DrTech (竹科管理处网军研发人员)
2025-10-15 04:28:00现在又跳针:不是99%是大家误解了。跳针:我说99%是对的,但我干嘛证明99%是对的。真是笑死人。
作者:
yamakazi (大安吴彦祖)
2025-10-15 04:29:00你开心就好XD
作者:
Romulus (Säubern Mode)
2025-10-15 04:40:00蛤 上面那张图和准确率完全无关耶 那是Benchmark比较耶应该说那是比赛的准确率 俗称满分100分得几分这和你内文讲的99%准确也差太多了 根本移花接木等级而且每项表现不一样 每项每个AI又不一样 拿这个表出来说这漏陷了吧 本来啥都不讲还能把人唬的一愣一愣的现在不就被看破手脚在超级乱吹我工作上用Vibe做没接触过的领域&生架构然后review修用得很高兴也很好用 就不懂为什么这群人要一直拿AI现在根本还做不好的领域一直膨风
我自己也是认为工具多碰,但是要上production这种事情
作者:
Romulus (Säubern Mode)
2025-10-15 04:50:00然后戳他牛皮就说好啊那你就不要用 讲的好像他们的AI用法才是对的 不照他们的用法没那么神就是不会用&不要用
作者:
Romulus (Säubern Mode)
2025-10-15 04:51:00不熟的SDK叫AI生code比自己一个一个查文件那可快太多了还不需要自己去喂食文件 反正Microsoft Learn上都有
作者:
wuyiulin (龙破坏剑士-巴斯达布雷达)
2025-10-15 07:20:00讲 LeetCode 就是没遇过 edge case我觉得现在刷 LeetCode 最大的好处就是让自己面对更难的问题、写程式考虑更周全现实中比 LeetCode复杂的问题难了去,一般 LLM 还解不了新周赛问题。humble 啦 dude
楼主:
oopFoo (3d)
2025-10-15 15:13:00也不是吵,只是想纠正被洗脑的部份,就像aime 2025是100%但那不是写程式的benchmark,tau2-bench的telecom是98%,但那是agent tool的benchmark。现在agent coding其实是乱枪打鸟的方法。反正ai不会累,就一直乱打,写到程式passedtest为止。想纠正没有真正操作ai coding的人的错误认知。其实ai coding还蛮有意思的,作为辅助蛮适合的,但想取代人还要等下个突破。我等自驾等10年了,再等10年看看。
作者:
DrTech (竹科管理处网军研发人员)
2025-10-15 16:41:00yamakazi 连tool use是什么都不知到,就在喊 AI coding是98%了。认真讨论他也看不懂啦。Claude 在 swe-bench verified 资料集,最高跑到82%通过率。台湾y大神超越世界知名公司,达到99%。真神人。
作者:
lwecloud (CloudEX)
2025-10-15 17:10:00纠正被洗脑(X 宗教战争(O
作者:
yamakazi (大安吴彦祖)
2025-10-15 17:13:00纠正被洗脑XD我claude 4,4.5用到现在,每一行都有review ,这样叫没用过ai coding XD99趴是相对人类啦,AI 82,一般人类去写还不知道多少勒
作者:
sperma (sperma)
2025-10-15 17:17:00对某些人来说实事求是很困难的 承认自己错了就好像自己输了 低人一等一样 妙的是这种人通常都是半桶水 连基本英文阅读都有问题 跟我说多会写 code 骗鬼吧XD
作者:
yamakazi (大安吴彦祖)
2025-10-15 17:36:00人类方也没提数据啊,人类有SWE bench可以看分数?人类自己都没有benchmark 却可以觉得人类自己做得比ai好才奇怪吧一堆东欧俄罗斯人英文不好,code照样写得吓吓叫好吗
作者:
brucetu (sec)
2025-10-15 18:10:00写扣跟英文相关性真的没那么强技术文件的英文都很清晰直白 真的看不懂还可以翻译英文社群媒体的内容或是新闻理解能力就只是看你有没有常在看而已 没什么好骄傲的 一天15分钟滑几篇废文就练起来了
作者:
yamakazi (大安吴彦祖)
2025-10-15 18:13:00人类写扣某种程度也是试错乱枪打鸟,很少有人类可以一次写对的,还不是要靠编译器检查,测资纠错,上网查算法或用法
作者: WTS2accuracy (宝钟海贼団の一味) 2025-10-15 19:43:00
也没有洗脑不洗脑啦 AI无脑吹也就那几个没料的剩下的都在看笑话而已XDD 是要怎么被洗脑
一个 type hint 能解决的事情,ai 竟然不知道...?
作者:
DrTech (竹科管理处网军研发人员)
2025-10-16 00:01:00所以AI写程式正确率99%,到底在哪? 讲半天一直跳针不回答。
作者: HaHadog 2025-10-16 00:47:00
python底层是c所以转起来很容易 怎么不说所有语言底层都是1跟0大家都一样 想转随便转笑死
作者:
expiate (夜露死苦)
2025-10-16 18:18:00真的佩服你们这些人浪费时间跟杠精讨论,我都是看笑话的。
作者:
Romulus (Säubern Mode)
2025-10-16 18:54:00讲不过就开始避重就轻,转移焦点,顾左右而言他超级标准的完全没料ptt牛王
作者:
NDark (溺于黑暗)
2025-10-16 19:05:00之前是 不是百分之百就是没取代现在有退让了 1% 算是努力有成果
作者:
yamakazi (大安吴彦祖)
2025-10-17 03:16:00楼上XD
算力最终会解决一切啦,产一段扣,自动refine个千万次,99%真的不是问题,问题是浪费算力
作者:
NDark (溺于黑暗)
2025-10-19 06:12:00这个世界浪费的事还少做吗希望这辈子看得见 核融合/戴森环的世界
作者:
pot1234 (锅子)
2025-10-20 05:07:00即便很烂,我还是觉得写的比我们新人好