[新闻] 资深软件工程师用Cursor工作效率降19%

楼主: xephon   2025-07-16 09:11:00
https://www.bnext.com.tw/article/83885/ai-productivity-drop
AI变猪队友?资深软件工程师用Cursor“工作效率降19%”:背后原因是?导入AI错了吗?
2025.07.15
资料来源:METR、路透社
责任编辑:李先泰
内文:
重点一:2025年初AI工具让资深开源开发者生产力下降19%,颠覆普遍预期。
重点二:研究采用严谨随机对照试验(RCT),直接测量AI在真实软件开发情境的影响。
重点三:研究结果与AI基准测试及开发者主观经验存在显著差异,凸显评估AI效益需多元视
角。
生成式AI近年有越来越“聪明”的趋势,不少企业甚至因为导入AI而缩减组织人员规模。但
对于公司行号来说,真的只要“无脑导入AI”,就可以让生产力大跃升吗?答案可能没这么
简单。
7月10日,一项由非营利研究机构METR(Model Evaluation & Threat Research)主导的研
究显示,2025年初问世的AI工具,包括Cursor Pro与Claude 3.5/3.7 Sonnet等前沿模型,
实际应用于资深开源开发者日常开发工作时,非但未能提升生产力,反而导致效率平均下降
19%。
这份研究的随机对照试验(Randomized Controlled Trial, RCT)结果,狠狠打脸产业普遍
认为“AI将大幅加速软件开发”的主流观点。白话来说,就是强制相对资深的老手工程师使
用AI,反而可能拖累他们的工作速度。
https://i.meee.com.tw/f063wYI.jpg
Y轴代表“使用 AI 后的时间变化”。可以发现,当开发者实际使用 AI 工具(来完成任务
时,所需时间反而增加了 19%。
问题是,为什么有如此反直觉的结果?是在使用AI的过程中,出了什么差错吗?
拖累老手工程师的5大潜在原因
为深入分析AI工具对软件开发生产力的实际影响,研究团队招募了16位长期参与大型开源专
案(平均22,000颗GitHub星、百万行程式码)的资深开发者,针对246个专案真实议题(如
错误修复、功能开发、程式码重构),随机分配为“允许使用AI”与“禁止使用AI”两组。
开发者可自由选择AI工具(主要为Cursor Pro搭配Claude 3.5/3.7 Sonnet)。同时,开发
者在执行任务时全程录影,并自行回报所需的总实作时间,并比较同一批开发者在“无AI辅
助”下完成任务的时间差异,并排除潜在实验偏误。
受试者在实验前普遍认为,AI能让他们加快24%进度,即使在实验过后,仍普遍认为允许使
用AI可让实作时间缩短20%。但研究数据却显示,实际上允许使用AI反而让完成时间增加了1
9%。 也就是说,这些软件工程老手在使用AI工具时,反而变慢了。
根据研究结果,这些老手“被AI拖累”的原因有以下五点:
1. AI工具使用流程增加额外步骤 :开发者在与AI互动、理解AI回应、验证建议内容时,会
花费额外时间。
2. AI建议需反复修正 :AI产生的程式码或建议往往不完全符合专案需求,开发者需多次修
改、整合或重写。
3. 高品质标准下AI表现有限 :在大型、成熟的开源专案中,对程式码品质、测试、文件等
要求高,AI生成内容较难一次达标,需人工补足。
4. 隐含需求难以明确传达给AI :专案中有许多隐性规范或背景知识,AI难以完全掌握,导
致开发者需花时间解释或修正。
5. 学习与适应成本 :即使开发者已有AI工具经验,仍需适应新工具或新工作流程,短期内
可能降低效率。
要说明的是,参与者虽有AI经验,但其实多数仅使用Cursor数十小时经验而已。 因此可以
说,有经验老手若还不太熟悉使用AI编程工具如Cursor,在他们熟悉的领域内,其实不用AI
的效率反而更好。
因此可以说,现在企业普遍认为“导入AI必能提升生产力”的假设,其实有待商榷。
https://i.meee.com.tw/xX1Hjvg.jpg
研究显示,对于自己越熟悉的问题,资深开发者的速度反而被 AI 拖得越慢。他们也回报说
,正是因为自己太有经验,导致 AI 很难真正帮上忙。
结论:无脑导入AI可能弊大于利
总结来说,这项研究的最大发现是,即使已经是程式开发老手,光是尝试使用所谓Vibe Cod
ing工具本身就一种全新的技能,这种与AI协作进行软件开发的实作,相较以往是具颠覆性
的,企业主在导入相关AI工具时仍需考量团队及专案得适切性,否则很可能只是搞的团队人
仰马翻,甚至错估导入AI的成效,最可怕的是误杀忠良,让有能力的工程师被误会“不懂AI
”。
但不要误会了。这份研究是针对“老手工程师”对于“使用AI工具”的评估,因此无法代表
所有开发者或不同类型专案。同时,研究仅针对开发者在自己熟悉的专案中处理真实议题,
故结果也不适用于新手、跨领域协作或陌生专案等情境。
另外值得注意的是,部分开发者获知实验结果后反映,使用AI工具让开发过程更有趣或更具
互动性,即使未提升效率,仍愿意持续尝试,为未来更强大的AI系统做准备。
看到这边,还认为AI是效率万灵药吗?如果是,你可能需要好好想想。
心得:
这篇研究蛮有趣的,不知道跟大家体感差多少
我朋友的公司是强力导入AI开发后
宣称已达到工程师效率提升30%
但他们没有把产品上市时间缩短30%
是用减少10%工程师跟多做20%事情来达成
具体怎么算的可能只有高管知道了
作者: chyl13579 (阿帅)   2025-07-16 09:15:00
或许对于资深工程师来说,写code比写prompt 更快吧,尤其这次实验的是他们熟悉的专案
作者: chita0258 (大报社)   2025-07-16 09:29:00
多的20%时间差不多就是学习的成本吧
作者: s8911090 (一脚踏出门外)   2025-07-16 09:45:00
METR从名字看就不像会客观研究的
作者: fake01 (假面超人)   2025-07-16 09:49:00
有感,工程师会使用AI来进行function的重构,会让code变得较难阅读,当在审视PR的时候,需要较多的时间来理解重构后的内容是否有达成需求以及范盖边界条件
作者: ILoveAMD (AMD)   2025-07-16 10:20:00
AI常常想太多 容易出现无效的程式码
作者: stepnight (桃卡武康)   2025-07-16 10:31:00
以前资深RD只需要讲个几句没重点的就有初阶RD帮你通灵完成需求现在你需要钜细靡遗的对着AI讲出需求哪个比较快不用比吧?
作者: shadow0326 (非议)   2025-07-16 11:16:00
资深工程师开课介绍各种AI用法的收入应该可以提升30%
作者: abc0922001 (中士abc)   2025-07-16 11:45:00
AI就是实习助理工程师,辅助用的而已
作者: hobnob (hobnob)   2025-07-16 12:06:00
笑死,s说的通灵真的有感
作者: ma721 (UndeadJ)   2025-07-16 13:07:00
用几十小时也叫老手
作者: airtsubasa (伪学姊)   2025-07-16 14:43:00
我都拿来写自己也看不懂的注解 让人以为我棒棒负责
作者: viper9709 (阿达)   2025-07-16 16:23:00
简单讲就AI不会通灵XD
作者: devilkool (对猫毛过敏的猫控)   2025-07-16 16:24:00
现在已经一堆资深的开课教AI赚FOMO仔的钱啦
作者: Ekmund (是一只小叔)   2025-07-16 17:09:00
不就前几天oopFoo贴的?
作者: neo5277 (I am an agent of chaos)   2025-07-16 17:37:00
这些都是沟通问题啊.....
作者: oopFoo (3d)   2025-07-16 17:50:00
原因,理由都是推测。这个实验重点是,每个参与人员,做完后,自我评估工作效率是+20%+,但实际是-19%。我不会说ai泡沫要破灭,但确实最近有点消风。
作者: gn00273680 (jameslin)   2025-07-16 20:20:00
开课噱海囉 但免费资源很多啦 而且一直变变变 没必要FOMO
作者: gino0717 (gino0717)   2025-07-16 20:22:00
觉得AI能做就跑去摸鱼了 实际效率下降十九趴
作者: NDark (溺于黑暗)   2025-07-16 20:46:00
我觉得蛮多持平之声都很中肯对于自己比较不擅长的领域AI会帮忙很大譬如说我不会写宣传文 AI可以帮我写出情绪价值满满的文章对于我不熟的资讯类其他工作也表现得不错因为我有基础的知识知道该怎么跟AI互动会得到最好结果但是对于我已经做了十年的工作 短时间很难直接套用AI就算改变工作方式套了AI产量变10倍这时候碰到非生产的其他瓶颈几乎是100%如果不妥协硬推下去那一定是偷懒或是接案或是离职创业之路
作者: bitcch (必可取)   2025-07-16 22:09:00
" target="_blank" rel="noreferrer noopener nofollow">
作者: sunsamy   2025-07-17 00:37:00
AI在"抽象"方面表现不错,像艺术跟唬烂表现不错但是要求"精确"的事,如写程式却是"抽象"化了所以像code review没意外的话也会蛮唬烂的除非本身就用Lint tool输出的结果然后用LLM讲述给你听但那本身就是Lint tool的功劳, 不是AI的功劳
作者: lin80673 (supremas)   2025-07-17 00:54:00
有时候多问几次LLM就开始产生幻觉,一直给我无效的Code
作者: yueayase (scrya)   2025-07-17 02:00:00
这样老板应该会火掉这些用AI效率变差的工程师吧?
作者: Murasaki0110 (麦当劳欢乐送)   2025-07-17 07:32:00
大project需求要讲精确太难了最好用就是临时要写个script或tool
作者: rereterry (rereterry)   2025-07-17 10:54:00
帮忙直接撰写验证部分其实满有帮助的,瞬间帮你配置好好,直接复制贴上就行了,其他的,只能说还是容易唬烂,需要重复检查
作者: viper9709 (阿达)   2025-07-17 15:41:00
大project需求要讲精确太难了+1
作者: jhjhs33504 ( )   2025-07-17 18:56:00
大project需求要讲精确的难度可能会比写好rust还高喔~
作者: acgotaku (otaku)   2025-07-17 19:00:00
Cursor 想弃坑了 一直搞限速 降速 宁愿去充值 Claude
楼主: xephon   2025-07-18 00:42:00
需求叫PM写
作者: louner (louner)   2025-07-18 06:54:00
用来写一些单纯但需要查查找找的snippet非常方便 大多一次就过 最起码让他写再改而不是全部自己写省了我不少精力上层想推只是裁员的借口而已 但若真的能节省大量人力也不见得是坏事 因为创业门槛会降低就工作复杂程度来看 AI更能取代的应该是管理职 PM这类非IC类型工作 但没人会洒钱资助这类研究 原因大家都知道
作者: acgotaku (otaku)   2025-07-18 14:09:00
cursor 在翻陈年老扣没文件 叫他解释某单元怎么实作怎么呼叫 他的回传值长怎样 给个范例 还是超级好用
作者: NDark (溺于黑暗)   2025-07-18 17:06:00
推楼上,老工程师的经验说会受到挑战
作者: wulouise (在线上!=在电脑前)   2025-07-18 20:46:00
cursor可以画function内flow chart吗?
作者: guanting886 (Guanting)   2025-07-18 21:31:00
现在ai 已经进步到你丢给他obfuscate过的code他还有办法解回来了 看没文件的程式码应该他蛮会猜的 至少缩短你通灵时间
作者: WWIII (东邪西毒)   2025-07-18 22:21:00
一直写需求就是pm的工作 当然不习惯
作者: Romulus (Säubern Mode)   2025-07-19 01:16:00
我最近才用Claude和Gemini Pro疯狂通灵失败 都在胡说八道这研究是以老手写熟悉的前提 这边现在AI价值不高是真的写的人越不懂AI价值就越高 都懂了直接写code就好找AI干嘛
作者: abc01251 (爪哥)   2025-07-19 01:18:00
对支持! 你们不要用 我用就好
作者: sowulo ( )   2025-07-19 20:03:00
有时候一直反复修正的时候都在想这个时间自己写早就写完了不过也确实人都不一定完全懂需求了 再多转一手给AI势必会再偏差更多 只能说还有一段路要走不管是人类如何使用AI或是AI本身
作者: xoyo (xoxox)   2025-07-19 21:18:00
现在的 AI 就是 Junior 甚至不到
作者: Obama19 (^_^)   2025-07-19 23:20:00
高手都改用claude code了 研究总是落后一步
作者: TSMCfabXX (台积新产品)   2025-07-19 23:54:00
假设原本开发工作100分钟 使用 AI 可省 30分钟但因为要做新的精美投影片 来宣称 AI 加速的效果来回多花了半小时
作者: viper9709 (阿达)   2025-07-20 01:25:00
楼上XD
作者: jacklin2002   2025-07-20 08:19:00
每次跟AI讲,你这个地方错了,只会回:抱歉!您说的是对的,我再帮您...有够狗腿
作者: stepnight (桃卡武康)   2025-07-20 09:25:00
然后下次还是继续鬼打墙出错
作者: secrectlife (lalala)   2025-07-20 13:05:00
Ai做错了还会一副好像正确的样子
作者: Goodwater (好水)   2025-07-21 10:38:00
AI写code bug无敌多 要一直无限修正
作者: strlen (strlen)   2025-07-21 18:03:00
很多人以为自己写的code bug少喔 呵呵呵 是不是太看得起自己啊人类迟早要输的 大神就少数 绝大多数工程师 又慢 又粗心bug满天飞 写测试唉唉叫 改个设计推拖拉 有没有这种人?满地都是 不要再骗自己了 你可能不是 但你同事呢 呵软件最强的那几间 通通都在推AI 你以为你是谁啊 笑死你公司的程式品质有那几间巨头好喔 说出来我笑笑同样两人份需求 要你带一个一年以下的Jr跟给你无限次数的claude AI 想也知道哪个比较轻松 带人多痛苦啊还工作效率降19%勒 不然来比 一个资深用AI 一个资深带Jr来看看效率差多少结果带Jr的 Jr也全都用AI写给你 哈哈哈哈
作者: lturtsamuel (港都都教授)   2025-07-22 01:28:00
jr 会学习啊 你公司差只找得到粪 jr 怪谁 不培育 jr等老鸟都退了公司产品直接关起来?如果真的追求极限效率 根据这篇的研究就是不要用ai也不要找jr 叫老鸟自干
作者: ChungLi5566 (中坜56哥)   2025-07-24 22:32:00
这些研究都过时了 AI每个月都在进步
作者: xluds24805 (狼)   2025-07-26 20:22:00
一开始总要有学习时间吧
作者: Wishmaster ( )   2025-07-27 11:37:00
太难评量了,AI也是需要调教的,开箱即用结果真的烂
作者: refusekkk (另类3k)   2025-07-29 03:53:00
回wulouise:现在AI可以从spec生出mermaid语法 算吗?
作者: qmailtw (爱八卦的主管滚远点)   2025-08-09 13:12:00
我拿 cursor 当高级 grep. 结果是不是乱掰? 一看就知道。我基本上不用 ai 生 code, 但帮我读 code 能省下不少时间。

Links booklink

Contact Us: admin [ a t ] ucptt.com