楼主:
TonyQ (自立而后立人。)
2026-02-19 13:55:21我知道过去一个多月我已经很认真在讲 AI 到底有什么好处了,
但我还是想再认真讲一次。今天要谈两件事:
1. 为什么现在是值得去看 AI 的时候?
2. 为什么大家谈 AI 的时候,好像永远都在鸡同鸭讲?
───────────────────────────────────
* 为什么是现在?
答案很单纯:因为现在终于有了关键且具备足够能力的模型。
在成本非常便宜的情况下,我们终于可以取得一个
【能用、能打,且真正有帮助】的模型。
相较于之前虽然能用,但基本上自己消耗的时间
比 AI 投入的时间还多——说白了,之前那些模型
就是在浪费你的生命。你花一个小时跟它沟通,
自己做只要半小时,那我干嘛用它?
但现在不一样了。现在的模型已经过了那个临界点。
───────────────────────────────────
你用的 AI 到底是什么 AI?
我觉得现在大家在谈 AI 最大的痛苦,不是 AI 不好用,
而是【很多人对 AI 的认知停留在一年前】。
我们还在谈 ChatGPT、还在谈网页版的对话,甚至还在谈
那个交互式的 Cursor(Ctrl + K 的那个版本)。如果你的
认知停留在那个阶段,那我今天讲的对你来说当然都是废话
——因为你并没有用到真正好的东西,你连门都还没进来,
你在门外面评论房间里面的家俱好不好用,
这不是很荒谬吗?
所以在往下谈之前,先问自己一个问题:
你现在用的 AI 是什么?
是 Cursor?是 Manus?是各种套壳的网页版?
还是 local 的 Gemini、local 的 Siri?
你要先搞清楚这个问题。你不搞清楚这个问题,
我们后面所有的讨论都是白费力气。
我自己始终最推荐的,是 Claude Code 上面的
Opus 4.5/4.6,以及 OpenAI 体系的
Codex CLI 搭配 GPT Codex 5.3。
───────────────────────────────────
* 同一个模型,不同场景,天差地远
很多人会跟我说:“欸,我用的也是 Opus 4.5/4.6 啊!
我在 Cursor 上用,我在 Copilot 上用,
用的都是这个模型。”甚至有人会告诉我,
他用网页版用的也是这个模型。
我都会说:你把一个拳击手的手脚绑起来跟你打,
他虽然还是那个拳击手,可是他的场景不对啊。
你把 Tyson 的手绑在背后推上擂台,
然后说 Tyson 也不过如此——这不是搞笑吗?
如果大家还没有对齐最基本的场景跟模型,
那我们在谈 AI 基本上就是瞎子摸象,
你摸象头我摸象尾,这样谈下去是没有意义的。
你用到烂东西来跟我讲他很烂,我完全可以理解你在讲什么,
因为不是这么用的东西就是很烂啊。我用了 Cursor 一两年,
我会不知道它过去表现到哪里吗?我比你更早知道它有多烂
好吗。问题是,现在有新的东西了。
───────────────────────────────────
* 网页版就是二等公民,我再说一次
这件事情我之前一直反复在强调,但我发现很多人可能是
对命令提示字符的害怕、对视窗的害怕,
他们完全不想花力气多装一些东西。
哪怕这个东西对他的帮助真的非常大,
他就是不愿意踏出那一步。
用网页版的人最常问我的就是:
“TonyQ,为什么它都不会自己去学东西?
为什么我什么事情跟它讲,它好像都不看我给它的东西?
我明明专案就在那里,为什么它没有办法自己看?
没办法自己看就算了,他还会有幻觉,
假设那些档案是完全不同的东西。
我要跟它讲要什么东西,还得一个一个纠正,
真的很累人。”
我跟你说,这不是 AI 的问题,
这是你选错工具的问题。你用网页版,
它当然看不到你的专案,它又不是通灵的,
他只能从他的训练资料中猜想,这就是幻觉的来源。
你拿一把螺丝起子去锯木头,然后抱怨它不利,
这能怪谁?
───────────────────────────────────
# 一群 AI 麻瓜教会我的事
最近因为在玩游戏的关系,我在一个小的玩家社群里面。
我带着一群人告诉他们我利用 AI 改了什么、做了什么,
然后引导他们使用 AI 去解决自己的问题。
大概三四十个人,从一个几百人的社群里面拉出来的。
里面有资深的,也有程度非常弱、
甚至完全不会写程式的纯玩家。
我大概从 12 月初开始做这个实验,
到现在已经两个多月了。
我的感想是很惊人的。
首先,70% 到 80% 以上的人,用的全部都不是 Agent、
不是 Copilot/Cursor,也不是 Codex CLI。
他们用的都是网页版。理由很单纯:
网页版的入口简单,大家都清楚;
像 Claude code 这种还要再找入口的东西,
连工程师都不见得很会找了,更不用说一般人。
即使我们用很厉害的成品引诱他们去使用 Claude Code,
大概也只有两三成的人会主动去用,
还有一定比例的人卡在安装。
对我们来说安装只是两三个指令,
但对他们来说都是很大的障碍。
───────────────────────────────────
* 就当作被我骗了
我观察标的中有六七成的人,我怀疑他们根本有
【命令列恐惧症】。只要看到黑盒子就浑身不舒服,
觉得这东西很可怕、很困难,
一看到就关掉,心里想:这三小?
因为这样很难收集实验样本,所以我自己下去做访谈。
另一方面是我这个人比较奇怪,
我觉得既然买了就要用到好东西。
你都花钱了,为什么买了却只用一个二级品?
你去吃到饱餐厅只吃白饭配酱油,那你来干嘛?
这不是浪费钱吗?我这人就比较鸡婆一点,
觉得是少花钱要用到好的部分。
我会问他们愿不愿意开直播或分享画面给我看,
我带着他们一步一步走,一起把它装起来,
看看这东西对他到底有没有帮助。
之前有一阵子 Claude Code 有送三个 referral
(可以送 7 天试用),我就把名额给了这些比较熟的人,
陪他们一个个建起来。我跟他们说:
1. 就当作被我骗了,先用用看。
2. 用完之后你觉得有 feel,你再自己买或自己用。
反正试试看嘛!你都已经开始了,就试试看吧。
───────────────────────────────────
* 十个有九个回不去了
我跟你说,我观测中这个圈子的人十个有九个开始用了之后,
就理解到这跟网页版真的是完全不一样的东西。
大多数人用了就持续用下去,他们开始理解到:
原来我可以自己完成这么多事情。
只要那些事情是你有一些概念或一些想法,
可以跟着 AI 一起互动去验证跟测试,
你都可以从你的角度一个一个去弄。
专业人士因为本来就知道答案,弄起来更清楚;
但就算是完全不会写程式的人,
只要他知道他想要什么,AI 就能带着他走。
然后他们的“黑盒子症候群”就这样治好了。
其实也不一定要用黑盒子,你也可以用 VS Code 的
Claude 套件,同样有画面。但不管用什么,
重点是你踏出了那一步。
为了方便我是都推 Claude Code,
这是我到现在最喜欢的选择,
最近有些人在骂 A 公司,我觉得是莫名其妙的事情,
把东西做得好大概就是他的原罪了。
───────────────────────────────────
* 百分之百留存,三成刷了 200 美金的方案
我原本预期两三个礼拜内,就会看到一群人退坑
——那些觉得 AI 对他没太大帮助的人,
可能就不愿意付钱了。
但实际上来看,就我观测到的范围,
【百分之百都留下来了】。
甚至其中有 30% 的人刷了 200 美金的方案。
你能想像吗?一群 AI 麻瓜,
甚至可能不是以写程式为本业的人,
他们舍得花这样的钱。
这个付费转换率比我预期高了非常多
——竟然达到 30%。
有些人把 AI 用在自己的中古车行,
有些人用在其他工作,
各自都把它带回自己的专案或日常工作中。
这个“黑盒子”已经不再是恐惧的来源,
而是提供新能力的基础。各行各业都因此得到了红利。
我跟你讲,这些人都不是工程师,
都不是我们传统认知中会用这些工具的人。
他们反而更没包袱的投入使用,
而且因为他们本来就做不到,
所以他们也不会来鲁小说 AI 有没有比我强,
没有那种偶包。
───────────────────────────────────
* AI 已经比你想的克制
像我们这种老工程师会知道,
给 AI 权限是很可怕的事情,
让它自己去跑一定会有出事的风险。
不过我觉得这是可以靠着经验累积下指令的边界感的,
就目前的使用经验,AI 还算蛮克制的。
它不是不会搞烂你的东西,
但并没有到每天让系统炸掉的程度。
偶尔出包,整体反应都在可以接受的范围。
我自己在一个多月前就已经开始用
Bypass Permission 了。基本上只管大方向,
细节已经不太管它。当然,给它用的环境
还是一个有限度的沙盒,但比原本宽松
——不再连读个档案都要问我。
只要你的边界感慢慢训练出来,
其实并不会像一般老工程师想像的那么提心吊胆。
你怕它搞烂东西?那你就给它一个搞不烂的环境啊。
这不就是我们平常写程式在做的事情吗?
备份、权限控管、版本控制——
───────────────────────────────────
* AI 不是神,但你也不是
有些人觉得,如果 AI 没有办法把问题全部解掉,
就是不好用的东西。我觉得这超级莫名其妙。
我们自己写程式也是要 debug 好几次好吗?
自己写完程式,看哪里不好看、不一样,就再改。
AI 也一样,逻辑都一样,
它并没有比人真的强到哪里去,
也是按部就班去做。
人不知道、要测过才知道的东西,
它也是要测过才知道。
想像你今天进到一个迷宫,前面有三条岔路。
你不知道哪一条有宝箱,AI 也不知道。
当 AI 走进第一条路发现没有宝箱,
你可能会笑 AI 笨、解不开。
但你是有分身数可以走一次就达到目标吗?
而且人家走一条路只需要五分钟,
你走一条路需要两个小时,你有什么好自豪的?
你不帮它就算了,嘲笑它有什么意义?
说真的,我理解大家觉得自己能打败 AI 的
那种优越感和爽感,但你要看清楚:
你是在拿它来解决问题,你并没有在跟它竞争。
它是你的工具,是跟你同一国的。
你呛赢你自己的锤子,然后呢?你的钉子钉好了吗?
───────────────────────────────────
* 避开“许愿式问题”,其他的交给它
我们很多时候都在问 AI 一些它不可能知道的事情,
然后怪它笨。
你问 AI 你的提款卡密码是多少,
你绝对不会预期它知道答案
——如果它知道的话,你现在就该去把钱都领光了。
但我们很多时候,就是把自己不知道的问题
跟提款卡密码混为一谈。
你是在问它别人的提款卡密码是多少,
但它不知道、你也不知道,那就不会有人知道。
这能怪 AI 吗?
避开这种知识面缺乏的“许愿式”问题。
其他已知答案的问题,你完全可以用更少的力气、
更低的成本让它去完成。
如果任务需要看画面或资料,
我们会用一个技巧让它形成“闭环”:
写一个 CLI 指令让它截图,
让它自己去读取截图内容,
或者让它去写 log 直到看到特定关键字才算结束。
写程式就是控制变量的过程,
控制变量有时候就是一种猜测与推敲
——AI 做的事情跟你做的事情本质上是一样的,
只是它比你快。
───────────────────────────────────
* 用好的模型,拜托
昨天在 PTT 有人跟我讨论,
讲了半天,结果跟我说他用的模型是 Sonnet 4.5。
我就翻了个白眼。
你用这种模型,你当然会觉得它很烂。
这就像你去买一台五万块的二手车,
然后抱怨它跑不赢法拉利——废话,那是次级货欸。
不同的模型真的差很多。对我来说,
除了前面讲的那几个有过门槛的模型以外,
其他都跟摆设一样。
我完全不会想考虑,给我钱我也不想用。
最近“养龙虾”那么盛行,
试着用烂模型去省钱的一狗票,
你很快就会看到一堆哀嚎。
我前两年已经花了很多时间去理解这些模型有多烂,
毕竟是用 Cursor 写了一年半的人。
这些模型里面哪一个我们没试过?就是不够用啊。
你省那堆的 Token,结果花跟人工差不多的时间
去修它搞出来的烂东西,这叫省钱吗?
这叫浪费生命。
───────────────────────────────────
* 特殊场景
当然,如果你的领域是成人导向或 NSFW 的内容,
只能使用地端模型;如果是法遵或法令要求
没办法使用线上服务,那也没话讲。
这类场景本来就有限制,没有人会去争论这点。
但如果你的领域真的非常特殊,
让你觉得大家在讲的东西跟你没有关系
——我觉得可以理解。但你自己就要有自觉一点:
你的领域就是特殊的,那关大家什么事?
其他人能用,你不能用,
有必要吃不到葡萄就说葡萄酸吗?
你因为自己的特殊限制用不了好东西,
然后跑去告诉所有人这东西就是烂
——阿你这不是来抬杠的吗 XD
───────────────────────────────────
* Divide and Conquer 依旧适用
在我们要用 AI 的时候,
还是非常建议大家先用 CLI 环境去试试看。
一次只解决一个问题,把问题分解成小点。
为什么?因为分解成小点后,
你的 context 消耗就小;
context 小,解题的情况就会非常清楚。
【Divide and Conquer(分而治之)
在这个年代依旧适用。】
如果你能力比较弱,你当然会需要一个更大的全面解,
但我依旧建议先把问题分切成大的方向,
然后再针对小方向逐一处理。
最后把这些零件整合挂钩,
用小 context 的解法把 interface 全部串起来。
这就是以前我们带新手工程师的模式
——分派小的 context 给他们做,
从一个 context 教起,教会之后让他们练习整合。
AI 时代也是一样的逻辑,没有什么魔法,
就是基本功。
整个开发过程中,主要的改变在于
提供需求的方法从传统人工访谈
转变为文字化、口语化、自然语言化。
其他部分基本上与人工开发差异不大。
不同角色的边界变小了
——一个 Agent 既帮你想设计又帮你想程式,
同时处理前端与后端。
角色不需要切那么细了,但流程跟结构还是在的。
你以为 AI 会改变一切?
它改变的是效率跟门槛,不是本质。
软件开发的本质变化并不大。
顶多是有些人造的流程问题被拿掉了。
───────────────────────────────────
* 不要害怕黑盒子
大年初三,新年日行一善,再认真跟大家推荐一次。
不要去害怕黑盒子。Console 在这个年代
真的是大家的好朋友,是一个最棒的切入点、
一个被忽略的很好的接口。
它能让你真正理解电脑科技可以做到什么程度,
它可以控制你所有的东西,解决超级多问题。
比起过去的单一程式,Console 是一个很棒的途径。
至于“养龙虾”这类方案,我个人还是觉得非常浪费。
如果你真的需要一个 AI 朋友,
现在有很多 App 可以聊,
你跟 ChatGPT 好好情感交流就好。
你不需要在工作任务上跟 AI 有太多的情感交流,
你需要的是能帮得上你的工具。
那些能帮得上忙的事情,
你完全可以用 Claude Code 写成自动化的东西,
再透过 Cron Job 定期唤醒。
相比之下,龙虾为了通用化,
每次启动的 Prompt 浪费太多 Token,
你真的是把钱当烟火在洒。
你需要的只是那种控制感,
可是那个控制感是花了钱、烧掉 Token 之后的假象。
你甚至根本就没有控制它
——你只是花了更多钱让自己觉得有在控制而已。
这个世界上没有魔术。
───────────────────────────────────
去试试看目前最顶尖、最厉害的一把 AI 小刀吧。
它可以很快地戳穿并解决一个个小问题。
现在到底厉害到什么程度?去试试看。
我个人最推荐直接用 Claude Code。
如果真的不行,退而求其次用 Codex CLI,
再其次用 Open Code 加上 Codex 或其他方案。
说真的,人生苦短,
不要再花时间在烂东西上面了。
你省的不是钱,你省的是你自己的可能性。
作者:
Rust (DOG~R~0.0~)
2026-02-19 14:05:00App板Codex不好吗?我还以为是一样的东西顺带问一下如果用5.3-Codex思考强度要设多高xhigh会不会钱包失血
楼主:
TonyQ (自立而后立人。)
2026-02-19 14:11:00codex app OK喔 因为那是后来出的我没列进去xhigh 主要是时间很长 可以拿来解比较难的题目
你开头的问题其实都像废话一样的无聊。之所以会吵起来主要除了LLM不断演进,而且有一部是无法解释的以外,主要还是某些人表达方式和态度的问题。话讲不清楚,爱贴人标签,把不同的意见当成食古不化的中共同路人,而且姿态很高,前面有人讲过各宜尊重彼此不同的环境,但他似乎直到前一篇的交流才开始讲点正常的东西,你说这样怎么可能不吵起来?没像他们用法就是食古不化那要推动任何一地的文化变革都将困难重重。
作者:
gino0717 (gino0717)
2026-02-19 14:32:00我最近觉得gemini急着要玩家包一年是怕被这玩意儿盖过去
作者:
nashmvp ( )
2026-02-19 14:33:00推
作者:
yamakazi (大安吴彦祖)
2026-02-19 14:43:00“爱贴人标签”这句话我是抱持疑惑,请问我何时贴人标签了?找我说过的那句话出来给我瞧瞧?“表达方式和态度问题”,通常是理亏的老人才会最后说“态度不好”而且我并没有想要推动变革,你爱用不用关我屁事XD我从来不会勉强人,我都会说“不想用就不要用”你的领域不适合,那就不要用不勉强,我也没强迫你用XD
作者:
Richun (解放左手的OO之力)
2026-02-19 14:50:00gemini优点是它context有2M,跟claude的200k差一个数量级有的人玩法是叫gemini 3 pro去理解浓缩后再丢去给opus处理现在看anthropic官网才发现原来它家pro也能用opus了,我还停在它家只有max能用opus的印象中。
如果工作量不大就等claude有时候会有新帐号优惠的活动,前阵子jade的已经结束,至于5x和20x在reddit有详细比较,没接外包的买个pro就很够了
作者:
yamakazi (大安吴彦祖)
2026-02-19 14:54:00你没说人不重要,我也没说你有说过这句话啊XD 你要不要回去把我的文再看一遍?我何时说过“东尼大说人不重要”?而且说我骚扰别人笑死,公开版面的东西再贴到公开版面上叫骚扰别人?不想被转贴就设私人或贴警示禁止转贴啊XD欸欸 那别人文章搞事,你知道第一个拿别人文章搞事的是手搓派吗?我是看他拿别人文章出来讲才跟进的好吗?第一个拿别人文章出来搞事的是这位,我只是用魔法对付魔法
https://i.imgur.com/zfzPD5J.jpeghttps://i.imgur.com/oarhrRp.jpeg我贴你的文章,并没有说妳说人不重要,完全没有超译脑补,自己看清楚吧检举就检举嘻嘻,水桶一个月又不痛不痒我根本没讲过“人不重要”硬是要把我没说过话塞到我嘴巴笑死你自己也差不多吧,把我没讲过的话塞到我嘴巴,你的指控很多都子虚乌有而且我是直接原文转贴,请问要怎么把你没讲过的话塞到你嘴巴?再看看我原本的文,根本没有加油添醋把你没讲过的话塞到你嘴巴,乱指控造谣喔
https://i.imgur.com/YKmBmJg.jpeg讲的这么大义凛然,结果自己也在做一样的事,请问一下我何时把你没讲过的话塞到你嘴巴里?哪句话?你指的出来吗?挑衅引战态度不好这种比较拢统的形容词我无所谓,但你说我把你没讲过的话塞到你嘴巴,拜托要有证据好吗,没证据请不要乱造谣
可以分享一下,一个原来需要2~4小时的功能,若透过Ai实现,你会贴给Ai 什么样的内容呢? 谢谢
也不是吹捧 AI肯定可以持续进步 只是目前进度到哪里
作者: cuzuto 2026-02-19 16:18:00
这样跟antigravity 不一样吗,skill,mcp好像也都有支援,目前subagent没有(Gemini cli也是)
那些各式各样的功能比的只是谁抢先推出 终究都能跟上短时间内可以比较各家功能性差异或者特色到最后会像汽车一样各种常规功能都没问题
作者:
ddahg (ddahg)
2026-02-19 16:22:00借串问有没有用Antigravity的...
如果需要特殊功能也可以再出特化专用型AI然后可以看看龙头大厂可以占有多大市场
作者: hidog (.....) 2026-02-19 16:32:00
某y就是在那边吵架不是来讨论的= =|||
作者:
yamakazi (大安吴彦祖)
2026-02-19 16:44:00没吧,不是有人先说我贴人标签(我还问我哪句话贴标签?)再来有人说我把话塞到别人嘴巴,我接着问哪句话我塞到你嘴巴?通通是我没做过的事先造谣到我身上吧XD你看我问这两个问题,他们完全不敢回,就知道他们也找不出到底是哪句话。你还是没回我啊,到底我哪句话塞到你嘴巴,没有的事就是没有,请不要塞到我嘴巴而且公开版面留言并不算骚扰,要引起别人注意谁来这个小众版啊笑死跟骚法定义自己看清楚好吗,又再造谣我骚扰别人原创观点我早就写了啊,我还比你这篇写得早,只不过我写在推文里那你可以把我推文全部删除,我直接回一篇就好
作者:
nckuff (nckuff)
2026-02-19 17:33:00Sonnet4.5我去年九月左右用的 我体感是最近的事 你要说我没在追最新的模型 很low 也可以 能让你把我写进反面教材是我的荣幸
我只看得出来用AI用出了高人一等的感觉到底是人与AI携手共进还是AI淘汰无用人类
作者: pkh1234 2026-02-19 20:05:00
不用讲那么多 考绩会把工程师程度区分开来 跟不上时代的本来就会被天择
作者:
Rust (DOG~R~0.0~)
2026-02-19 20:11:00楼上关键字:OpenClaw
作者: wade2432 (wade2432) 2026-02-19 20:56:00
推这篇文章,一样是说ai好用和某y的水准真的差很多,来引战的总是说自己没有,但是有没有是其他人看的人来定义的不是你觉得没有就没有
作者:
starburs (星爆气流斩)
2026-02-19 23:24:00没有亲眼见证好难体会想请问楼主有实战影片吗 或是有推荐的 谢谢
安装后要设定哪些mcp agent skill或者选用哪个sdd开发 openspec speckit kiro bmad conductor 这些比较适合自己去摸索熟练 另外越熟AI会越累 我帐号没有一周限制 每次都想用爆五小时额度
作者:
neo5277 (I am an agent of chaos)
2026-02-20 02:18:00推cli恐惧症哈哈哈哈哈哈好贴切
skill就自己去研究 smithery和claude code template都有,工具要多摸多研究,没有什么说一句话就解决
作者: Kasima (Kasima) 2026-02-20 10:53:00
cursor没有那么烂,然后web版的chatgpt其实会有奇效,因为搜寻能力极强,可以找出一些极罕见的解决方法
作者: A131381568 (SHADOW) 2026-02-20 12:35:00
推 好人苦口婆心
作者: vansama (抽著菸斗看着书) 2026-02-20 12:50:00
我是用antigravity开opus4.6模型的,也因为我自己还有另外订阅claude code,所以我在使用的时候都会要求antigravity 将整个implemeno与task在root建立一个本地端的md档作为不同工具的切换依据。我自己是发现gemini cli作为本地端厘清业务逻辑是好用的,所以我一般都是使用gemini进行业务逻辑的收束以及QA的测试情境设定(操作型/黑箱测试)后整理出来的情景规格,交由Antigravity(opus)后开始执行,并在token用完后切换成claude cli继续执行
看到一半直接 end,这篇八成也是用 AI 润出来一堆废话,建议文章简练就好不要产一堆没用的赘字,又不是在写书
作者:
ZMTL (夜风/潇湘 VR板已经开板!)
2026-02-20 15:12:00今天我只推antigravity+gemini3.1了XD
真高傲,只看得进去称赞自己的话 XD 你就继续用 AI产废文吧
作者:
VScode (VSisBestIDEinTheWorld)
2026-02-20 16:16:00我也cli苦手 课金叫ai自己把环境设好超爽的
cursor Claude code 都有用,觉得 cursor 没那么烂
作者:
ZooYo (ZooYO_O)
2026-02-20 18:13:00认真好奇Cursor输Claude Code很多吗 现在公司用Cursor 如果差很多会考虑自费学Claude Code
作者:
strlen (strlen)
2026-02-21 10:16:00用不惯CLI的VSCode不都有扩充 都Opus跟Codex都有原厂套件GPT那边甚至还有Codex App 这都不是借口
作者:
Romulus (Säubern Mode)
2026-02-21 23:12:00好耶 我不用写了() 另外Kiro也是Claude体系的不过我没研究他是怎么接的 以计价方式来看应该不是单纯的Claude code VS plugin