[心得] 纯粹聊聊AI使用 cybermeow PTT批踢踢实业坊

[心得] 纯粹聊聊AI使用

楼主: cybermeow (我有一只猫) 2026-02-04 02:00:32

也不知道哪根筋不对半夜睡不着来这个基本没在看的版发文
先上个人权

这篇文没有打算细谈任何AI实际应该怎么使用的内容
一方面懒得说二方面我觉得这很因情况而异三方面我也不知道
纯粹想到什么打什么打到我睡着为止
开头放个Andrej Karpathy这篇推特
https://x.com/karpathy/status/2015883857489522876?s=46
我觉得这是最近我看到最符合个人使用经验的文章
网络上充斥许多只有AI很强跟AI没用论点的文章
真正中肯做出分析的反而很难看到 (当然也可能是推荐算法使然
喔对了小小自介一下
我最近的工作比较大的milestone是release了一个叫做nijiv7的动漫风格文生图模型
https://x.com/nijijourney/status/2009714744597643503?s=20
更之前的话则是参与midjourney video 1的开发
我的工作内容基本包涵
- 上千张显卡的模型训练
- 以亿为等级的图片影片数据处理
- 图片影像生成模型的各种调整跟feature development
比较忙的时候可能一天同时会碰到资料处理训练跟模型推理的代码
实际工作更杂像我最近就开副本在做别的事情但上面可以当作是工作的主干
而个人在ai coding这一方面觉得算是经历了三个大的变革
1. chatgpt 出来后复制贴上问答
2. cursor 类型的 ide 直接导入
3. claude code等的自主 ai 代理人
3这一块我们团队也是到最近才开始比较积极探索
主要是opus 4.5, codex等模型让agent能力大幅提升
也让3使用起来带来的效益更大
(个人觉得从hype到实际落地能用通常都需要一段缓冲期
而且比起1 2 要运用好3的learning curve更陡
我最近都开玩笑说vibe coding比coding难写skill比写code难
现在使用算是2 3混合只有在非常偶尔的情况会把独立的问题用1拿去问不同llm吧
至于模型吗我们都是用最好的甚至claude code直接开api usage (比 team plan速度快
一个月一个人烧个几百几千美元都有 (还没算cursor跟其他杂七杂八的
ai agent这东西感觉是用起来其实没这么容易
也没有像网络上大部分讲的这么万能
现在最大的问题基本是context management跟spec
毕竟目前ai还不会读心他不知道你想做什么
而且就算spec写好了实际跑起来还是会发现常常有遗漏
所以的确是一行code都不用写其实我去年用cursor就几乎一行code都没写了
但会发现到头来最大的bottleneck还是人类自己
因为人类要负责提出requirement (spec)跟做evaluation
这两件事情并没有这么简单
嘛所以像是brainstorm这种让agent厘清requirement的就很好用
至于evaluation 作为有程式背景的做code review还是最直接的方式
(上面Andrej Karpathy的文也有提到
实际上ai写的code有时候就算是对的
但就是看他的code style或是一些冗余的内容很不爽
至于那些纯vibe完全不看code的人大概需要不同的evaluation方式吧
但考虑到ml这种超大规模数据处理跟模型训练
坦白讲你不看code你安心吗
你除了看code有什么方式保证他在所有情况的behavior都是对的我还真不知道
所以说这东西真的很看情况
网络上kol说了ai多好用但他们也不会知道怎么把它用在千卡的集群上对吧
我有朋友在银行或者在quant工作那边又是完全不同的情况跟问题
每个人都有自己的工作流程目标跟限制
只能在这个为基础来尝试把ai容纳到工作流里面去
是说既然为什么这么麻烦为什么还要用ai agent呢
因为人就是懒而agent虽然不是万能但如果用得好
对于偷懒不对对于提升工作效率还是有很大帮助的
大概这样一时没想到啥要写了睡觉去起来继续当agent manager

作者: viper9709 (阿达) 2026-02-04 02:07:00

推分享

作者: WTS2accuracy (宝钟海贼団の一味) 2026-02-04 02:15:00

推那些有用无用一刀切的幻想文根本是废文

作者: RumiManiac (Rumi!) 2026-02-04 02:15:00

强者推

作者: marra (Marra) 2026-02-04 04:04:00

有份量的人权宣言 ^_^

作者: pacino (carry me) 2026-02-04 07:42:00

如何解决contex window size limit?

作者: kuan (kuan_hiroshi) 2026-02-04 08:23:00

推

作者: neo5277 (I am an agent of chaos) 2026-02-04 09:17:00

一定还是会看过一遍啊

作者: TKB5566 (我们的元首阿道夫希特勒) 2026-02-04 09:43:00

真的很多人觉得ai是废文制造机

作者: watashino (我同学数学很烂) 2026-02-04 10:21:00

目前用下来context还是很大的问题有时候还是要使用1

作者: yamakazi (大安吴彦祖) 2026-02-04 10:25:00

楼上完全不用1 要把任务拆成小张票每个票大概几次对话就可以完成然后就叫ai commit写message不知道怎么拆叫ai帮你拆

作者: watashino (我同学数学很烂) 2026-02-04 11:14:00

不是你说的问题在大型专案中这种agent一定是用rag的形式做少数状况下才会读全文这种context不全很容易出问题

作者: ybite (小犬/小B) 2026-02-04 11:34:00

我用Claude Code VS Code Plugin 喂给它我要改的档案跟它说我想干嘛它就左翻右翻看完开始改改完跑测试好了但还是会在很难预料到的地方出差错或者鬼打墙

作者: yamakazi (大安吴彦祖) 2026-02-04 11:35:00

我只能说 divide and conquer

作者: ybite (小犬/小B) 2026-02-04 11:37:00

长期下来我认为程式码跟文件整理这种硬功夫即便到了AI时代还是十分重要即便你可能文件不是写给人看的（Skill之类）

作者: prag222 (prag) 2026-02-04 11:50:00

我用ai写自制小工具,有bug,杀进去看，解掉不用5分钟，文件就算了，写文件是想放轻松吃工作时数的吧，写文件还用zip档版控用ai写code 也不存在coding stlye问题，那是人类手工才需要规范，说实在话现在ai还比人工稳，至少不会搞诈欺摸工时拖延症跟埋雷

作者: yamakazi (大安吴彦祖) 2026-02-04 12:12:00

Coding style没差啦，用clang formatt 自动化style就好。早就没人在手打调整style了

楼主: cybermeow (我有一只猫) 2026-02-04 12:19:00

我厘清一下我这里coding style包含用什么library 或者一些更接近architecture design的问题哪些函数在哪里做什么等等

作者: v86861062 (数字人:3) 2026-02-04 12:39:00

推推

作者: dani1992 (dani) 2026-02-04 12:51:00

推推

作者: Obama19 (^_^) 2026-02-04 13:47:00

网红永远只跟你介绍实现todo app的效果真正有价值的内容没有人会分享出来都要自己试过才知道有哪些坑一堆范式随着model越来越强很多都可以丢了

作者: TiredEvance (Evance) 2026-02-04 13:59:00

谢分享！

作者: ian90911 (xopowo) 2026-02-04 15:44:00

感谢分享

作者: kyrie77 (NTU KI) 2026-02-04 23:31:00

感谢大大分享，使用历程一模一样，导致最近在找工作的时候变成额外会思考工作目前导入哪种AI coding tool，很好奇大大有这方面的经验吗（从Team Lead/ Manager/ 企业方视角出发）？现在玩过Claude Code和Cursor之后，这两年来AI帮我写的code比例越来越高，但面试时听到有些企业好像没有买这些工具，或是用自架的Qwen等模型，但使用体感跟商用模型还是差很多… 像是大大文章中提及的其他领域也很好奇他们业内的情况XD (刚好昨天看到Anthropic又让美股软件股集体跳水…）

作者: prag222 (prag) 2026-02-05 03:35:00

我朋友大公司都有买AI服务,你面试的公司不够大间吧,哈我个人是写提示词写小工具,一行CODE都不用手key

作者: louner (louner) 2026-02-05 09:08:00

好奇你们怎么把agent用在ML上的我只用来做些小修补像是实作GRPO变种写log与monitor逻辑等我懒得写的部分或让agents reproduce某个GitHub的实验成果不得不说他们省下大量我自己写的时间但真的要上prod我还是没那个胆子XDcontext window可以用multi agent缓解譬如让一个agent delegate tasks到多个sub agnets等与把那些tasks的context从主线任务切出去当然主线任务太长还是没救

作者: deltasxxk (bighao) 2026-02-05 10:39:00

所以最终还是回归逻辑清楚定义明确才是效率能否提高的关键，原本工作就不明不白的人用AI就是灾难

作者: ripple0129 (perry tsai) 2026-02-05 18:48:00

观念还没转变而已，未来没在看code了，就是产出大量测试码各种行为与边界测试。时代在转变，人类介入就是低效而已。人类越少介入越好，未来连决策次数都还要再降低，当速度越快，成品完成丢弃的成本越低，直接做完你看行不行这样是未来的方式。

作者: bitcch (必可取) 2026-02-05 20:54:00

人类介入的点不会再是敲键盘产code 而是指挥管理大量agent

作者: wulouise (在线上!=在电脑前) 2026-02-05 21:15:00

有style很烂，像是std::chrono duration一直用count

作者: zzshcool (台湾人) 2026-02-05 22:14:00

推，实际用起来，rule skill，还要管理context 更新让后续接手agent 能衔接，要搞大系统不容易

作者: wizozd84070 2026-02-06 05:19:00

雀有

作者: ZMTL (夜风/潇湘 VR板已经开板!) 2026-02-09 16:28:00

那要转回AI板吗XDD

作者: CaptPlanet (ep) 2026-02-09 22:11:00

好奇大家有实际算过或是大概估算过纯人工或原 PO 1方法跟 2, 3 之间的产出效率提升多少吗

作者: bndan (seed) 2026-02-12 10:14:00

用Ai配合完成工作工时要放够大取代位置就要够深所以未来程式码就直接像机码一样没什么人会去看会看的是更上层的设计工作流程这个也是只能工程师做因为需要将ai遇到不明或是困难时导回或提取代方案（甚至是实际设计逻辑） ==只能说写程式层级架的越高产生的工作量能越大但难度也是一直叠上去（越来越多黑盒子失去对应工具想直接从最根层找问题更难）这种情况下几乎没办法摆个菜的..更别说连训练都没有的至少现在是这样

作者: viper9709 (阿达) 2026-02-12 16:38:00

推楼上

继续阅读

[问卷] 生成式 AI 对工作绩效的影响（结束）hina0502 [讨论] 不建议考虑地端 modelTonyQ Fw: [系统] Gemini AI共同设计 Cosmos 编程语言 C!!amidha [征才]法务部调查局资安分析师LittleRuiRui [技术分享] 揭秘百万级 TPS 核心：Open Exchangemediashow009 Re: [讨论] 有人开始使用clawdbot了吗Fixble3203 [讨论] 有人开始使用clawdbot了吗ripple0129 [心得] QA更应该拥抱AI技术，而不是害怕被其取代gigayaya Re: [讨论] 华硕开始用AI取代人力了(?)TonyQ Re: [请益] 硕毕后选择nuhciewc