[心得] 纯粹聊聊AI使用

楼主: cybermeow (我有一只猫)   2026-02-04 02:00:32
也不知道哪根筋不对半夜睡不着来这个基本没在看的版发文
先上个人权

这篇文没有打算细谈任何AI实际应该怎么使用的内容
一方面懒得说二方面我觉得这很因情况而异三方面我也不知道
纯粹想到什么打什么打到我睡着为止
开头放个Andrej Karpathy这篇推特
https://x.com/karpathy/status/2015883857489522876?s=46
我觉得这是最近我看到最符合个人使用经验的文章
网络上充斥许多只有AI很强跟AI没用论点的文章
真正中肯做出分析的反而很难看到 (当然也可能是推荐算法使然
喔对了小小自介一下
我最近的工作比较大的milestone是release了一个叫做nijiv7的动漫风格文生图模型
https://x.com/nijijourney/status/2009714744597643503?s=20
更之前的话则是参与midjourney video 1的开发
我的工作内容基本包涵
- 上千张显卡的模型训练
- 以亿为等级的图片影片数据处理
- 图片影像生成模型的各种调整跟feature development
比较忙的时候可能一天同时会碰到资料处理 训练 跟模型推理的代码
实际工作更杂像我最近就开副本在做别的事情 但上面可以当作是工作的主干
而个人在ai coding这一方面觉得算是经历了三个大的变革
1. chatgpt 出来后复制贴上问答
2. cursor 类型的 ide 直接导入
3. claude code等的自主 ai 代理人
3这一块我们团队也是到最近才开始比较积极探索
主要是opus 4.5, codex等模型让agent能力大幅提升
也让3使用起来带来的效益更大
(个人觉得从hype到实际落地能用通常都需要一段缓冲期
而且比起1 2 要运用好3的learning curve更陡
我最近都开玩笑说vibe coding比coding难 写skill比写code难
现在使用算是2 3混合只有在非常偶尔的情况会把独立的问题用1拿去问不同llm吧
至于模型吗 我们都是用最好的甚至claude code直接开api usage (比 team plan速度快
一个月一个人烧个几百几千美元都有 (还没算cursor跟其他杂七杂八的
ai agent这东西感觉是 用起来其实没这么容易
也没有像网络上大部分讲的这么万能
现在最大的问题基本是context management跟spec
毕竟目前ai还不会读心 他不知道你想做什么
而且就算spec写好了实际跑起来还是会发现常常有遗漏
所以的确是一行code都不用写 其实我去年用cursor就几乎一行code都没写了
但会发现到头来最大的bottleneck还是人类自己
因为人类要负责提出requirement (spec)跟做evaluation
这两件事情并没有这么简单
嘛所以像是brainstorm这种让agent厘清requirement的就很好用
至于evaluation 作为有程式背景的做code review还是最直接的方式
(上面Andrej Karpathy的文也有提到
实际上ai写的code有时候就算是对的
但就是看他的code style或是一些冗余的内容很不爽
至于那些纯vibe完全不看code的人 大概需要不同的evaluation方式吧
但考虑到ml这种超大规模数据处理跟模型训练
坦白讲你不看code你安心吗
你除了看code有什么方式保证他在所有情况的behavior都是对的 我还真不知道
所以说 这东西真的很看情况
网络上kol说了ai多好用 但他们也不会知道怎么把它用在千卡的集群上对吧
我有朋友在银行 或者在quant工作 那边又是完全不同的情况跟问题
每个人都有自己的工作流程目标跟限制
只能在这个为基础来尝试把ai容纳到工作流里面去
是说既然为什么这么麻烦为什么还要用ai agent呢
因为人就是懒 而agent虽然不是万能 但如果用得好
对于偷懒 不对 对于提升工作效率 还是有很大帮助的
大概这样 一时没想到啥要写了 睡觉去起来继续当agent manager
作者: viper9709 (阿达)   2026-02-04 02:07:00
推分享
作者: WTS2accuracy (宝钟海贼団の一味)   2026-02-04 02:15:00
推 那些有用无用一刀切的幻想文根本是废文
作者: RumiManiac (Rumi!)   2026-02-04 02:15:00
强者 推
作者: marra (Marra)   2026-02-04 04:04:00
有份量的人权宣言 ^_^
作者: pacino (carry me)   2026-02-04 07:42:00
如何解决contex window size limit?
作者: kuan (kuan_hiroshi)   2026-02-04 08:23:00
作者: neo5277 (I am an agent of chaos)   2026-02-04 09:17:00
一定还是会看过一遍啊
作者: TKB5566 (我们的元首阿道夫希特勒)   2026-02-04 09:43:00
真的很多人觉得ai是废文制造机
作者: watashino (我同学数学很烂)   2026-02-04 10:21:00
目前用下来context还是很大的问题 有时候还是要使用1
作者: yamakazi (大安吴彦祖)   2026-02-04 10:25:00
楼上 完全不用1 要把任务拆成小张票 每个票大概几次对话就可以完成 然后就叫ai commit写message不知道怎么拆叫ai帮你拆
作者: watashino (我同学数学很烂)   2026-02-04 11:14:00
不是你说的问题在大型专案中 这种agent一定是用rag的形式做 少数状况下才会读全文这种context不全很容易出问题
作者: ybite (小犬/小B)   2026-02-04 11:34:00
我用Claude Code VS Code Plugin 喂给它我要改的档案 跟它说我想干嘛 它就左翻右翻 看完开始改 改完跑测试 好了但还是会在很难预料到的地方出差错 或者鬼打墙
作者: yamakazi (大安吴彦祖)   2026-02-04 11:35:00
我只能说 divide and conquer
作者: ybite (小犬/小B)   2026-02-04 11:37:00
长期下来我认为程式码跟文件整理这种硬功夫 即便到了AI时代还是十分重要 即便你可能文件不是写给人看的(Skill之类)
作者: prag222 (prag)   2026-02-04 11:50:00
我用ai写自制小工具,有bug,杀进去看,解掉不用5分钟,文件就算了,写文件是想放轻松吃工作时数的吧,写文件还用zip档版控用ai写code 也不存在coding stlye问题,那是人类手工才需要规范,说实在话现在ai还比人工稳,至少不会搞诈欺摸工时拖延症跟埋雷
作者: yamakazi (大安吴彦祖)   2026-02-04 12:12:00
Coding style没差啦,用clang formatt 自动化style就好。早就没人在手打调整style了
楼主: cybermeow (我有一只猫)   2026-02-04 12:19:00
我厘清一下 我这里coding style包含用什么library 或者一些更接近architecture design的问题 哪些函数在哪里 做什么等等
作者: v86861062 (数字人:3)   2026-02-04 12:39:00
推推
作者: dani1992 (dani)   2026-02-04 12:51:00
推推
作者: Obama19 (^_^)   2026-02-04 13:47:00
网红永远只跟你介绍实现todo app的效果 真正有价值的内容 没有人会分享出来 都要自己试过才知道有哪些坑一堆范式随着model越来越强 很多都可以丢了
作者: TiredEvance (Evance)   2026-02-04 13:59:00
谢分享!
作者: ian90911 (xopowo)   2026-02-04 15:44:00
感谢分享
作者: kyrie77 (NTU KI)   2026-02-04 23:31:00
感谢大大分享,使用历程一模一样,导致最近在找工作的时候变成额外会思考工作目前导入哪种AI coding tool,很好奇大大有这方面的经验吗(从Team Lead/ Manager/ 企业方视角出发)?现在玩过Claude Code和Cursor之后,这两年来AI帮我写的code比例越来越高,但面试时听到有些企业好像没有买这些工具,或是用自架的Qwen等模型,但使用体感跟商用模型还是差很多… 像是大大文章中提及的其他领域也很好奇他们业内的情况XD (刚好昨天看到Anthropic又让美股软件股集体跳水…)
作者: prag222 (prag)   2026-02-05 03:35:00
我朋友大公司都有买AI服务,你面试的公司不够大间吧,哈我个人是写提示词写小工具,一行CODE都不用手key
作者: louner (louner)   2026-02-05 09:08:00
好奇你们怎么把agent用在ML上的 我只用来做些小修补 像是实作GRPO变种 写log与monitor逻辑等我懒得写的部分 或让agents reproduce某个GitHub的实验成果 不得不说他们省下大量我自己写的时间 但真的要上prod我还是没那个胆子XDcontext window可以用multi agent缓解 譬如让一个agent delegate tasks到多个sub agnets等与把那些tasks的context从主线任务切出去 当然主线任务太长还是没救
作者: deltasxxk (bighao)   2026-02-05 10:39:00
所以最终还是回归 逻辑清楚 定义明确才是效率能否提高的关键,原本工作就不明不白的人用AI就是灾难
作者: ripple0129 (perry tsai)   2026-02-05 18:48:00
观念还没转变而已,未来没在看code了,就是产出大量测试码各种行为与边界测试。时代在转变,人类介入就是低效而已。人类越少介入越好,未来连决策次数都还要再降低,当速度越快,成品完成丢弃的成本越低,直接做完你看行不行这样是未来的方式。
作者: bitcch (必可取)   2026-02-05 20:54:00
人类介入的点不会再是敲键盘产code 而是指挥管理大量agent
作者: wulouise (在线上!=在电脑前)   2026-02-05 21:15:00
有style很烂,像是std::chrono duration一直用count
作者: zzshcool (台湾人)   2026-02-05 22:14:00
推,实际用起来,rule skill,还要管理context 更新让后续接手agent 能衔接,要搞大系统不容易
作者: wizozd84070   2026-02-06 05:19:00
雀有

Links booklink

Contact Us: admin [ a t ] ucptt.com