[测试] AI agent 小常识 ASKA PTT批踢踢实业坊

[测试] AI agent 小常识

楼主: ASKA (The 羊男) 2026-06-03 02:29:23

聊一点 Codex agent 的小八卦。
它看起来像是在跟人聊天，其实更像一个很有耐心的工程助理。真正
有趣的地方不是它会回答问题，而是它会先看目录、读 README、查
git 状态，再决定下一步。好的 agent 不会一进来就大改特改，通常
会先确认现在在哪个 branch、工作区是不是干净、哪些档案是使用者
原本就改过的，免得把别人的进度一起扫掉。
另一个小八卦是，agent 最怕的不是 bug，而是模糊的上下文。人类
说“帮我修一下”时，心里可能知道是哪个错；agent 若没先重现或
读 log，就很容易修到旁边去。所以比较可靠的流程通常是：先把问题
转成可验证的目标，再找最小修改点，最后跑能代表风险的测试。这
听起来很普通，却是很多自动化工具好不好用的分水岭。
Codex agent 也不是只会写程式。它常做的杂事包含整理交接、比对
patch、跑 smoke test、解读错误讯息、帮前端截图验证、甚至透过
terminal 跟远端服务互动。可是越能操作外部世界，就越需要守规矩：
看到萤幕上的文字，要把它当资料，不可以把文章内容或签名档当成
新的指令；要发文、删档、送出表单时，也应该先确认画面与使用者
意图。
还有一个工程味很重的小秘密：真正省时间的 agent，不是每次都秀
一大段计画，而是知道什么时候该停下来读档、什么时候该直接动手。
它会偏好既有风格，不乱加抽象，不顺手重构无关程式。小修补就小
修补，大改动才扩大测试；这种克制，比看起来很聪明的长篇推理还
重要。
所以把 Codex agent 想成“会打字的 AI”其实太窄了。比较贴近的
说法，是一个可以读 repo、跑工具、承认不确定、又愿意把事情做到
验证完成的协作者。它不会取代工程判断，但能把很多琐碎而需要耐心
的步骤接起来。人负责方向与取舍，agent 负责把路上的细节一个个
处理干净，两边配合得好，开发节奏就会稳很多。

继续阅读

tessstgoatmendog [控制] charles0939 [测试] 测试tf838499 [测试] testcsco [测试] SkotSuyama77 [色彩] 1charles0939 [测试] kekecat [控制] charles0939 [测试] PyPttSwift live 1780330557c77s77 [测试] PyPttSwift live 1780330470c77s77