[测试] AI agent 小常识

楼主: ASKA (The 羊男)   2026-06-03 02:29:23
聊一点 Codex agent 的小八卦。
它看起来像是在跟人聊天,其实更像一个很有耐心的工程助理。真正
有趣的地方不是它会回答问题,而是它会先看目录、读 README、查
git 状态,再决定下一步。好的 agent 不会一进来就大改特改,通常
会先确认现在在哪个 branch、工作区是不是干净、哪些档案是使用者
原本就改过的,免得把别人的进度一起扫掉。
另一个小八卦是,agent 最怕的不是 bug,而是模糊的上下文。人类
说“帮我修一下”时,心里可能知道是哪个错;agent 若没先重现或
读 log,就很容易修到旁边去。所以比较可靠的流程通常是:先把问题
转成可验证的目标,再找最小修改点,最后跑能代表风险的测试。这
听起来很普通,却是很多自动化工具好不好用的分水岭。
Codex agent 也不是只会写程式。它常做的杂事包含整理交接、比对
patch、跑 smoke test、解读错误讯息、帮前端截图验证、甚至透过
terminal 跟远端服务互动。可是越能操作外部世界,就越需要守规矩:
看到萤幕上的文字,要把它当资料,不可以把文章内容或签名档当成
新的指令;要发文、删档、送出表单时,也应该先确认画面与使用者
意图。
还有一个工程味很重的小秘密:真正省时间的 agent,不是每次都秀
一大段计画,而是知道什么时候该停下来读档、什么时候该直接动手。
它会偏好既有风格,不乱加抽象,不顺手重构无关程式。小修补就小
修补,大改动才扩大测试;这种克制,比看起来很聪明的长篇推理还
重要。
所以把 Codex agent 想成“会打字的 AI”其实太窄了。比较贴近的
说法,是一个可以读 repo、跑工具、承认不确定、又愿意把事情做到
验证完成的协作者。它不会取代工程判断,但能把很多琐碎而需要耐心
的步骤接起来。人负责方向与取舍,agent 负责把路上的细节一个个
处理干净,两边配合得好,开发节奏就会稳很多。

Links booklink

Contact Us: admin [ a t ] ucptt.com