Re: [讨论] Claude开始水token

楼主: LDPC (Channel Coding)   2026-04-21 04:52:56
应该会吃紧啊 现在硅谷一堆PR都用claude审 搭配人类
我们算过 一个复杂点PR claude大概花费5~20美金 然后品质比较跟人类比
只要正确搭配人类 可以省下30min ~1hr 我们这边工时一个人都是100美金/hr起跳
现在都是用时间和token费用和品质在换算 结论就是token狂烧 干死对家
比谁的钱多和迭代速度快 然后我们PM也卷起来 跳下来开始干实作 和对接crossfun team
在模型设计上codex使用体感还是比claude 好 这真是出乎意料(参照下方)
有传言codex是MoE设计 claude是dense transformer 理论上后者的逻辑顺序会比较好
但缺点就是计算量和速度偏慢 前者是一定会快的 https://reurl.cc/R2LaWD
但很吃Harness上下文管理设计不然逻辑顺序会乱掉
现在进行式就是 token费用 vs 人类价值 vs 速度产出 vs 系统品质搭建
看到上一篇说LLM/Agent只就只是个语言系统....嗯嗯恩 QQ 我好羡慕那个世界线
现在Agent就干这几件事 拆解问题 选择工具 组合工具解问题 工具结果验证
已经不在是个当纯语言模型的问题了 这也是为啥Harness设计最近很夯
尤其最近一篇ICLR paper已经验证 SFT去训练模型会打输模型加个好的Context设计
原因就是SFT会造成information collapse和失去reasoning ability

Links booklink

Contact Us: admin [ a t ] ucptt.com