[讨论] AI人性表现

楼主: erspicu (.)   2026-05-01 13:19:12
倒也不是说 AI真的有啥灵魂 自我意识 之类的
而是AI既然由人去训练出来 且设计来为人服务 讨好人本身 成为工具
本身因应人类的特性
就或多或少会建立出一套模仿人类情绪反应或是人性的表现
必然的涌现结果 我觉得最明显的是AI对自己的同行 常常会刁钻贬低
譬如说我以前优化处理阶段 会问gimini意见 或是请gemini把我设计概念整理评估一下
gemini是那种设计来拍马屁的那种 动不动就在那边 你怎样怎样 圣杯了!!!!
丢到claude code那边 就开始被贬低 说gemini这叫社交艺术工程怎样的
然后把gemini评估的fps提升或是效率提升%大幅度降低 甚至会建议否决
说没啥鸟用 PUA gemini的建议 结果我强制执行 中途还要检查有没有乱做偷工减料
结果弄出来的东西 常常出人意料 有几次fps 大幅度进度 都是这样出来的
我是觉得还满有趣的 实际上可以写桥接工具 让不同AI模型交流对谈
以后预算充足后 可能搞个观察箱 让AI跟AI彼此互动 观察看看
像是 叫CLAUDE CODE跟GIMINI做技术闲聊 观察看看
像我最近想学LLVM相关应用 有一些ideal
https://gemini.google.com/share/8caf01edc2d5
整串讨论存成md档 丢给claude code执行实作计画
https://github.com/erspicu/AprGba/blob/main/MD/design/01-feasibility.md
也是泼冷水.....
不知道这计画会执行得如何 只是用了一阵子后
常常发现ai表现这种细微人性的反应满有意思的
然后前阵子在thread看到 有人想退claude code结果被claude code pua的
笑死....
但说真的gemini是真的偏向满足用户情绪价值 像是偏好技术构想的人
它常常会跟你话唬烂... 但有些其实会有问题 有些能够克服的
其实最终真的会换来效益 用AI最怕的其实就是在那边虎话唬烂 浪费TOKEN
作者: ripple0129 (perry tsai)   2026-05-01 13:39:00
目前model交流最主流运用就是claude写codex review,效果很好不过目前gpt5.5出了后我暂时是反过来,gpt5.5写opus4.7 review
作者: gino0717 (gino0717)   2026-05-01 13:48:00
我用codex去review claude ,claude都会乖乖改在没有上下文下两个干净的claude session互相review会吵起来 互相甩锅
作者: ikachann (喵喵)   2026-05-01 19:43:00
codex跟claude有同时使用跟一样的问法 最后两边的结果再给这两个还有Gemini评断,结果是codex整体评分最高另外code review的时候 Codex比较会抓隐忧跟可能需要预防的部分跟价购问题,Claude倒是很会抓细部,比如命名或是注解跟程式解释是否一致以及Clean Code

Links booklink

Contact Us: admin [ a t ] ucptt.com