[讨论] AGI 评鉴/预测

楼主: AmosYang (泛用人型编码器)   2025-07-04 11:56:47
对 AGI (Artificial General Intelligence) 的进展有兴趣的话可以看看
https://arcprize.org/ 这个 AGI 评鉴系统,尤其是试玩一下它的 2025 年版的
ARG-AGI-2 题目 ( https://arcprize.org/play ),
* 看看你觉得这样的题目对人脑来说的难易度
* 看看你觉得“符号解读、组合推理、上下文规则应用”是否为 AGI 的必要条件
* 看看你觉得这些题组是否能有效测量“符号解读、组合推理、上下文规则应用”
然后参考以下数据 ( https://arcprize.org/leaderboard ):
* 人脑最高分是 100%, 每个工作项目成本 $17
* 最高分的 AI (Claude Opus 4) 得分 8.6%, 每个工作项目成本 $1.93
* 次高分的 AI (ChatGPT o3) 得分 6.5%, 每个工作项目成本 $0.834
* “纯 LLM” AI 最高分数 1.3%
2019~2024 年使用的 ARC-AGI-1 题目, AI 最高得分是约 75% 。
另一个可以参考的网站是 https://theagiclock.com/ ,预测 AGI 到来的时间
(以及解释它预测的根据); 可以 3~6 个月后来看看 AGI 的进展是线性、指数
,还是卡关。
作者: jamesho8743 (加拿大好美)   2025-07-04 12:24:00
有意思的网站 谢分享
作者: attacksoil (击壤)   2025-07-04 12:36:00
有趣
作者: haudoing (阿华平凡版)   2025-07-07 16:43:00
还蛮好玩的我还没输XD
作者: KAOKAOKAO (鬼斗)   2025-07-09 08:54:00
本以为是抬杠文 内容是有料资讯 建议标题扩充
作者: CoNsTaR ((const *))   2025-08-02 14:34:00
最近有一篇论文用一个 27M (对,27M 不是 27b) parameters 的 recurrent network 没有 pre-training,训练只用了1000 steps 就达到 40%

Links booklink

Contact Us: admin [ a t ] ucptt.com