Re: [问卦] 研究说AI模型已经能自我进化了耶 zxwxz PTT批踢踢实业坊

Re: [问卦] 研究说AI模型已经能自我进化了耶

楼主: zxwxz (zxwxz) 2025-01-11 22:25:06

微软的这方法就跟Alphago的训练方式一样，但这仅限于单一学科数学做强化学习，而且这
类型问题一定要有标准答案才能这样玩，艺术写作之类的就没办法这样搞，OpenAI的O1就是
大模型用这方法，希望能把推理效应带到不同领域的资料，但现阶段看来非STEM类型的还要
用别种方案当verifier 才能做强化学习
其实最早在2023/10就已经有验证这方案是成功可行的，当时叫QStar
https://youtu.be/jByDZdRxiSs?si=zccB5yK55GW8Ffs1
OpenAI 半年前开始在X上面训练虚拟人物
https://youtu.be/dyFqdHI9yGI?si=od2_hNMs3kuevqo_
看人格化的AI在群体环境下有没有办法做非STEM的强化学习
※ 引述《jeffguoft (见习生_O7)》之铭言：
: 标题: [问卦] 研究说AI模型已经能自我进化了耶
: 时间: Sat Jan 11 18:27:27 2025
: 　
: 刚看到有人整理的AI新进展
: 　
: 现在有研究指出小LLM可以透过deep thinking的方式自我进化
: 　
: 在测验中取得比大模型还高的分数
: 　
: 没有大模型监督跟人类介入
: 　
: 小模型都能自我进化了，不敢想像大模型也用这方式
: 　
: 可能随时都要变成超级AI
: 　
: 　
: 感觉是时候要找一两门艺术领域
: 　
: 或者宗教经典来钻研了
: 　
: 以便失业后无缝接轨
: 　
: 或者不用工作后能探询人生意义
: 　
: 大家做好失业的准备了吗？
: 　
: 　
: https://i.imgur.com/MQLjNDs.png
: 　
:

继续阅读

[问卦] 00后有很惨吗？ALEX492 Re: [问卦] 敖犬去兄弟婚礼包3600真的太少吗?DustToDust [新闻] 日网友买“毛巾界爱马仕”回家看竟是中iamshana [问卦] 焦糖哥哥念社会系,怎没人骂他捡角？pprino [新闻] 按摩妹“拒肉偿”遭凌虐性侵！被毛巾勒xuein [问卦] 3000蟑螂是什么时候开始的啊？chouvincent [问卦] 台湾双硕士买不起2000万的房？democrat [问卦] 刘德华梁家辉谁的五亿探长较写实？zxc881230 [新闻] 王鸿薇造谣8年拿3亿颜圣纮晒金额：不够kcbill [问卦] 到底什么是更大的民主？jimlexus