Re: [问卦] 研究说AI模型已经能自我进化了耶

楼主: zxwxz (zxwxz)   2025-01-11 22:25:06
微软的这方法就跟Alphago的训练方式一样,但这仅限于单一学科数学做强化学习,而且这
类型问题一定要有标准答案才能这样玩,艺术写作之类的就没办法这样搞,OpenAI的O1就是
大模型用这方法,希望能把推理效应带到不同领域的资料,但现阶段看来非STEM类型的还要
用别种方案当verifier 才能做强化学习
其实最早在2023/10就已经有验证这方案是成功可行的,当时叫QStar
https://youtu.be/jByDZdRxiSs?si=zccB5yK55GW8Ffs1
OpenAI 半年前开始在X上面训练虚拟人物
https://youtu.be/dyFqdHI9yGI?si=od2_hNMs3kuevqo_
看人格化的AI在群体环境下有没有办法做非STEM的强化学习
※ 引述 《jeffguoft (见习生_O7)》 之铭言:
: 标题: [问卦] 研究说AI模型已经能自我进化了耶
: 时间: Sat Jan 11 18:27:27 2025
:  
: 刚看到有人整理的AI新进展
:  
: 现在有研究指出小LLM可以透过deep thinking的方式自我进化
:  
: 在测验中取得比大模型还高的分数
:  
: 没有大模型监督跟人类介入
:  
: 小模型都能自我进化了,不敢想像大模型也用这方式
:  
: 可能随时都要变成超级AI
:  
:  
: 感觉是时候要找一两门艺术领域
:  
: 或者宗教经典来钻研了
:  
: 以便失业后无缝接轨
:  
: 或者不用工作后能探询人生意义
:  
: 大家做好失业的准备了吗?
:  
:  
: https://i.imgur.com/MQLjNDs.png
:  
:

Links booklink

Contact Us: admin [ a t ] ucptt.com