Re: [姆咪] 有ai大师吗 lou3612 PTT批踢踢实业坊

Re: [姆咪] 有ai大师吗

楼主: lou3612 (鱼) 2025-01-28 14:07:55

※ 引述《umi0912umi (赤井はあとのぶた)》之铭言：
: 那个deepseek我看有人在说他是RL
: 然后用无监督
: 但我记得transformer不也是无监督吗
: deepseek有哪边比较特别吗
: 然后我觉得这张图很好笑
: https://i.imgur.com/aka2y5t.jpeg
差很多
一时半刻有点难说清楚
RL比较少人说是无监督应该说是自动监督?
不论如何都比supervised便宜很多很多
deepseek只用了一点点SFT来稳定模型的行为
然后就全用RL来冲performance
所以就比一般的LLM很要省钱省非常非常多

继续阅读

[闲聊] 版友们来看姆咪做的马铃薯沙拉scps920113 [闲聊] 娼妓路gggiantguy [BGD] 想冲撞25时的请进ILoveMegumin Re: [ZZZ] 1.6的内鬼资讯更新pan46 Re: [闲聊] 以后你板的文章会不会一堆AI写的yangjam [闲聊] 恶萝啥时毕业yangjam Re: [闲聊] 以后你板的文章会不会一堆AI写的PogChampLUL [BGD] 今天怎么才礼拜二yangjam 红红救命板友救救我ErLKYgyLFzh Re: [闲聊] “素炮”算是线虫吗wangyc