Re: [姆咪] 有ai大师吗

楼主: umi0912umi (UMI)   2025-01-28 14:57:30
※ 引述《lou3612 ( )》之铭言:
: 差很多
: 一时半刻有点难说清楚
: RL比较少人说是无监督 应该说是自动监督?
: 不论如何都比supervised便宜很多很多
: deepseek只用了一点点SFT来稳定模型的行为
: 然后就全用RL来冲performance
: 所以就比一般的LLM很要省钱省非常非常多
transformer我记得不是靠遮掉某部分然后自己学
是说自动监督跟无监督差在哪
我已经都不懂惹QQ
但我只是好奇RL不是蛮久前的东西
前阵子我看几乎都是在讨论transformer
突然RL又冒出来好神奇
反清复明惹属于是
作者: HGK (HGK)   2025-01-28 14:59:00
RL百炼不垂 好用
作者: steven183 (steven183183)   2025-01-28 15:03:00
transformer是监督吧 我回第一篇ㄉ
楼主: umi0912umi (UMI)   2025-01-28 15:05:00
是喔 那我搞错惹QQ

Links booklink

Contact Us: admin [ a t ] ucptt.com