[姆咪] 所以DeepSeek用了OpenAI的模型

楼主: kerycheng (kk)   2025-01-30 13:14:41
用别人训练好的模型再去做distillation这种事情超常见吧
学术界的那些人搞不好比较关心的是他R1是怎么做的吧
作者: Pyke (不切不辣)   2025-01-30 13:17:00
中国赢2次
作者: reader2714 (无毁的湖光)   2025-01-30 13:18:00
不是有论文

Links booklink

Contact Us: admin [ a t ] ucptt.com