Re: [问卦] deepseek 到底是不是抄的 风向好乱

楼主: a46911a149 (a149)   2025-01-30 09:55:31
Deepseek AI的训练过程确实有用到蒸馏技术
蒸馏技术,就是在前人制造AI(例如chatgpt)的基础上,
拿别人AI的回答当作训练自己AI的材料
这种作法虽然有点像抄袭他人AI的能力,但在学术界已经是行之有年的做法
各国很多顶尖实验室都用过这种方法训练自己的AI
chatgpt之前也不反对别人拿它的AI的api回答来训练模型
总体来说 deepseek的训练过程其实没什么不光彩的地方,
但确实也不必过分神话deepseek
deepseek 在训练方法与架构上确实有自己的突破与学术贡献在
这方面很值得赞赏
但它也有不少承袭前人的地方,也参考了美国其他机构的开源AI模型
它并不是自己闭门造车,更像是在前人的成果上进一步向上突破
如果没有openai以及其他美国公司机构作为ai的前沿探索
deepseek大概也不太可能无中生有自己生出来
所以抱持客观态度看待即可
不用过分贬低deepseek,但也不必太过轻视openai等美国企业
此外Deepseek愿意分享自己的成果,将自己开源分享自己的模型,
公开自己的技术与模型参数,这也是让人赞赏的
这也是欧美网络上不少人对deepseek有正面评价的原因
这代表每个人都可以免费下载deepseek的原始参数程式
自己复现并改造一个私人版本的deepseek ai,也能参考它的技术挪为己用
所以审查只是枝微末节
因为每个人大可以免费下载一个不需要联网的AI模型
在自己的机器上改掉审查的部分以供自己使用

Links booklink

Contact Us: admin [ a t ] ucptt.com