Re: [问卦] deepseek 到底是不是抄的风向好乱 a46911a149 PTT批踢踢实业坊

Re: [问卦] deepseek 到底是不是抄的风向好乱

楼主: a46911a149 (a149) 2025-01-30 09:55:31

Deepseek AI的训练过程确实有用到蒸馏技术
蒸馏技术，就是在前人制造AI(例如chatgpt)的基础上，
拿别人AI的回答当作训练自己AI的材料
这种作法虽然有点像抄袭他人AI的能力，但在学术界已经是行之有年的做法
各国很多顶尖实验室都用过这种方法训练自己的AI
chatgpt之前也不反对别人拿它的AI的api回答来训练模型
总体来说 deepseek的训练过程其实没什么不光彩的地方，
但确实也不必过分神话deepseek
deepseek 在训练方法与架构上确实有自己的突破与学术贡献在
这方面很值得赞赏
但它也有不少承袭前人的地方，也参考了美国其他机构的开源AI模型
它并不是自己闭门造车，更像是在前人的成果上进一步向上突破
如果没有openai以及其他美国公司机构作为ai的前沿探索
deepseek大概也不太可能无中生有自己生出来
所以抱持客观态度看待即可
不用过分贬低deepseek，但也不必太过轻视openai等美国企业
此外Deepseek愿意分享自己的成果，将自己开源分享自己的模型，
公开自己的技术与模型参数，这也是让人赞赏的
这也是欧美网络上不少人对deepseek有正面评价的原因
这代表每个人都可以免费下载deepseek的原始参数程式
自己复现并改造一个私人版本的deepseek ai，也能参考它的技术挪为己用
所以审查只是枝微末节
因为每个人大可以免费下载一个不需要联网的AI模型
在自己的机器上改掉审查的部分以供自己使用

继续阅读

Re: [问卦] deepseek这回答到底嗑了多少？Azimech Re: [问卦] deepseek这回答到底嗑了多少？leocean9816 [问卦] 猫食放地上就吃猫猫是饿坏了吗？jerry0505 Re: [问卦] 为何从不检讨每间庙去年国运签准不准？dj720c Re: [问卦] DeepSeek怎么一天就走下神坛?mjh [问卦] deepseek的天才少女不出来救场吗？indium111 [问卦] 今天小诊所看病挂号费要600？xz4979265 Re: [新闻] OpenAI：已掌握DeepSeek盗用模型证据cloud72426 Re: [问卦] 为啥餐饮二代都不忍手艺失传放弃高薪？YU0121 Re: [问卦] 医师、律师、会计师，哪个最好考nowitzkixd

Re: [问卦] deepseek 到底是不是抄的 风向好乱

Re: [问卦] deepseek 到底是不是抄的风向好乱