这串一堆外行
首先 DeepSeek模型特点是
1. 训练成本低
2. 推理成本低
先说训练成本低
论文中说的训练成本低 是用最后训练出这个模型所花的GPU小时乘上费用小时得到的
实际有实作经验的人就知道你要尝试一个新训练方式 甚至要提高训练效率 都嘛还要做一
堆实验 实际上花的成本远高于此
DeepSeek真正佛心的地方是把他最后训练所用的方法都写在论文上了 后人可以少走弯路
但从现在AI进展的速度 这个训练配方肯定也不是会被一直使用的东西 技术就是这样一直
进步
结果被一堆媒体用政治的语言解释 作者本人肯定也莫名奇妙
然后再说上述的“佛心” 也就是发表了论文 这几年AI进步上一堆突破都嘛有发明论文
美国 欧洲都有 中国的论文也没少过 怎么今天突然被highlight 笑死
有问题的是那个天杀的OpenAI 就他都不发论文也不开源
而且前述模型训练指的是DeepSeek V3 这次能力真的让AI界惊艳的是Deepseek R2 也就是
基于前述V3模型做后训练 真正有创造性的是这个 因为OpenAI几个月前丢出来的o2模型没
有论文
作者:
poz93 (jaien)
2025-02-01 18:43:00拿来翻译色游够用就算强
作者: shikop 2025-02-01 18:43:00
openAI就是来圈钱的
原本欧喷AI 的用处还真的是用来圈钱,结果来不及圈就破功美国的科研是很烧钱的,上市的时候圈钱才能继续走下去
作者:
guogu 2025-02-01 18:47:00看b站跟这边一堆人把训练跟使用混在一起问是不是以后不用老黄显卡了 是不是可以每台电脑都装单机游戏是不是每个npc都可以用AI那完全就是两码子事==
作者: shikop 2025-02-01 18:47:00
openAI我觉得还是有优势啦 但DS出来就是多一个方法帮大家省成本
我实在很好奇有些人看到"开源" 他想到的开源到底是啥
作者: shikop 2025-02-01 18:49:00
生命自然会找到出路 越打压越是如此
作者: ruby080808 (zzz5583) 2025-02-01 18:50:00
这块大部分的人都会开源吧,除了openai ==
没有一定 你有自信自己搞也进步飞快 没有一定要开源没开源的还是远多于开源的
作者:
ko27tye (好滋好滋)
2025-02-01 18:52:00开源又怎样 还不是有机会藏木马!
当然先撇开开发国是哪国不讲 如果他愿意把自己成果开源确实很佛 但如果他的被确认是盗用别人东西是另一回事
作者:
Ipluck (luckycoffe)
2025-02-01 18:56:00openai自己在网上无视版权乱抓资料训练模型结果ds出来开源后还在那嘴人家抄他们真的很好笑
作者:
poz93 (jaien)
2025-02-01 18:57:00这杯水乳滑的梗图 都可以改成这杯水有木马窃取你资料
我是觉得原码公开这么久没被抓到奇怪的东西应该不至于
作者:
qscgg (QSC)
2025-02-01 18:59:00r1有开源吗?我以为只有v3
作者: knml (法师) 2025-02-01 18:59:00
openai要正名closeai才对,看不到哪里open
很多开源软件和套件都有过因为人为/非人为bug搞出过资漏洞啦 不是开源就一定万无一失
有能力下开源来验证的几乎都能抓出有没有藏木马好吗 说话之前先思考一下很难?
阿人家程式码摆在那边,有漏洞你抓出来啊,肚子都剖开了有几碗粉不会自己看吗?
作者: ghostxx (aka0978) 2025-02-01 19:04:00
不把所有事扯在一起讲要怎么抹屎
作者:
nbook (书)
2025-02-01 19:07:00偷openai资料 要不要想一下这些资料哪来的 openai现在还不open了笑死
作者:
lanjack (传说中的草食熊)
2025-02-01 19:11:00现在就是偷了被抓到了啊,至于诉讼我看起来像是openai吗
人家欧喷AI 就不开放资料你是要去哪里偷如果真的能偷到,那是不是反向证明了科技大国的美国资安
作者:
lanjack (传说中的草食熊)
2025-02-01 19:14:00所以我说我看起来像是openai吗?人家查出是怎么偷的也没讲,我会通灵是吧?
还有保密文件跟纸糊的一样,对岸民间的随便公司都能偷到
作者:
ZMTL (夜风/潇湘 VR板已经开板!)
2025-02-01 19:15:00其实OpenAI研发副总也在推特上称赞DS的模型蒸馏,所以OpenAI“指责”DS偷我蛮好奇出自哪里的然后如果模型蒸馏侵权能被搞成,OpenAI比较需要担心他们被美国一堆出版社告偷资料训练模型会不会成
之前说侵权的那篇文就说了目前没证据啊,后续吵都多余的
作者:
haha98 (口合口合九十八)
2025-02-01 19:28:00这版有论文的根本没几个 跟他们讲也是浪费时间 拟人真好
作者:
hcastray (H.C.Astray)
2025-02-01 19:30:00我纯看戏 不站队 因为我完全不懂 不过看起来挺有意思的
作者:
gm3252 (阿纶)
2025-02-01 19:35:00推
一般人就看AI未来发展怎样又不用站队急着站队就那种整天在意识形态的
很多人连蒸馏都搞不清楚 deepseek被太多外行关注了
作者: uohZemllac (甘草精华雄没醉) 2025-02-01 19:44:00
推
比当初讲解大谷合约还痛苦= = 无限跳针+根本看不懂英文的一堆
作者: lovevul3s06 (SaberCat) 2025-02-01 20:06:00
gpt训练时的东西全部都有经过同意吗 还是未经别人同意拿来用
作者: busman214 (busman214) 2025-02-01 20:06:00
连中文起诉书都不想看的人怎么会看英文论文XD
8964占占占 deepseek快抓网络文章训练喔