※ 引述《WinNOKIA (海神)》之铭言:
: 1. DeepSeek创办人梁文锋,少年股神变AI大神
: 2. 纽约时报指出,DeepSeek是由中国对冲基金幻方量化(High-Flyer)创办
: 3. DeepSeek 宣称,训练成本仅 557.6 万美元,几乎是其他科技巨头大型语言模型的
十
: 分之一成本,这个费用也差不多是一位 AI 主管的年薪而已。
: 综合以上媒体报导与揭露来看,DeepSeek是什么状况,不就很清楚了吗?
来看看大神Andrej Karpathy是怎么评论的
Andrej Karpathy
https://i.imgur.com/WYEHc65.jpeg
首先要打脸的是第二点
DeepSeek告诉大家,他是利用2048片H800 GPU, 经过两个月的时间,训练出来的,训练费
用是550万镁
你训练使用的GPU,可以当成设备成本,给之后的使用来做摊提,一片H80,一个小时租赁
可以到2~3美元/小时
所以用两个月来计算,确实符合550万镁的训练成本
而几乎所有AI 模型都是给你训练成本,这点DeepSeek没有不同
这也是为什么Andrej Karpathy会说这是如同“笑话般的预算” 因为他是其他模型训练的
1/10~1/20的价格
对照财政部某官员在某财经网美下面被喷到删留言的事情~嗯 我只能说有这种言论不意
外
https://i.imgur.com/SviWZpc.jpeg
至于你说第一点幻方量化是少年股神变AI大神,因为人家本来就是做大数据的,是用大数
据来炒股财富自由以后才来玩AI,顺序不能搞错