因为没有足够的H100来烧
请参照我一月底的文章
https://www.ptt.cc/bbs/Gossiping/M.1737844950.A.7EE.html
"如果有一个更有效率的架构/模型 假设你拿五千张H100就能做出Deepseek R1"
"那些有十万张的公司就能搞出更屌的东西"
Deepseek很好 提出reasoning, multi-head latent attention这两个东西
其他AI公司有资本的抄一抄 马上就赶出一样的东西还超前
Deepseek当下就像是珍珠港时刻 或者美国海军飞行员看到零战在天上飞的瞬间
吓死
但是最后还是工业力胜出 谁财大气粗就能做出更屌的东西
除非今天给Deepseek同等级的财力跟算力 不然有什么新架构横空出世
那些十万张等级的公司训练新模型就是一个礼拜的事情而已
Deepseek比较像是研究中心 不是AI公司 其他家是真的打算把自家的AI服务拿来赚钱
但是Deepseek就是提出一个很屌的东西 但是软件服务没跟上 用户体验下降
就回到其他家 体验更好 模型更屌
※ 引述《markban (马克白)》之铭言:
: 看安卓商店deepseek下载数卡在谷底
: 现在也没什么人讲deepseek
: 讲到ai不是马斯克的grok3
: 就是传统的chatgpt
: 是什么让deepseek光速过气
: 你各位中国人怎么说==