研究机构:DeepSeek硬件GPU支出逾160亿台币
2025/2/1 11:35
中央社
记者张欣瑜旧金山31日专电
中国新创公司DeepSeek的模型成本引发热议,并且造成股市震荡。研究机构SemiAnalysis
今天发布报告指出,该公司至今在硬件绘图处理器(GPU)上的支出远超过5亿美元(约新
台币160亿元)。
SemiAnalysis指出,中国对冲基金幻方量化(High-Flyer)在2023年5月成立“深度求索
”(DeepSeek)以推动AI技术研发,在此之前,幻方量化于2021年,也就是任何出口管制
生效前,投资购买了1万颗辉达(Nvidia)A100 GPU。
报告指出,该公司在GPU的投资上花费超过5亿美元。
报告称,辉达根据法规要求,生产了多款H100的变化版,如H800、H20。目前仅有H20可销
售给中国。辉达在过去9个月已生产超过100万颗专供中国市场的H20 GPU。
报告分析显示,DeepSeek的服务器总资本支出(CapEx)约为16亿美元。
报告提到,DeepSeek从中国本土招募人才,目前约有150名员工,正急速扩张。
DeepSeek的价格和效能这一周因出现模型训练成本低于600万美元的说法引起讨论。报告
强调预训练成本仅是总成本一小部分,不代表完整支出。
DeepSeek论文中提到的600万美元成本指的是预训练运行(pre-training run)时的GPU成
本,是模型总成本的一部分,未计入的重要支出还包括研发(R&D)、硬件总拥有成本(
Total Cost of Ownership)等关键因素。
报告也提到DeepSeek能获得大量算力资源与出口管制存在时间滞后(lag)有关。
美国智库兰德公司(RAND)研究员海姆(Lennart Heim)近期分析,硬件的出口管制存在
时间滞后,目前尚未完全发挥影响力。真正的考验将出现在数据中心需要升级或扩展时,
这对美国企业较为容易,但对受到出口管制的中国企业而言将是挑战。
SemiAnalysis也评价指出,DeepSeek在开放权重模型上表现出色,超越Meta的Llama 、法
国人工智能新创公司Mistral AI、以及其他竞争者。(编辑:陈慧萍)1140201
https://www.cna.com.tw/news/ait/202502010071.aspx
果然又是中国式大外宣吗...
急着抛售股票的人现在正在想什么?
0.0?