[新闻] 研究机构:DeepSeek硬件GPU支出逾160亿

楼主: cosmite (K)   2025-02-01 16:31:59
研究机构:DeepSeek硬件GPU支出逾160亿台币
https://is.gd/aHRcF6
中央社
张欣瑜报导
编辑:陈慧萍
2025/2/1 11:35
(中央社记者张欣瑜旧金山31日专电)中国新创公司DeepSeek的模型成本引发热议,并且造
成股市震荡。研究机构SemiAnalysis今天发布报告指出,该公司至今在硬件绘图处理器(GP
U)上的支出远超过5亿美元(约新台币160亿元)。
SemiAnalysis指出,中国对冲基金幻方量化(High-Flyer)在2023年5月成立“深度求索”
(DeepSeek)以推动AI技术研发,在此之前,幻方量化于2021年,也就是任何出口管制生效
前,投资购买了1万颗辉达(Nvidia)A100 GPU。
报告指出,该公司在GPU的投资上花费超过5亿美元。
报告称,辉达根据法规要求,生产了多款H100的变化版,如H800、H20。目前仅有H20可销售
给中国。辉达在过去9个月已生产超过100万颗专供中国市场的H20 GPU。
报告分析显示,DeepSeek的服务器总资本支出(CapEx)约为16亿美元。
报告提到,DeepSeek从中国本土招募人才,目前约有150名员工,正急速扩张。
DeepSeek的价格和效能这一周因出现模型训练成本低于600万美元的说法引起讨论。报告强
调预训练成本仅是总成本一小部分,不代表完整支出。
DeepSeek论文中提到的600万美元成本指的是预训练运行(pre-training run)时的GPU成本
,是模型总成本的一部分,未计入的重要支出还包括研发(R&D)、硬件总拥有成本(Total
Cost of Ownership)等关键因素。
报告也提到DeepSeek能获得大量算力资源与出口管制存在时间滞后(lag)有关。
美国智库兰德公司(RAND)研究员海姆(Lennart Heim)近期分析,硬件的出口管制存在时
间滞后,目前尚未完全发挥影响力。真正的考验将出现在数据中心需要升级或扩展时,这对
美国企业较为容易,但对受到出口管制的中国企业而言将是挑战。
SemiAnalysis也评价指出,DeepSeek在开放权重模型上表现出色,超越Meta的Llama 、法国
人工智能新创公司Mistral AI、以及其他竞争者。(编辑:陈慧萍)1140201
心得评论:
研究机构SemiAnalysis报导,DeepSeek宣称的600万美元成本指的是预训练运行(pre-train
ing run)时的GPU成本,是模型总成本的一部分,尚未包含RD与硬件成本。
报导指称,GPU成本约5亿美元,服务器总资本支出(CapEx)约为16亿美元。
美股在惊慌中下跌,目前看似已反应DeepSeek带来的影响?
作者: loom0et0bust (十五夜澪人)   2025-02-01 16:46:00
那又怎样,你买硬件又不会只拿来做一件事情或弄一个模型就丢了…
作者: cityhunter04 (无聊的乖小孩 )   2025-02-01 17:35:00
原来低成本是把设备成本都扣掉?那应该是0元啊!

Links booklink

Contact Us: admin [ a t ] ucptt.com