[新闻] 研究机构：DeepSeek硬件GPU支出逾160亿 cosmite PTT批踢踢实业坊

[新闻] 研究机构：DeepSeek硬件GPU支出逾160亿

楼主: cosmite (K) 2025-02-01 16:31:59

研究机构：DeepSeek硬件GPU支出逾160亿台币
https://is.gd/aHRcF6
中央社
张欣瑜报导
编辑：陈慧萍
2025/2/1 11:35
（中央社记者张欣瑜旧金山31日专电）中国新创公司DeepSeek的模型成本引发热议，并且造
成股市震荡。研究机构SemiAnalysis今天发布报告指出，该公司至今在硬件绘图处理器（GP
U）上的支出远超过5亿美元（约新台币160亿元）。
SemiAnalysis指出，中国对冲基金幻方量化（High-Flyer）在2023年5月成立“深度求索”
（DeepSeek）以推动AI技术研发，在此之前，幻方量化于2021年，也就是任何出口管制生效
前，投资购买了1万颗辉达（Nvidia）A100 GPU。
报告指出，该公司在GPU的投资上花费超过5亿美元。
报告称，辉达根据法规要求，生产了多款H100的变化版，如H800、H20。目前仅有H20可销售
给中国。辉达在过去9个月已生产超过100万颗专供中国市场的H20 GPU。
报告分析显示，DeepSeek的服务器总资本支出（CapEx）约为16亿美元。
报告提到，DeepSeek从中国本土招募人才，目前约有150名员工，正急速扩张。
DeepSeek的价格和效能这一周因出现模型训练成本低于600万美元的说法引起讨论。报告强
调预训练成本仅是总成本一小部分，不代表完整支出。
DeepSeek论文中提到的600万美元成本指的是预训练运行（pre-training run）时的GPU成本
，是模型总成本的一部分，未计入的重要支出还包括研发（R&D）、硬件总拥有成本（Total
Cost of Ownership）等关键因素。
报告也提到DeepSeek能获得大量算力资源与出口管制存在时间滞后（lag）有关。
美国智库兰德公司（RAND）研究员海姆（Lennart Heim）近期分析，硬件的出口管制存在时
间滞后，目前尚未完全发挥影响力。真正的考验将出现在数据中心需要升级或扩展时，这对
美国企业较为容易，但对受到出口管制的中国企业而言将是挑战。
SemiAnalysis也评价指出，DeepSeek在开放权重模型上表现出色，超越Meta的Llama 、法国
人工智能新创公司Mistral AI、以及其他竞争者。（编辑：陈慧萍）1140201
心得评论：
研究机构SemiAnalysis报导，DeepSeek宣称的600万美元成本指的是预训练运行（pre-train
ing run）时的GPU成本，是模型总成本的一部分，尚未包含RD与硬件成本。
报导指称，GPU成本约5亿美元，服务器总资本支出（CapEx）约为16亿美元。
美股在惊慌中下跌，目前看似已反应DeepSeek带来的影响？

作者: loom0et0bust (十五夜澪人) 2025-02-01 16:46:00

那又怎样，你买硬件又不会只拿来做一件事情或弄一个模型就丢了…

作者: cityhunter04 (无聊的乖小孩 ) 2025-02-01 17:35:00

原来低成本是把设备成本都扣掉？那应该是0元啊！

继续阅读