[新闻] 研究称DeepSeek的AI 训练成本也很贵 至少

楼主: fly5566 (飞56)   2025-02-03 11:37:23
原文标题:研究称DeepSeek的AI 训练成本也很贵 至少430亿台币
原文连结:https://reurl.cc/Q5odeM
发布时间:21:49 2025/02/01
记者署名:中时新闻网 江飞宇
原文内容:https://i.imgur.com/hN2WEH9.jpeg
半导体行业分析公司指出,DeepSeek的基础成本、服务器搭建成本至少要13亿美元。(图
/shutterstock/达志)
最近上线的中国大陆AI软件DeepSeek引发业界震撼,大陆声称建构DeepSeek的基础成本很
低,仅是OpenAI的零头,最广为流传的说法之一,是DeepSeek V3 的训练成本约为 600万
美元(1.9亿新台币)。不过这个说法被半导业行业研究公司 SemiAnalysis质疑,他们认为
DeepSeek的成本应该至少有13亿美元(约430亿新台币)。
有趣的工程(Interesting Engineering)报导,SemiAnalysis 指出,它未能解释几个关键
因素。600 万美元的估算,只考虑了 GPU 预训练费用,忽略了公司在研发、基础设施和
其他必要成本方面的大量投资。报告强调,DeepSeek 的总服务器资本支出,就高达13亿
美元。
根据报导,DeepSeek使用了大约 5万张Hopper GPU(微架构的),这导致业界产生了一些误
解。以为这就等于5万张辉达H100 GPU(Nvidia Hopper H100 GPU)。
SemiAnalysis 澄清说,辉达的GPU 有多种型号,包括 H800、H100 以及 NVIDIA 为应对
美国出口限制而生产的 H20。也是中国大陆可以获得的类型。
该报告称,与一些较大的人工智能实验室不同,DeepSeek资料中心采用精简模型,来提高
其灵活性和效率。这算是一种不错的适应能力,分析显示 DeepSeek 的 R1模型,表现出
与 OpenAI 的 o1 相当的推理能力。
然而,这不意味着DeepSeek在所有指标都性能领先。
虽然 DeepSeek 的定价策略引起了关注和赞誉,但有一个重要的警告:功能相似的
Google Gemini Flash 2.0 ,在API 服务存取时更加经济。这使得 DeepSeek 处于一个十
字路口,平衡效能和成本是其未来成功的关键。
但是,DeepSeek的多头潜在注意力(Multi-Head Latent Attention,MLA),是个颇具突
破性的创新,这种方法透过减少键值 (KV) 快取的使用,显著降低了 93.3% 的推理成本
。不过, DeepSeek 带来的创新,也很可能会被渴望保持竞争力的西方人工智能实验室迅
速采用。
报告推测,DeepSeek可能产生不错的竞争环境,令其他同行也必须具有更快的适应能力。
总之,SemiAnalysis 描绘了 DeepSeek 在 AI 领域的当前地位。它的成本结构、GPU 利
用率,和创新能力,确实成为一名强大的AI参与者。
心得/评论:
上周由于Deepseek的横空出世,宣称能够降低98%成本
杀得许多美股科技大头血流成河,今天台股开盘也被连累
若到头来低成本只是"号称",又只能产出审查阉割后的不实内容
牛皮吹破被看破手脚的后果.....
作者: herculus6502 (金麟岂是池中物)   2025-02-03 11:39:00
OpenAI一堆大老出走 想也知道有问题
作者: squeakywheel   2025-02-03 11:48:00
该不会下一步就要说是解放军出资吧?
作者: calmerrorans (虎烂抠)   2025-02-03 11:52:00
训练成本和建置成本好像不同
作者: Howard000123 (葳德哥)   2025-02-03 11:58:00
好了啦 你OpenAI多少钱租服务器 16亿美元一年对不对
作者: calmerrorans (虎烂抠)   2025-02-03 12:14:00
树发布还在考察 别急
作者: StarTouching (抚星)   2025-02-03 13:20:00
才两倍点面线系统
作者: BruceChen227 (BruceChen0227)   2025-02-03 16:10:00
壮胆^^
作者: fivemoonsky8 (墙外风景)   2025-02-04 00:54:00
不管怎么算,都比Open ai便宜很多

Links booklink

Contact Us: admin [ a t ] ucptt.com