[新闻] 低成本高效能AI模型或再度引发美股惨烈震 qazxc1156892 PTT批踢踢实业坊

[新闻] 低成本高效能AI模型或再度引发美股惨烈震

楼主: qazxc1156892 (william) 2025-04-28 17:26:27

新闻标题：低成本高效能AI模型或再度引发美股惨烈震荡
钜亨网编译庄闵棻 2025-04-28 15:10
中国人工智能（AI）公司 DeepSeek 似乎即将再度在市场上投下震撼弹。随着 DeepSeek
即将发布的 R2 AI 模型细节再度流出，市场对该模型的关注再次掀起波澜，并可能又对
美国股市，尤其是科技股，造成冲击。
据报导，虽然目前 DeepSeek 尚未正式公布 R2 的具体规格，但中国媒体引述消息指出，
R2 将采用升级版的专家混合（Hybrid MoE）架构，并可能结合先进的（gating mechanis
ms）与 Dense 层（dense layers）设计，专为优化高负载运算。新模型的参数量预计将
达到惊人的 1.2 兆，是 R1 的两倍。
根据爆料，DeepSeek R2 在每个字符（token）的单位成本上，比 GPT-4 暴降了 97.4%，
输入（input）每百万个字符只要 0.07 美元，输出（output）每百万个字符则只要 0.27
美元。与 OpenAI 目前的收费标准相比，R2 将成为企业市场上极具吸引力的高效能、低
成本选择。
这样的成本优势，无疑将对美国 AI 公司造成严重冲击。市场分析指出，若 DeepSeek R2
真如预期般强势推出，将使 OpenAI 等企业面临前所未有的竞争压力，进而影响美股科
技类股的表现。
值得一提的是，DeepSeek R2 不仅在参数规模和成本上实现突破，还在硬件层面实现了自
家技术的深度整合。DeepSeek 选择全程依赖华为 Ascend 910B 芯片群进行训练，把华为
Ascend 910B 芯片群利用率推到了 82%，FP16 精度算力实测达到 512PetaFLOPS，接近
同规模辉达 A100 群 91% 的性能。
资料还显示，DeepSeek R2 的训练资料量高达 5.2PB，并在多项测试中表现出色。特别是
在 C-Eval2.0 中文语言测试中，R2 达到了 89.7% 的优异成绩；在 COCO 资料集上，R2
的电脑视觉能力也达到了 92.4%，显示其不仅在语言处理方面有显著突破，也在视觉识别
领域有了长足进展。
除了在参数规模和成本上取得突破，DeepSeek R2 还在模型部署方面创新。报导称，R2
可在 8bit 量化压缩模式下将模型体积缩小至 83%，同时精度损失控制在 2% 以内，大大
提升 AI 模型在终端设备上的部署可能性，为未来的 AI 应用开启了新的大门。
DeepSeek R2 的发布或将成为科技股的重大挑战。DeepSeek R1 曾经让美国股市遭遇惨痛
损失，尤其是对辉达等 AI 芯片制造商造成巨大打击，市值一度蒸发 6000 亿美元。随着
R2 的消息逐步流出，美股投资者开始担心中国 AI 企业再次在市场上掀起新的风暴。
新闻来源： https://reurl.cc/LaaRNa

继续阅读

[新闻] 中国挖角战术没用了!微影技术无法突破penny83320 [请益] 系统厂硬件跟韧体比较a123dady [新闻] 罕见砲轰百度董事长指DeepSeek让人不放心sunbysea 邦邦结构调薪Goodeat87 [请益] 大家所得税有试算？lin080600 [新闻]从BMW将使用DeepSeek进攻中国市场，看起stpiknow [请益]关税为什么台湾要担心,要买的人才担心吧villagermess [心得] 我在竹南全联福利中心做了一个恶梦pat12345 [新闻]别只怪 AI 没答好！先避开这七个 ChatGPT pl132 [聘书] offer请益IronPhoenix8