[新闻] 低成本高效能AI模型或再度引发美股惨烈震

楼主: qazxc1156892 (william)   2025-04-28 17:26:27
新闻标题: 低成本高效能AI模型或再度引发美股惨烈震荡
钜亨网编译 庄闵棻 2025-04-28 15:10
中国人工智能(AI)公司 DeepSeek 似乎即将再度在市场上投下震撼弹。随着 DeepSeek
即将发布的 R2 AI 模型细节再度流出,市场对该模型的关注再次掀起波澜,并可能又对
美国股市,尤其是科技股,造成冲击。
据报导,虽然目前 DeepSeek 尚未正式公布 R2 的具体规格,但中国媒体引述消息指出,
R2 将采用升级版的专家混合(Hybrid MoE)架构,并可能结合先进的(gating mechanis
ms)与 Dense 层(dense layers)设计,专为优化高负载运算。新模型的参数量预计将
达到惊人的 1.2 兆,是 R1 的两倍。
根据爆料,DeepSeek R2 在每个字符(token)的单位成本上,比 GPT-4 暴降了 97.4%,
输入(input)每百万个字符只要 0.07 美元,输出(output)每百万个字符则只要 0.27
美元。与 OpenAI 目前的收费标准相比,R2 将成为企业市场上极具吸引力的高效能、低
成本选择。
这样的成本优势,无疑将对美国 AI 公司造成严重冲击。市场分析指出,若 DeepSeek R2
真如预期般强势推出,将使 OpenAI 等企业面临前所未有的竞争压力,进而影响美股科
技类股的表现。
值得一提的是,DeepSeek R2 不仅在参数规模和成本上实现突破,还在硬件层面实现了自
家技术的深度整合。DeepSeek 选择全程依赖华为 Ascend 910B 芯片群进行训练,把华为
Ascend 910B 芯片群利用率推到了 82%,FP16 精度算力实测达到 512PetaFLOPS,接近
同规模辉达 A100 群 91% 的性能。
资料还显示,DeepSeek R2 的训练资料量高达 5.2PB,并在多项测试中表现出色。特别是
在 C-Eval2.0 中文语言测试中,R2 达到了 89.7% 的优异成绩;在 COCO 资料集上,R2
的电脑视觉能力也达到了 92.4%,显示其不仅在语言处理方面有显著突破,也在视觉识别
领域有了长足进展。
除了在参数规模和成本上取得突破,DeepSeek R2 还在模型部署方面创新。报导称,R2
可在 8bit 量化压缩模式下将模型体积缩小至 83%,同时精度损失控制在 2% 以内,大大
提升 AI 模型在终端设备上的部署可能性,为未来的 AI 应用开启了新的大门。
DeepSeek R2 的发布或将成为科技股的重大挑战。DeepSeek R1 曾经让美国股市遭遇惨痛
损失,尤其是对辉达等 AI 芯片制造商造成巨大打击,市值一度蒸发 6000 亿美元。随着
R2 的消息逐步流出,美股投资者开始担心中国 AI 企业再次在市场上掀起新的风暴。
新闻来源: https://reurl.cc/LaaRNa

Links booklink

Contact Us: admin [ a t ] ucptt.com