阿里巴巴发布人工智能模型 称超越 DeepSeek
爱德华多·巴普蒂斯塔
2025年1月29日下午 5:12 GMT+8更新于一小时前
北京,1月29日(路透社)-中国科技公司阿里巴巴(9988.HK),开启新分页周三发布了新版本的Qwen 2.5 人工智能模型,据称该模型超越了广受好评的 DeepSeek-V3。
Qwen 2.5-Max 的发布时机非同寻常,恰逢大年初一,大多数中国人都下班了,与家人团聚,这表明中国人工智能新创公司DeepSeek在过去三周的迅速崛起给该公司带来了压力。
阿里巴巴云端部门在其官方微信帐号上发布的公告中表示,“Qwen 2.5-Max 的性能几乎全面优于GPT-4o、DeepSeek-V3 和Llama-3.1-405B”,指的是OpenAI 和Meta 最先进的开放技术- 来源人工智能模型。
1 月 10 日发布的由 DeepSeek-V3 模型驱动的 DeepSeek 人工智能助手以及 1 月 20 日发布的 R1 模型震惊了硅谷,并导致科技股暴跌,据称这家中国初创公司的发展速度较低,使用成本促使投资者质疑美国领先人工智能公司的巨额支出计画。
但DeepSeek的成功也引发了其国内竞争对手争先恐后地升级自己的AI模型。
DeepSeek-R1 发布两天后,TikTok 所有者字节跳动发布了其旗舰 AI 模型的更新,声称该模型在AIME 中的表现优于微软支持的OpenAI 的o1,AIME 是一项基准测试,旨在衡量AI模型对复杂指令的理解和反应程度。
这与 DeepSeek 的说法相呼应,即其 R1 模型在多项效能基准上可与 OpenAI 的 o1 相媲美。
DEEPSEEK 与国内竞争对手的比较
DeepSeek V3模型的前身DeepSeek-V2去年5月发布后,在国内引发了一场AI模型价格战。
事实上,DeepSeek-V2 是开源的,而且空前便宜,每 100 万个代币(或人工智能模型处理的数据单位)仅需 1 元人民币(0.14 美元),导致阿里巴巴的云端部门宣布降价高达97 %。
其他中国科技公司也纷纷效仿,其中包括百度(9888.HK),开启新分页于2023年3月发布了中国第一个相当于ChatGPT的软件,以及中国最有价值的网络公司腾讯(0700.HK),开启新分页。
DeepSeek 神秘的创始人梁文峰在 7 月罕见地接受中国媒体 Waves 采访时表示,这家新创公司“并不关心”价格战,而实现 AGI(通用人工智能)是其主要目标。
OpenAI 将 AGI 定义为在最具经济价值的任务中超越人类的自主系统。
虽然像阿里巴巴这样的中国大型科技公司拥有数十万名员工,但 DeepSeek 的运作就像一个研究实验室,其工作人员主要由来自中国顶尖大学的年轻毕业生和博士生组成。
https://reurl.cc/WAg0nZ