[新闻]DeepSeek-R1 模型升级新版本,推理能力接

楼主: pl132 (pl132)   2025-05-30 15:47:33
DeepSeek-R1 模型升级新版本,推理能力接近 o3、Gemini 2.5 Pro
https://tinyurl.com/2bkshvbp
中国 DeepSeek(深度求索)释出 DeepSeek-R1-0528 模型新版本,使其免费开源模型在
推理能力能与 OpenAI o3、Google Gemini 2.5 Pro 等付费专有模型并驾齐驱。
DeepSeek-R1-0528 以 2024 年 12 月发表的 DeepSeek-V3-Base 为基础,在后训练(
Post-Training)过程投入更多算力,提升新版模型思考深度与推理能力,有助于提升数
学、科学、商业及程式设计等复杂推理任务上的表现。
DeepSeek-R1-0528 在数学、程式设计及通用逻辑等多个基准测试取得优异成绩,并在整
体表现上接近如 OpenAI o3、Google Gemini 2.5 Pro。
相较于旧版 DeepSeek-R1,新版模型在复杂推理任务的表现有所提升。例如 AIME 2025
测试,因推理过程中加强思考深度,新版模型准确率由旧版的 70% 提升至 87.5%。
同时,DeepSeek 蒸馏 DeepSeek-R1-0528 的 CoT(Chain of Thought)后训练
Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。这款 8B 模型在数学测验 AIME
2024 仅次于 DeepSeek-R1-0528、超越 Qwen3-8B,并与 Qwen3-235B 相当。DeepSeek 认
为,DeepSeek-R1-0528 的 CoT 对于学术界推理模型的研究和工业界针对小模型的发展皆
具意义。
https://is.gd/b5sIbD
与先前版本相同,DeepSeek-R1-0528 采用 MIT 授权条款,并上传至开源机器学习社群平
台 Hugging Face,开发者能够自由修改甚至进行商业部署。

Links booklink

Contact Us: admin [ a t ] ucptt.com