[新闻]DeepSeek-R1 模型升级新版本，推理能力接 pl132 PTT批踢踢实业坊

[新闻]DeepSeek-R1 模型升级新版本，推理能力接

楼主: pl132 (pl132) 2025-05-30 15:47:33

DeepSeek-R1 模型升级新版本，推理能力接近 o3、Gemini 2.5 Pro
https://tinyurl.com/2bkshvbp
中国 DeepSeek（深度求索）释出 DeepSeek-R1-0528 模型新版本，使其免费开源模型在
推理能力能与 OpenAI o3、Google Gemini 2.5 Pro 等付费专有模型并驾齐驱。
DeepSeek-R1-0528 以 2024 年 12 月发表的 DeepSeek-V3-Base 为基础，在后训练（
Post-Training）过程投入更多算力，提升新版模型思考深度与推理能力，有助于提升数
学、科学、商业及程式设计等复杂推理任务上的表现。
DeepSeek-R1-0528 在数学、程式设计及通用逻辑等多个基准测试取得优异成绩，并在整
体表现上接近如 OpenAI o3、Google Gemini 2.5 Pro。
相较于旧版 DeepSeek-R1，新版模型在复杂推理任务的表现有所提升。例如 AIME 2025
测试，因推理过程中加强思考深度，新版模型准确率由旧版的 70% 提升至 87.5%。
同时，DeepSeek 蒸馏 DeepSeek-R1-0528 的 CoT（Chain of Thought）后训练
Qwen3-8B Base，得到了 DeepSeek-R1-0528-Qwen3-8B。这款 8B 模型在数学测验 AIME
2024 仅次于 DeepSeek-R1-0528、超越 Qwen3-8B，并与 Qwen3-235B 相当。DeepSeek 认
为，DeepSeek-R1-0528 的 CoT 对于学术界推理模型的研究和工业界针对小模型的发展皆
具意义。
https://is.gd/b5sIbD
与先前版本相同，DeepSeek-R1-0528 采用 MIT 授权条款，并上传至开源机器学习社群平
台 Hugging Face，开发者能够自由修改甚至进行商业部署。

继续阅读

Re: [讨论] 于新竹市起家的薪资gnemail183 [讨论] 浮动式的端午奖金yokann [情报] 联电调薪开奖 (Dcard)yokann Re: [讨论] 于新竹市起家的薪资tobashi Re: [情报] D卡：量化交易薪水分享joywilliamjo [新闻] 揭秘台湾辉达供应链最神秘未上市散热公司penny83320 [心得] 我在资策会受训的心路历程 - Part 1qweqwe [情报] D卡：量化交易薪水分享Vanced [情报]兴大-免费职训- AI智慧制造与传感物联网 tatina927 [新闻] 传英伟达将为中国推出性能降级版AI芯片createlight