1.媒体来源:
iThome
2.记者署名:
文/李建兴 | 2025-01-31发表
3.完整新闻标题:
Hugging Face逆向工程DeepSeek-R1,将打造开放推理模型Open-R1
4.完整新闻内文:
中国人工智能公司所开发的DeepSeek-R1模型发布以来,相对低廉的硬件与训练成本就能
展现高水准推理能力,在市场引发极大震荡。Hugging Face现正根据DeepSeek所公布的研
究内容进行逆向工程,试图推出名为Open-R1的开放版本,期望在透明、可验证的环境下
让研究社群能更深入了解该突破性技术。
由于DeepSeek-R1以远低于市场预期的成本达到与先进模型相近的推理表现,业界与学界
都希望能了解技术全貌,但DeepSeek未公开完整的训练资料集与程式码,使得外界对其称
为开源模型的真实性存有疑虑。Hugging Face工程师认为,如果只释出模型权重与部分技
术报告,仍不足以满足真正的开放标准,因而决定透过逆向工程与大规模协作,建置完整
可供研究者自行验证与调整语言模型,成为推理模型的开放训练工作管线与资料集。
深度学习社群之所以对此举格外关注,主要是因为DeepSeek-R1在数学、程式开发与科学
领域的推理能力,甚至能与知名的OpenAI o1模型一较高下,而开发成本却声称仅有美国
人工智能公司花费的一小部分。一旦Hugging Face成功重现Open-R1,研究人员将可确切
掌握其中关键架构、训练步骤,以及在有限硬件资源下达到高效训练的方法。
目前Hugging Face团队的做法,是先分析DeepSeek发布的技术报告与模型论文,并尝试从
现有权重中推断其训练配方与资料分布。由于DeepSeek并未开放完整的资料集与程式码,
Hugging Face需要召集志愿者,共同整理出可供公开使用的高品质推理资料,借此复刻或
接近DeepSeek-R1所使用的多阶段训练策略。
当Open-R1顺利出炉,将不只是一个DeepSeek-R1复制品,更可能在技术透明度与研究价值
上进一步超越原始模型。Open-R1可供任何人检阅并改良强化学习流程、语言模型结构以
及推理逻辑。这对需要确保模型输出精度与可控性的企业而言相当重要,也进一步突显了
开源社群在推动人工智能技术发展时所扮演的关键角色。
Open-R1模型的训练将使用Hugging Face的Science Cluster运算资源,该丛集有96个节点
,每个节点有8张显示卡,共768颗Nvidia H100可用于密集训练,Hugging Face预计在数
周内推出第一个可公开测试的原型版本。
5.完整新闻连结 (或短网址)不可用YAHOO、LINE、MSN等转载媒体:
https://www.ithome.com.tw/news/167171
6.备注:
当有一群人在64天安门上做文章否定DS模型的表现时,
另一群人正在想办法山寨DS
而拿200E预算的前部长则是拿着破解64天安门问题洋洋得意
话说回来,我当天早上就已经破解的东西有什么好吹的?