[新闻] 中国 AI 公司 DeepSeek 令硅谷震惊

楼主: KotoriCute (Lovelive!)   2025-01-25 19:55:14
OpenAI 强大新劲敌,中国 AI 公司 DeepSeek 令硅谷震惊
https://bit.ly/4hxOiYJ
中国幻方成立的 AI 研究公司 DeepSeek 公布最新研究成果,震惊了全世界,无视美国阻止
中国发展尖端科技的野心。
幻方的创始团队在 2015 年组成,其中代表人物为梁文锋,团队从零开始探索全自动化交易
;到了 2015 年创立幻方量化,依靠数学与 AI 进行量化投资。来到 2023 年 4 月,幻方
宣布成立一家研究公司 DeepSeek 以探索 AGI(Artificial General Intelligence,通用
人工智能),本周 20 日释出的 DeepSeek-R1 模型正式版,在 AI 业界掀起热烈讨论。
“今日发表 DeepSeek-R1,同步开源模型权重。DeepSeek-R1 遵循 MIT 授权条款,允许研
究人员以蒸馏技术用 DeepSeek-R1 训练其他模型”,DeepSeek 表示,而 DeepSeek-R1 基
准测试结果可说是追平 OpenAI o1。
同样在 20 日,中国国务院总理李强主持由专家、企业家及各领域代表参与的座谈会,听取
政府工作报告并提出建议,梁文锋正是其中一员,以自身经验对 AI 发展提出建言。
来自美国的 OpenAI 和 Google DeepMind 率先开发推理模型,这是一种相对新颖的 AI 研
究领域,试图使模型接近人类认知能力。其中,OpenAI 先后发表 o1、o3,Google 则有 Ge
mini 2.0 Flash Thinking Experimental,双方对研究方法保密到家。
DeepSeek-R1 释出在硅谷引发激烈争论,重点在于资源相对充足的美国 AI 公司,是否能够
持续捍卫自身技术优势。
华盛顿当局禁止 NVIDIA 向中国供应最先进的芯片,无法建构充足算力下,中国当地 AI 公
司被迫找出创新方法,尽可能提高既有芯片的算力,而梁文锋的团队知道如何解决这样的问
题。
DeepSeek 宣称,使用供应中国市场的 2,048 个 NVIDIA H800 和不到 600 万美元训练一款
拥有 6,710 亿参数的模型,所需费用远远不及 OpenAI 和 Google 训练同等规模的模型。
不只如此,DeepSeeK 愿意开源分享研究成果,而不是为了商业利益而保护它。DeepSeek 未
从外部资源筹措资金,是靠母公司在对冲基金交易的收益支撑,也没有采取重大措施将模型
商业化。
加州大学柏克莱分校的 AI 政策研究员 Ritwik Gupta 表示,DeepSeek 近来推出模型表明
“AI 能力没有护城河”,认为第一个训练模型的人必须耗费大量资源才能达成目标,但后
进者能以更便宜、更快速的方法办到。他补充说,中国比起美国拥有更庞大的人才库,他们
了解如何充分利用运算资源,以更便宜的方法训练、运行模型。
业界人士则表示,尽管 DeepSeek 以有限资源取得受人瞩目的成绩,但随 AI 产业发展,能
否继续保有竞争力仍是一个大问题。DeepSeek 面对的美国竞争对手并没有坐以待毙,他们
利用 NVIDIA 下一代 Blackwell 架构芯片建构运算丛集,强大算力有助于拉开竞争差距。

Links booklink

Contact Us: admin [ a t ] ucptt.com