[新闻] 陆企DeepSeek接连推出大模型 陆媒:引发

楼主: doig (dd)   2025-01-26 17:48:06
1.媒体来源:
联合新闻网 2025-01-26 13:18
2.记者署名:
联合报/记者 潘维庭/即时报导
3.完整新闻标题:
陆企DeepSeek接连推出大模型 陆媒:引发Meta内部焦虑
4.完整新闻内文:
https://i.imgur.com/cuek5sy.jpeg
总部位于杭州的大陆AI新创公司“深度求索”(DeepSeek),去年底、1月20日先后发布
了“DeepSeek-V3”和“DeepSeek-R1”两款大模型,由于成本低廉,性能与OpenAI相当,
陆媒指此举引发硅谷震惊,甚至引发Meta内部焦虑。(取自DeepSeek官网)
总部位于杭州的大陆AI新创公司“深度求索”(DeepSeek),去年底、1月20日先后发布
了“DeepSeek-V3”和“DeepSeek-R1”两款大模型,由于成本低廉,性能与OpenAI相当,
陆媒指此举引发硅谷震惊,甚至引发Meta内部焦虑,工程师开始连夜尝试复制DeepSeek的
成果。
陆媒“每日经济新闻”26日报导,在美国总统川普宣布5000亿美元的“星际之门”(
Stargate)发展人工智能基础建设计画之际,DeepSeek以极低的价格建立了突破性的AI模
型,且未使用尖端芯片,让人们质疑,AI行业数千亿美元资本的巨额投入,是否真为最有
效的方法?
报导回顾,去年12月27日,DeepSeek推出开源模型“DeepSeek-V3”。AI系统排名网站“
聊天机器人竞技场”(Chatbot Arena)显示,“DeepSeek-V3”在所有模型中排名第7,
在开源模型排第1。且“DeepSeek-V3”是全球前十中,性价比最高的模型。
不到1个月,今年1月20日,DeepSeek再推出“DeepSeek-R1”,24日,“DeepSeek-R1”在
聊天机器人竞技场综合榜单上排名第3,与顶尖推理模型、OpenAI推出的o1并列。同时,
测评机构“Artificial-Analysis”对“DeepSeek-R1”的初始基准测试结果也显示,“
DeepSeek-R1”在AI分析质量指数中取得第2高分,价格则是o1的约30之1。
“每日经济新闻”称,24日,一篇发布在匿名平台teamblind上的文章疯传,一位自称是
Meta员工称,Meta内部因为DeepSeek模型进入恐慌模式,该文员工写道,“DeepSeek-V3
”在基准测试中,已经让(Meta推出的)Llama 4相形见绌,而更让人难堪的是,一家“
仅用550万美元训练预算的中国公司”就做到了这一点。
该匿名文指,工程师正争分夺秒分析DeepSeek,试图复制其中的一切可能技术。另外,“
DeepSeek-R1”的出现,也让情况更加严峻。
《金融时报》25日称,中国的小型AI新创公司DeepSeek震惊硅谷,加州大学柏克莱分校AI
政策研究员古普塔(Ritwik Gupta)表示,DeepSeek最近发布的模型,表明“AI能力没有
护城河”。古普塔也提到,中国的系统工程师人才库比美国大得多,懂得如何充分利用计
算资源,来更便宜地训练、运行模型。
5.完整新闻连结:
https://reurl.cc/Kd5xKp

Links booklink

Contact Us: admin [ a t ] ucptt.com