ETtoday新闻云 2025年03月25日 16:10
DeepSeek 公布最新V3模型 意图超越 OpenAI
DeepSeek 昨日(24)针对其“DeepSeek V3-0324”模型悄悄发布了更新,虽非外界预期
的R2 模型,但仍然有不少亮点。
V3模型无预警地在本周的 Hugging Face 上发布,此次更新声称能够“有效且准确地解决
现实世界中的挑战”。今年一月,DeepSeek 一度超越 ChatGPT,成为苹果美国应用程式
商店中最受欢迎的免费软件。V3 模型是一款强大的混合专家(MoE)语言模型,拥有
6710 亿个总参数,其中处理每个 token(即每个单词或符号)时,模型会动态选择并启
动370亿个参数来进行计算,这种方法使得模型能够在保持高效运行的同时,利用大量参
数来提高预测的准确性和性能。在预训练之后,V3 进行了知识蒸馏,从 DeepSeek-R1 模
型中提取知识,这一过程进一步提升了模型的性能和应用能力。
本次更新展示了 DeepSeek 在技术创新方面的持续努力,并预示著未来 AI 技术将更加高
效。随着竞争的加剧,DeepSeek 的进步无疑将对全球 AI 产业产生深远影响,更突显了
这家中国 AI 新创公司保持领先竞争对手的意图。
https://www.ettoday.net/news/20250325/2931329.htm
稳了?
昨天DeepSeek更新V3模型 虽然非预期的R2模型
V3拥有6710亿个参数处理单词或符号 模型会动态启动370亿个参数计算
V3使用知识蒸馏从DeepSeek R1提取知识 提升模型的性能和应用能力
作者: drpepperfish 2025-03-25 16:31:00
心得除了“稳了”之外都是节录文章内容,觉得你进桶比较稳
作者: hamasaki7788 (jeffery) 2025-03-25 16:37:00
随便了啦
作者: zombiepigman 2025-03-25 16:40:00
烦死了什么都要卷
好了啦,你偷买多少Blackwell系列的服务器新加坡偷卖多少啦不bang新加坡,中国一直偷买一直爽Ban啦干笑死,没站上?前一阵子回到140叫做DS问世以后没站上,你活在平行世界噢XD中期回档一个多月就一堆散户在那边:啊~算力过剩
各位伟大的中国人 打倒美帝就在眼前 革命尚未成功同志仍须努力 中国爸爸不会忘记弯弯的
作者: wahaha711233 2025-03-26 10:01:00
26卷起来,消费者舒服,米国佬吃屎