[新闻] DeepSeek 公布最新V3模型　意图超越 Open jeff0025 PTT批踢踢实业坊

[新闻] DeepSeek 公布最新V3模型　意图超越 Open

楼主: jeff0025 2025-03-25 16:18:20

ETtoday新闻云 2025年03月25日 16:10
DeepSeek 公布最新V3模型　意图超越 OpenAI
DeepSeek 昨日（24）针对其“DeepSeek V3-0324”模型悄悄发布了更新，虽非外界预期
的R2 模型，但仍然有不少亮点。
V3模型无预警地在本周的 Hugging Face 上发布，此次更新声称能够“有效且准确地解决
现实世界中的挑战”。今年一月，DeepSeek 一度超越 ChatGPT，成为苹果美国应用程式
商店中最受欢迎的免费软件。V3 模型是一款强大的混合专家（MoE）语言模型，拥有
6710 亿个总参数，其中处理每个 token（即每个单词或符号）时，模型会动态选择并启
动370亿个参数来进行计算，这种方法使得模型能够在保持高效运行的同时，利用大量参
数来提高预测的准确性和性能。在预训练之后，V3 进行了知识蒸馏，从 DeepSeek-R1 模
型中提取知识，这一过程进一步提升了模型的性能和应用能力。
本次更新展示了 DeepSeek 在技术创新方面的持续努力，并预示著未来 AI 技术将更加高
效。随着竞争的加剧，DeepSeek 的进步无疑将对全球 AI 产业产生深远影响，更突显了
这家中国 AI 新创公司保持领先竞争对手的意图。
https://www.ettoday.net/news/20250325/2931329.htm
稳了?
昨天DeepSeek更新V3模型虽然非预期的R2模型
V3拥有6710亿个参数处理单词或符号模型会动态启动370亿个参数计算
V3使用知识蒸馏从DeepSeek R1提取知识提升模型的性能和应用能力

作者: kuojames2580 (干干干干干) 2025-03-25 16:22:00

中国或许发明打不赢美国但一定能卷赢美国

作者: cityhunter04 (无聊的乖小孩 ) 2025-03-25 16:27:00

越公布越虚弱…还要吹多久呢？

作者: drpepperfish 2025-03-25 16:31:00

心得除了“稳了”之外都是节录文章内容，觉得你进桶比较稳

作者: hamasaki7788 (jeffery) 2025-03-25 16:37:00

随便了啦

作者: zombiepigman 2025-03-25 16:40:00

烦死了什么都要卷

作者: junior020486 (软蛋头) 2025-03-25 16:49:00

好了啦，你偷买多少Blackwell系列的服务器新加坡偷卖多少啦不bang新加坡，中国一直偷买一直爽Ban啦干笑死，没站上？前一阵子回到140叫做DS问世以后没站上，你活在平行世界噢XD中期回档一个多月就一堆散户在那边：啊～算力过剩

作者: ts0045851127 (cing) 2025-03-25 17:09:00

中国ai不敢信

作者: ken123321987 (溺水者) 2025-03-25 17:42:00

各位伟大的中国人打倒美帝就在眼前革命尚未成功同志仍须努力中国爸爸不会忘记弯弯的

作者: wahaha711233 2025-03-26 10:01:00

26卷起来，消费者舒服，米国佬吃屎

继续阅读

[新闻] DeepSeek 公布最新V3模型 意图超越 Open

[新闻] DeepSeek 公布最新V3模型　意图超越 Open