如题
就是纯来黑的
看了一下被采访的人 美国亚裔不意外香蕉人
美国这些搞生成式ai的就是被看破手脚
尤其是那个奥特曼 就是来纯搞钱的
直接看deepseek内部人员 截了三点
在去年五月的deepseekv2推出时
在知乎的回答
——————-
罗福莉
DeepSeek
- 亲自答 此回答由问题相关方亲自撰写
今天忙飞,深夜,简单写几点:
1. 单论 DeepSeek-V2 模型*的中文水平(来自 20 多个微信群用户反馈),是真实处在
国内外闭源模型的第一梯队(GPT4、文心 4.0*等),因为没做 RAG(检索增强*)等功能
,所以实际在官网(@deepseek.com)的体感可能略微没那么惊艳,但这不妨碍 API 效果
哦!外加 1 元 / 百万输入 Tokens 的价格,只有 GPT4 价格的 1/100,性价比之王!
2. 怎么兼顾模型效果和成本的?基本纯靠:模型结构创新(MLA+DeepSeekMoE)+ 超强In
fra。MLA妙就妙在,它既是 training efficient MQA,也是 inference efficient MHA
。从今天起,放弃MHA/GQA,全面拥抱MLA吧。同时,不严谨来说,DeepSeekMoE也算是开
启了“共享expert+细粒度expert分割”的sparse框架风