Re: [请益] Deepseek v3 对台积电有影响吗

楼主: macbook12 (12吋苹果)   2024-12-30 00:32:36
我觉得评比指标什么都是后话
使用体验太差
https://i.meee.com.tw/CafPIov.png
你看看这样怎么称霸世界呢?
你的进线参数与资料量就比别人少了,
虽然不是一个主要因素,就deepseek就是在数据上有筛选过,
你要跟人比,好歹训练资料要在同一起跑点上吧。
不过中国人常作弊,可能搞不懂什么叫做同一起跑点。
更何况deepseek使用MoE的模型
MoE稀疏模型成本本来就比一般模型密度低
这边怕你看不懂,
就是一个秃头的人跟发量正常的人说,嘿嘿我们都有头发耶,你懂这个意思吗?
股点就是,如果美国未来持续加严对中国的科技限制,
不要以为拿RTX 显卡来训练Model这件事不会发生,
大胆一点想,会不会又爆发缺卡潮?
※ 引述《icrose (人本良心)》之铭言:
: deepseek在多语言编程指标中有自己的优异表现,很多指标优于chatgpt,最好是偷偷调用别人的API啦
: Codeforce领先所有模型,思维链的应用上,诸如数学能力的 AIME 2024 CNMO 2024测试也是领先全球的
: 而且已经可以本地部署测试,成本降低是可见的,原理也是业界认可的
: 你以为这两个小例子能推翻什么吗XD
: 由于低成本和硬件限制,有缺陷是非常有可能的,但是只要原理通,未来非常可期。
: ※ 引述《jackliao1990 (j)》之铭言:
: : 没想到吹没多久
: : 当问DeepSeek-V3:"你是什么模型"
: : DeepSeek-V3竟然回答:"我是chatgpt"
: : https://imgur.com/wcgo1TC
: : 叫它讲个笑话
: : 它讲的笑话也跟ChatGPT一样:
: : https://imgur.com/Zo1PKXw
: : 难道DeepSeek-V3训练成本这么低是因为用chatgpt训练的??
: : Sam altman迅速发推嘲讽:
: : https://x.com/sama/status/1872664379608727589
: : "复制你知道有效的东西是(相对)容易的。"

Links booklink

Contact Us: admin [ a t ] ucptt.com