Re: [请益] Deepseek v3 对台积电有影响吗

楼主: MacBookAir12 (New Mac Water)   2024-12-29 19:24:53
的确会让人好奇DeepSeek-V3的训练方式,
但成本降低如此之多,另外一个思考点,是不是除了科技巨头外,
更多公司愿意投入资本支出来建立自己的模型?
而且随着技术发展,模型建立的成本一定会快速下降。
DeepSeek-V3比较的 Claude.ai/Qwen2.5/LLaMA3.1
这些模型都已经训练一段时间,而且也在很多领域展开应用,
这里面一定会使用到旧有的算法机制,效能可能没新的好。
而DeepSeek-V3是重新开发的,当然可以用现在更好的算法,
简单说,就是站在巨人的肩膀上看的更远,其实不需要太惊讶。
最后讲个政治不正确的东西,
DeepSeek-V3 会受到中国的有关单位进行监管,
论文中没有明确指出数据集的筛选标准,
但可以推测,DeepSeek-V3的训练数据集可能经过一定程度的筛选,
以符合中国的监管要求。
可能会降低数据集的多样性,
当然也能提高数据的来源品质和一致性,
训练速度速度与成本肯定更快更低。
所以模型应该有可能存在偏差,而且某些政治敏感问题无法回答。
例如你问他64天安门,这模型会不会无法回答?
你问他习近平的的智商,这模型搞不好吹高大尚?
先不用太担心这个啦,不过中文领域的部分,应该毫无竞争对手,
中国市场大资料量庞大,要训练通用型中文AI绝对是一把手。
※ 引述《Latte7 (nonono)》之铭言:
: https://www.ettoday.net/amp/amp_news.php7?news_id=2882228&ref=mw&from=google.c
: om
: 中国展示了他们的新模型
: 重点在它极低的成本
: 好奇这样是不是代表科技巨头们不需要这么多芯片?
: 会对台积电的芯片需求有影响吗

Links booklink

Contact Us: admin [ a t ] ucptt.com