Re: [请益] Deepseek v3 对台积电有影响吗 MacBookAir12 PTT批踢踢实业坊

Re: [请益] Deepseek v3 对台积电有影响吗

楼主: MacBookAir12 (New Mac Water) 2024-12-29 19:24:53

的确会让人好奇DeepSeek-V3的训练方式，
但成本降低如此之多，另外一个思考点，是不是除了科技巨头外，
更多公司愿意投入资本支出来建立自己的模型？
而且随着技术发展，模型建立的成本一定会快速下降。
DeepSeek-V3比较的 Claude.ai/Qwen2.5/LLaMA3.1
这些模型都已经训练一段时间，而且也在很多领域展开应用，
这里面一定会使用到旧有的算法机制，效能可能没新的好。
而DeepSeek-V3是重新开发的，当然可以用现在更好的算法，
简单说，就是站在巨人的肩膀上看的更远，其实不需要太惊讶。
最后讲个政治不正确的东西，
DeepSeek-V3 会受到中国的有关单位进行监管，
论文中没有明确指出数据集的筛选标准，
但可以推测，DeepSeek-V3的训练数据集可能经过一定程度的筛选，
以符合中国的监管要求。
可能会降低数据集的多样性，
当然也能提高数据的来源品质和一致性，
训练速度速度与成本肯定更快更低。
所以模型应该有可能存在偏差，而且某些政治敏感问题无法回答。
例如你问他64天安门，这模型会不会无法回答?
你问他习近平的的智商，这模型搞不好吹高大尚?
先不用太担心这个啦，不过中文领域的部分，应该毫无竞争对手，
中国市场大资料量庞大，要训练通用型中文AI绝对是一把手。
※ 引述《Latte7 (nonono)》之铭言：
: https://www.ettoday.net/amp/amp_news.php7?news_id=2882228&ref=mw&from=google.c
: om
: 中国展示了他们的新模型
: 重点在它极低的成本
: 好奇这样是不是代表科技巨头们不需要这么多芯片？
: 会对台积电的芯片需求有影响吗

继续阅读

[心得] 2024 看置底闲聊的操作绩效m180 [新闻] 光电再跳票今年建置量4年新低Kai877 [新闻] 中环再买阳明4332张　从余额看近月卖出32tttknighttt [标的] 1310台苯newsunny0912 [心得] 年初果断砍掉台塑的2024绩效gastboy [心得] 2024韭菜年报绿到爆只有我赔钱aabbcc520 [请益] 年化报酬率算法natyshow [心得] 不够好的2024年报mopa Re: [请益] Deepseek v3 对台积电有影响吗icrose [心得] 2024年小资族年报alan50231