Re: [请益] 费半成份股全线崩盘怎么办？ LDPC PTT批踢踢实业坊

Re: [请益] 费半成份股全线崩盘怎么办？

楼主: LDPC (Channel Coding) 2025-01-27 14:13:09

DeepSeek这块有几个看法 Training端就等之后瓜出来再吃
在Inference这块因为受限于MoE 所有推论成本可以降下来但需求变高的是用记忆空间
和各个node之间的通讯开销以及软件上cpu/gpu的load balance
以deepseek v3来说 600GB+ fp8 需要许多平行运算这意味通讯瓶颈很重要
因为在切换专家时候延迟会因此也跟者追加而内存需求开销也很大
另外一点就是37B Activation是主因让推论可以成本下降 (不用全部671B来跑)
以h100来算这会让同样算力成本下降10倍以上
但对算力芯片load balance和通讯跟内存开销需求也跟者增大
但对于同样算力可以提高10倍以上token产出
MoE好处就是更适合特制化的低成本下游任务不适合泛化场景所以不能用在机器人
这种场景多变任务上
这就代表假设Deepseek最后成为低成本主流这意味还是只有老黄能吃下它
(因为需要昂贵load blance 通讯开销高需求vram)
ASIC那边不适合用在MoE架构这些低成本就某种意义会解锁ai产品化
原本之前最大问题就是现有的模型在Inference产生token的电力成本太贵
如果能让现有成本下降这样才会能直接适用到消费端去
并不是说提高tokens生产数量/单位算力就等于减少铲子卖出
事实上 token数量/单位算力过低会造就无法ai模型落地化反而产子卖不出去
最好的例子就是DeepSpeed (AI Backend 优化) 这玩意一年前微软就用它来提高
tokens数量/单位算力号称能增加1.5~3倍快同样算力结果微软反而愿意花更多钱买算力
这波最大意义大概就是会变动推行MoE架构然后ASIC死去 QQ 而老黄有NVLink
和垄断HBM产量又有良好的cuda为主的AI Backend做load balance 感觉很难输
说到底最简单的观察就是看1/23微软财报的资本支出微软在01/03说出2025 80B
(Deepseek v3 12/26/2024 模型释出) 如果01/27资本支出维持原案那就没啥太大担心

作者: MacBookAir12 (New Mac Water) 2025-01-27 14:20:00

其实反而应该是AVGO 的利空...3661 3443...前一阵子有炒作一波ASIC 现在通通都要下去然后AIPC 或许可以提早放量甚至不需要额外NPU去运算了<-这比较极端想法XDAVGO可能要等市场开盘之后会比较清楚现在美国那边还是27号凌晨能不能COST DOWN 我觉得先看论文可不可能重现DS使用类似当初GOOGLE 围棋那套方式去自我训练然后5万张H100 传闻也不知道真假XD不过MoE模型的确是可以有效降低成本这没错最后变成是贾维斯跟事务型机器人的对决XD

作者: jacktypetlan (å››åå››éš»çŸ³ç…å) 2025-01-27 14:48:00

https://i.imgur.com/HUKLWkC.jpeg很有趣可以自己去问看看

作者: dongdong0405 (聿水) 2025-01-27 14:53:00

这才是有料的发文不像那些无脑黑无脑吹的

作者: lolpklol0975 (鬼邢) 2025-01-27 14:53:00

https://i.imgur.com/FhzpfAY.jpeg

作者: beavertail97 (奏音璃) 2025-01-27 16:24:00

跌深就是给上车的，赶快开盘

继续阅读

Re: [请益] 费半成份股全线崩盘怎么办？redbeansyrup [标的] 2330.TW 台积电天意空liliumeow [新闻] 突然爆红的 DeepSeek 吓坏硅谷美股期f12sd2e2aa Re: [请益] 费半成份股全线崩盘怎么办？operatorm Re: [新闻] DeepSeek在苹果中国及美国区免费App下载-capssan Re: [新闻] DeepSeek在苹果中国及美国区免费App下载-Lushen Re: [新闻] 阉割版ChatGPT 查询成本大降98％? DeepSecpblgu Re: [新闻] Meta陷入恐慌？内部爆料：在疯狂分析lucien0410 [新闻] 阉割版ChatGPT 查询成本大降98％? DeepSexephon [标的] 6931.TW 青松健康壮世代概念股KKlin813

Re: [请益] 费半成份股全线崩盘 怎么办？

Re: [请益] 费半成份股全线崩盘怎么办？