Re: [新闻] 称霸 AI 推理性能，NVIDIA B200 芯片海 LDPC PTT批踢踢实业坊

Re: [新闻] 称霸 AI 推理性能，NVIDIA B200 芯片海

楼主: LDPC (Channel Coding) 2024-09-03 03:04:53

相关文章可以参考这个
https://36kr.com/p/2927059579722630
比较有意义的是这边
https://spectrum.ieee.org/new-inference-chips
前言
虽然大家都在讨论AI要怎样获利但AI产品要获利前有一个很重要的大前提
就是AI infrastructure得先成熟也就是如何让巨大数量消费者能在平台上(Large-scale)
能得到平台上的服务这个第一步关键就是Inference 上的成本算力提升也意味单位
成本下降
自从LLM兴起后(GenAI) 直到去年都比较是Training上的改进像是软件端有Deep-Speed
陆续整合到LLM/Transformer上能把训练数度提高百倍(意味成本降低百倍)
硬件端有A100->H100 (Transformer加速) HBM容量变大等等此类
但针对AI商业化的Inference块一直很不明朗
去年之前我个人认为Inference玩家就是NV/AMD/i皇(免强算半个)/ASIC玩家等大乱战
今年开始Inference开始有比较严谨的方式去量化"Large-Scale Service" 来推广落地
这都意味以后的服务平台成本会下降以现在GPT-4o 25.00元你可以使用1M tokens
(注2) 想像一下以后的成本可以降到100倍以上同时也意味AI infra在走向产业落地
而第二个连结(ieee)就是开始在量化Inference的成本/能力里面用秒来计算能提供多少
客户请求(queries)
里面有两个比较重要的分类 (1) 一个是MoE 这是一种算法上的设计会成为将来主流
他能在LLM包山包海的下游任务(例如文字总结写程式医疗问题) 能动态选取专家
所以在MoE上表现好对效能上来说都会好 (2)处理位元数降低(e.g., f32/bf16/f4)
处理位元数降低好处会带来运算速度增快运算成本降低但通常缺点就是效能会变很糟
(正确率下降模型准度降低) 但NVDA弄出了一个4位元版本且准度没有太大牺牲
Blackwell FP4运算效力非常夸张 ( https://reurl.cc/myrAMM )
第二个连结可以看出明显AI inference 老黄把众家对手打得满头包...在第二张图里
就算校正GPU数量狗家的TPU也是没占上风(注3)
处此之外还有一份报告是关于Llama3 ( https://www.aizws.net/news/detail/1238 )
可以看见当算力拉高高算力高power 巨大集群系统容易崩溃就连老黄都无法避免
然而这在A100丛集崩溃几乎没有出现过这也意味众家对手再拉高power 算力
软件容易不稳定而崩溃在这个AI军备竞赛下时间永远是个最重要的成本这也意味
其他对手还只要没在巨大集群验证过都不能算上玩家 (目前只有狗家)
最后一个总结老黄的核心思想就是算力 (硬件+软件+巨大cluster)
当年老黄在显卡大战说过我每半年提高显卡算力一倍虽然一堆游戏厂商
跟我说他家电动游戏不需要这样强显卡但我们不能照游戏厂商需求来设计
我们给他们更好的显卡这样他们才能设计更好的游戏我们可以创造需求
同样只要对先进算法有需求算力就会存在显卡大战所有的套路我们会再重新走一次
而AI这个路线也是如此因为Scaling Law已经讲明算力无穷止尽造就无穷智能
就算今天LLM技术落伍只要有需求先进的算法就会需要算力 Scaling Law就是摩尔定律
CPU当年无限开发计算能力有了软件业显卡无限开发算力有了电动产业
这也是为何Eric Schmidt说政府用算力10的26次方flops当作监管条件
其他政治上的风险
https://www.youtube.com/watch?v=UczALD7ZZDU
Data Center->水土地电力当地居民抗议

作者: darkangel119 (星星的眷族) 2024-09-03 08:03:00

感谢专家分析与分享

作者: NicholasTse3 (Nicholas) 2024-09-03 08:19:00

all in NVDL 一波退休！

作者: darkangel119 (星星的眷族) 2024-09-03 09:32:00

虾? 用 ASIC? 想太多了吧

继续阅读

Re: [请益] 正2跌比大盘多2倍，涨却不到2倍...WisdomOrLie [新闻] 国产化争议...经部组团赴欧盟13日首咨商 fashsboy [情报] 0902 上市柜股票周转率排行steveisaman [情报] 0902 上市柜外资投信买超金额排行steveisaman Re: [请益] 正2跌比大盘多2倍，涨却不到2倍...newukyo [新闻] 【独家】吴东亮渗透新光金铁证曝光　检c800 [新闻] 救急首购房贷央行9月可能扩大二房管制DrowningPool [新闻] “新新并”惹议！吴东亮渗透新光金铁证曝sospeter [新闻] 开发金4经理人申让持股　共套现4143万color345 [请益] 正2跌比大盘多2倍，涨却不到2倍...wooosk