Re: [新闻] DeepSeek颠覆AI产业模式!曝中国2大发展

楼主: dansy (Eye Taiwan)   2025-02-02 22:35:43
※ 引述《KIMBEOM (HYYY)》之铭言:
: 原文标题:DeepSeek颠覆AI产业模式!曝中国2大发展方向 ASIC成关键
: 原文连结:https://reurl.cc/qn2x9n
: 发布时间:2025/02/02 12:40
: 记者署名:壹苹新闻网 / 吕承哲
: 原文内容:
: 【记者吕承哲/台北报导】中国AI新创公司DeepSeek近期在科技界掀起热议,根据调研机
: 构TrendForce集邦科技的最新研究,DeepSeek近期接连发表DeepSeek-V3、DeepSeek-R1等
: AI模型,将影响终端客户对AI基础设施的投资决策。未来,业者可能更注重软件运算模型
: 的效率,以减少对GPU等昂贵硬件的依赖。同时,云端服务供应商(CSP)可能扩大使用自
: 家ASIC(特殊应用积体电路)基础设施,以降低建置成本。这使得2025年后,市场对GPU
: AI芯片及相关半导体的需求可能产生变化。
: 心得/评论:
: 看来ASIC就是未来趋势 IC设计准备喷喷
: 明天加码世芯 创意 M31
LLM经过这三年发展已展现其潜力,但也陷入(公开)知识枯竭造成的瓶颈
网络爬虫能抓的都已训练完
AI模型如还需增加功力,只能望向各家机构(公司)的商业祕密
比如DS团队使用低阶语言PTX来增加GPU计算效率
此部分的知识储备,据说来自母公司幻化量方过往最佳化量化交易模型的经验
拿 Python/C/组语/机器语言 来比喻就更明了
过往程式语言往高阶发展,是因为有着训练人才普及的需求
毕竟组语难学,机器语言就别提了
所以在一个python程式满天飞的时代,能用C重写效率优势就惊人,更不用说使用组语
GPU这块也是,现在很少有CUDA的使用者会去写PTX
所以关于"PTX最佳化"公开的知识并不多
但很可能DS团队已经成功将幻化量方PTX经验转换为大模型
然后用在设计下一代大模型的架构上
简单说就是掌握独家的低阶语言知识,教给AI,然后再"手动迭代"
不断产生更高效率的低阶AI码农
当然OpenAI内部也有可能拥有类似知识,但效率较低
所以基本可以推论,未来谁越能掌握压榨硬件的知识,就能持续拉开效率差距
作者: AdamHuangNew (七彩韧鱼兄弟威力加强版)   2025-02-02 22:53:00
不懂装懂

Links booklink

Contact Us: admin [ a t ] ucptt.com