楼主:
LDPC (Channel Coding)
2025-12-14 01:56:43从AI芯片来说 基本上算力效率跟内存就是大趋势 存算一体就是一个主轴
所以可以买HBM/算力小队/台G 我基本上就是这样干
这篇就类似之前的Mamba这类型paper 就是希望能取代Transformer 但当训练到
大资料量时 这类型模型就是没办法很好的scalable 当大量资料套上时 优势就消失
像这篇只训练到最高1.3B模型 100B tokens 对比transforerm动辄>10B 8T>tokens
这篇分数 https://openreview.net/forum?id=nbMeRvNb7A
整体评价就是: Borderline accept
海力士跟台积跟NVDA基本上不太可能会买错了 其他算力小队AMD/AVGO可以加减买
应用端那边大概两年后会有一堆公司上来 我个人觉得接下来五年应该会陆续看到
有趣东西 而那天如果来到的话 至上能靠买股要对冲一些产业上改变的经济冲击
类似迹象你可以看这个 https://unwire.pro/2025/12/03/aws-ai-frontier/ai/
最主要核心概念是 以前我们在处理任何事情 受限资料型态或者产业
需要理解一些专业术语 或者理解如何操作资料 都是必须要从一个庞大乱序的资料
找到我们的需求
而现在这些对资料理解方式 可以改成用 "自然语言去操作"
可以想成是一个简单统一方式来面临现实世界庞大资讯操作
举个例子
以前在公司 我如果需要一些IT support 我可能得先想好去找哪个IT支援
如果是GPU cluster坏了 写单子给处理gpu cluster 有时候我想开一个H100 x 100 使用
写了request给IT说 他可能会 要你得先去跟某某 ai infra team得到许可
于是我针对该infra team 申请许可 他会回信说你得要提供现在做project代号
我们得看你是跟哪个business product部门 我们要知道他们finance budget code
这套流程跑下来 大概就是两个礼拜 因为所有一来一往都是人类 对方有时在忙别的
回复可能是几个小时 或者他们那边要核对 因为他们也是这样处理全公司IT request
所以不可能即时 然后他们也得找到对应上层拿权限
现在有AI代理人(Agent) 任何事情就是自然语言操作 你不用去花时间找对窗口
也不用花时间研究怎样申请流程 你就单纯跟他说你要啥
比方你对serval 这家公司出的IT代理人
Me:我要H100x100
AI(Serval): 你是要用在产品inference还是training?
Me:training
AI: 你这是foundamental research 还是prodouct开发?
Me:prdouct
AI: 好的 你优先级别会是P0 能写一下你的product细节吗
Me: 猎户座Project ,counter part负责人是 xxxx
AI: 好的 表格已经填好 你需要多少时间? 10T 储存够用吗 需要多少个Bucket?
Me: 10T ok, 5个1T bucket,
AI:好的 我已经把所有对应表格填好 送出中
一个小时后
人类IT, Infra老大 都在表格上签呈打个勾
AI: 你现在拥有3个月H100x100 存取cluster 路径如下
一个月后
h100 崩了 凌晨三点: 我打开slack接口
对AI:诶 GPU cluster崩了 帮我想想办法 多拉a梦 QQ
AI:我帮你看一下 好的 某些node的确不稳 基于你有P0等级 我帮你换到另一个node
凌晨四点 得到一个健康的node
Me: 谢谢你 多拉a梦 QQ
对比以前我还得去花几分钟看表格怎样填 送给哪个team request 繁琐变得简单话
AI-IT公司介绍
https://reurl.cc/rKE764
这让我想到星际迷航 IV:奋勇向前
当主角群从未来回到1980 跟当地人要借用电脑时 他们一开始是用声音去操作电脑
后来1980人类说你得用键盘打字的 主角:欧欧欧欧欧 震惊样
https://www.youtube.com/watch?v=hShY6xZWVGE
我的猜测是 在接下来五年后 许多繁琐的操作不在像以前 必须理解流程 迁就系统
可以直接用自然对话 把你需求说出 而ai代理人就是那个接口 架在传统庞大企业架构
让人类可以无负担的 不需要花琐碎时间推敲是该哪个部门协调 直接把事情做完
我们下一代会用不同方式去操作资讯 AWS在美国赌城召开第14届re:Invent年会
已经展现这事情离我们不远了(around corner)
有一个demo环节是 一个业余爱好开发者 他只用一个小时
做了一个用乒乓球投进纸杯游戏 系统根据距离和不同杯子
系统会在显示板上算出数字游戏分数 然后印发折价卷促销广告
以前这类型project
你要一个懂的用computer vision写出算法 侦测球 和球掉落在那个杯子
然后一个前端写UI架构 一个后端把整个系统处理完 至少是好几天的 数个人的工时
现在你只要用自然语言 一个业余爱好者 在一个小时内 就搭出这个平台
现在许多购物网站Walmart/Amazon 开始引入自然语言 消费者不需要知道去哪
找到自己要的东西 只要说你的价钱预算 颜色 类型 代理人会帮你找到这些资讯
而人类开始用自然语言来处理任何每天琐碎事务 透过ai代理人 去接触上古时代机器资料
以前是我们得屈就这些系统的规则 理解系统 才能得到我们要的资料
现在你有多拉a梦 对他说 帮帮我 他就会帮你了
那一天来的话 你手上可能需要NV/TSM/SK Hynix/Googl/QQQ
因为财富上的累积可能也会受此影响
讲点题外话
而这也让我有时感受到如果不买股 那财富差距可能会拉更大
Blind/一亩三分地/ 都可以看到一堆人资产靠者这波科技股直接冲到10~20M美金甚至50M
https://youtu.be/V_fV_g7Isy4?si=RU9CVg4eJRTDhztD
当然股票的确也在高点 但我一直觉到完全空手的是不太对 至少你可以保有30%现金
作为weather任何将来的storm
作者: fallinlove15 2025-12-14 08:46:00
可以什么都不懂 但不要忘了买台积 什么硅光模组 存算一体的相关技术 晶背供电 他都有 另一个就是NV基本上很多东西都是他去推动研发的
作者: fallinlove15 2025-12-14 10:15:00
光是降低进入不同领域门槛 还有降低物理应用的复杂度 帮助未知事物推理 就一堆可以玩的了 一直聚焦正确性永远有地方可以戳 那就都不用发展了啦举个例子 人类的动作不可能像机器一样每个动作完全一样 还不是做了一堆工作