Re: [新闻] OpenAI危险了!DeepSeek正式发布V3.2 性

楼主: xross (xross)   2025-12-05 16:11:40
※ 引述《waitrop (嘴砲无双)》之铭言:
: ※ 引述《xross (xross)》之铭言:
: : 我看版上一堆 AI 下半场了 垃圾时间了 之类的分析文
: : 可是我左看又看 怎样都像白刃战 拼刺刀 杀疯了 卷疯了
: : 啥 Code Red 都出来了
: : Gemini 3 才出来几周
: : Deepseek 就来葛 +0.1 (v3.1 -> v3.2) 包含 IMO 数学金牌 AI
: : 说已经赶超 Gemini
: : 才没几天
: : Deepmind 就又突然出个 Deep Think 版 也是强调 IMO ICPC 数学 AI
: : "gold medal winning IMO and ICPC technologies"
: : https://x.com/demishassabis/status/1996683917991334300
: : 时间点上 不是巧合吧
: : 怎么看都像是逼对方出招啊
: : 说好的垃圾时间呢???
既然认真回复了 那我也回些东西
: 的确是垃圾时间,
: 但是垃圾时间的定义跟你说的不同,
: 首先,
: 我们来看最近最流行的这句话:
: Scaling is over and LLMs are a dead end.
: https://x.com/GaryMarcus/status/1993727856204198313/photo/1
: 翻成中文,
: 就是我11/12那天说的:
: 各家的LLM把世界资料都训练差不多之后,
: 各家的LLM都不会差太多
"资料/数据金矿挖完了" "空有铲子却没矿/dataset" (铲子过剩?! 算力过剩?!)
那要如何解释各家数学(math)能力蹭蹭往上涨呢??
论既有资料dataset 数学跟其他学科一比差不多是增长最少最慢的吧
做为对照 code 应该是最多的 很多类似功能的东西一而再再而三被表达出来
claude 喜欢强调 coding 能力我看他们多少是相信上面那行话
其二 先假设没过多久就撞墙了
那我们当下已经进入撞墙期了吗???
(类似客机速度数十年来钉死了 市场已容不下超音速等次世代客机)
我倾向否(not or not yet) 因为常常用一用就会发现AI降智
常见说法就是(分给你的)算力下降 一减算力就降智
照理说 人的感受哪有那么厉害 能随便感觉出来不就代表降智不少
多少反应升算力升智的重要 与算力已过剩论矛盾
对于升智的一个直观感受 就是今年最贵的AI 跟明年哪一档的AI感受差不多
大概多少可以反应出年增是否严重趋缓
目前各家白刃战 进步速度有目共睹 例如生图生影片的能力和年年进步堪称可怕不为过
作为对比 上古时代 电脑认字进步很缓慢的
贴个1986 vs 1989 (你引用的X文有提到这位老兄 我翻翻刚好看到他这另一篇文)
https://x.com/SchmidhuberAI/status/1995875626092315116
最后 这回文并非赞成或反对 Google/Deepmind 和其股价走势
论AI乐观程度 Deepmind 反而是最乐观的那一档 几个月前说 再五年AGI
"I don't know if it will be a single moment. It may be a gradual thing that
happens, but we'll have something that we could sort of reasonably call AGI,
that exhibits all the cognitive capabilities humans have, maybe in the next
five to 10 years, possibly the lower end of that."
- DeepMind CEO, Demis Hassabis
我个人反而远没这么乐观
: https://www.ptt.cc/bbs/Stock/M.1762925104.A.67F.html
: 如果最后大家的LLM都差不多一样,
: 那不就是LLM的垃圾时间,
: 接下来比拼的就是平台整合, 应用APP整合,
: 以及物理AI, Agent, Edge,
: 那就是回到了苹果跟谷歌的地盘,
: 这也是为何最近OpenAI一直亲门踏户到处抢六巨头的市场,
: 比方说做social media抢脸书市场,
: 做网购,线上支付,App支付等抢亚麻市场,
: 做search 广告抢谷歌市场,
: 直接在ChatGPT app里头开启App Store, 抢苹果市场,
: 因为接下来就是抢平台抢应用APP
: 至于这些跑分排行,
: 谁的LLM最强等等,
: 吹的, 听听就好,
: 最后都差不多,
: 每一两个月, 甚至一两个星期就会排名大洗牌,
: 最后大家都差不多一样强
: 我要说的说完了,
: 再说下去就是难听的实话,
: 又要遭到一堆OpenAI支持者的攻击,
: 我们接下来做两个假设,
: 1. 假设 "Scaling is over and LLMs are a dead end" 是真的,
: 那么大家都LLM都一样,
: 主要看平台看APP应用,
: 不然你就要改算法, 改方向,
: 我一直说方向错了,
: 然后被骂爆酸爆,
: 的确,
: OpenAI看来是要LLM一路走到底,
: 没想要改算法改方向,
: 但是这条路明显到尽头了
: 2. 假设 "Scaling is over and LLMs are a dead end" 是假的,
: 也就是继续大力出奇蹟,
: 堆积越多的算力 就会有越强的LLM AI表现,
: 这是过去几年奥特曼的OpenAI强调的观点,
: 所以过去几年奥特曼几乎把市场上的算力给囤满,
: 甚至囤到不够电力 让GPU放在仓库,
: 甚至囤到无限加价抢购GPU HBM (这些再说就敏感了)
: 如果Scaling可以继续下去,
: 那么把对手的算力资源给抢走,
: 对手也就只能投降
: 但是事实是这样吗? DeepSeek我不熟,
: 但是我确定Anthropic 的算力是远远比不上OpenAI,
: 但是Anthropic 的 claude 并不输(可能还赢) ChatGPT,
: 表示算力不是绝对的因素
: 再来说说谷歌的Gemini,
: 虽然TPU是量大管饱,
: 但是OpenAI 的算力是谷歌的三倍以上,
: 证明:
: OpenAI已经的算力部署订单是1.5兆 到2030年,
: 平均一年3000亿美金(300B),
: 谷歌2024-2025年的支出是100B,
: 但是这100B是要分给各个部门 (search, youtube, android, public cloud),
: AI分到的开支可能连一半都不到,
: MSFT AMZN支出也是100B左右,
: 也就是说 OpenAI 一年的算力支出是MSFT+AMZN+GOOG+META的总算力支出
: 但是ChatGPT并没有比Gemini三倍或是十倍聪明,
: 说落后Gemini又要被支持者攻击,
: 我们说平手或是稍微领先Gemini,
: 但是你ChatGPT花的钱跟算力是Gemini的三倍到十倍,
: 明显Scaling is over,
: 算力不是关键,
: 算法跟方向才是继续进步的关键

Links booklink

Contact Us: admin [ a t ] ucptt.com