[新闻] 一发布就屠榜!Gemini 3.0 Pro强到让Op

楼主: blackpudding (甩奶抖肚拳)   2025-11-19 22:57:31
原文标题:一发布就屠榜!Gemini 3.0 Pro强到让OpenAI奥特曼都称赞 谷歌做对了什么?
原文连结:https://news.cnyes.com/news/id/6242913
发布时间:2025-11-19 11:32
记者署名:
※原文无记载者得留空
原文内容:
谷歌 (GOOGL-US) 正式发布最新一代推理模型 Gemini 3.0 Pro,并同步开放 API 接口及在
谷歌 AI Studio 推出预览版。这款模型一经发布,即刻横扫各大评测榜单,以“一夜封神
”的姿态震撼了全球 AI 社群。
值得玩味的是,OpenAI 执行长奥特曼也隔空向谷歌发来“贺电”,在社群媒体上评价“Gem
ini 3 看起来很不错”,谷歌执行长皮查伊(Sundar Pichai)则以一个轻松的表情包回应
,尽显王者风范。
Gemini 3.0 Pro 的强大并非空穴来风,其在关键的基准测试中实现了全面“碾压式”的领
先:
数学能力登顶全球: 在被誉为“地狱难度”的数学竞赛基准 MathArena 中,当 GPT-5.1
等其他顶级大模型仍在 1% 左右徘徊时,Gemini 3.0 Pro 的得分一举达到 23.4%,毫无争
议地成为当前全球数学能力最强的 AI。
推理与竞技场称王: 在 LMArena 大模型竞技场中,Gemini 3.0 Pro 以 1501 的 Elo 得分
高居榜首,证明其在通用推理和问题解决上的卓越能力。
视觉智慧翻倍提升: 更令人震撼的是其跨模态理解能力。Gemini 3.0 Pro 对萤幕截图的理
解准确率高达 72.7%,达到现有最先进水准的两倍。这项突破有望彻底重塑 AI Agent 操作
电脑的互动模式,让 AI 不再是“视觉障碍者”。
智慧编码体验: 尽管在 SWE-Bench 上未取得 SOTA,但其程式设计能力仍稳居第一梯队。
它在 Live Code Bench 的 Elo 得分突破 2400 分,并在工具调用与终端操作基准测试中排
名第一。
在更复杂的测验中,例如 Humanity"s Last Exam,Gemini 3.0 Pro 基础得分达 37.5%,开
启工具使用后更是直接飙升至 45.8%,远超竞争对手。在实测应用中,使用者甚至能只说一
句话,就透过 Gemini 3.0 Pro 生成一个完整可互动且带有实体引擎的游戏、一个颇具设计
美学的网站,或是一个复杂的 SVG 互动动画。
谷歌做对了什么?
在 AI 泡沫忧虑“血洗”美国科技股的背景下,谷歌母公司 Alphabet)(GOOGL-US) 的股价
却一反常态地刷新新高,成为市场焦点。分析师普遍认为,这一切归功于谷歌独特的 “全
端”(Full-Stack) 技术模式,正是这一模式为 Gemini 3.0 Pro 的诞生构筑了坚不可摧
的护城河。
谷歌执行长皮查伊曾表示,谷歌拥有从 芯片、数据、模型到尖端科学 的一系列技术,使其
更有能力应对 AI 市场的任何动荡。
Gemini 3.0 Pro 是基于 谷歌 自研的 张量处理单元(TPU) 训练而成。相较于 CPU 或通
用 GPU,TPU 在处理大语言模型所需的大规模计算时速度更快,且配备的大容量高频宽记忆
体能高效运行超大模型与批量资料,使 谷歌 在训练硬件上无需苦苦等待外部供应,实现了
芯片的跨越式发展。
同时,谷歌拥有全球最大的资讯网络和庞大的产品生态,包括谷歌 搜寻、YouTube 等。这
为 Gemini 提供了除了公共网络数据之外,海量的、高品质的用户数据和多元数据源。目前
,Gemini 月活跃用户已超过 6.5 亿,每月处理的 Token 总量在一年内增长超过 20 倍。
谷歌也发布了自家的 Agentic 程式设计平台 Google Antigravity,再添一枚“技术砝码”
。实际应用上,最新发布的 Gemini Agent 实验功能已能自主执行多步骤复杂流程。例如,
使用者只需提出“整理一下我的收件匣”,AI 即可自动优先安排待办事项,并起草邮件回
覆供用户确认。这体现了 Gemini 3.0 Pro 在 Agent 工具使用上的全面领先。
野心不止于此 这只是“热身”
DeepMind 开发者体验主管 Omar Sanseviero 在发布后发文称,当晚的发布会仅是“热身”
,暗示 谷歌 在 AI 领域的布局和野心远不止于此。
随着谷歌持续扩大资本投入,并利用其在芯片、网络、模型和应用上的全端优势,Gemini 3
.0 Pro 的横空出世,不仅是谷歌在 AI 竞赛中的一次决定性胜利,也预示著 AI 应用将进
入一个全新的、更加智慧与高效的时代。
心得/评论:
今天google的表现完全盖过即将开财报的老黄,3.0发布的评价更胜gpt,ai军备竞赛真的很
激烈,最后得利还是台积电,对吧?!
※必需填写满30正体中文字,无意义者板规处分

Links booklink

Contact Us: admin [ a t ] ucptt.com