楼主:
sam20135 (sam20135)
2024-12-21 15:10:01https://news.cnyes.com/news/id/5815798
AI竞争愈烈 OpenAI测试新AI模型o3与o3 mini
钜亨网编译陈又嘉
OpenAI 周五 (20 日) 宣布,目前正在测试其最新的推理 AI 模型 o3 和 o3 mini。此举
显示 AI 产业竞争日益激烈,包括 Google(GOOGL-US) 在内的竞争对手也致力于开发能处
理复杂问题的更先进模型。
OpenAI 执行长 Sam Altman 表示,公司计划在 1 月底推出 o3 mini 模型,随后推出完
整版本的 o3 模型。这些规模更大、更健全的语言模型预计将超越现有模型,有望吸引新
的投资与用户。
根据 OpenAI 一篇部落格文章,该公司于 9 月推出的 o1 模型已展示出解决科学、程式
编码与数学等复杂任务的能力。即将推出的 o3 和 o3 mini 模型目前正在进行内部安全
测试,其能力表现预计将远超过 o1 模型。
为了让外部研究人员参与测试过程,OpenAI 启动了申请程序,开放有兴趣的人在公开发
布前测试 o3 模型。这项申请程序将于 1 月 10 日截止。
自 2022 年 11 月推出 ChatGPT 以来,OpenAI 已成为 AI 产业的关键企业,引发了一场
可称为 AI 军备竞赛的浪潮。该公司凭借日益增长的知名度及持续推出产品,已成功吸引
了大量资金,在 10 月完成了 66 亿美元的融资。
OpenAI 在 AI 领域的主要竞争对手、Alphabet 旗下的 Google,则于 12 月初推出了其
第二代 AI 模型 Gemini,盼借此重返在 AI 科技竞赛中的领先地位。
他在说OPENAI那片的内容 O3的写程式分数已经赢中间那位穿白衣介绍的 只比首席工程师低一点数学问题的话 O3目前美国数学奥林匹亚已经96.7% 因为有一题不论怎样算都错。传统数学满足不了就跑去算给数学家在玩得未发表数学问题 正确率25% 其他模型都只有妮趴
作者: GodtoneIsGod (统神是神) 2024-12-21 18:17:00
openAI命名越来越乱了 3.5 4 4o o1 o3
AGI部分那测验是考推理能力 虽然他是87.5%通过人类85%的门槛 不过那是开大招所有资源全上算16小时不到两年时间可以用LLM+自我强化推到这程度看更详细的解说有提到o3是o1自我强化来 没有重新预训练 省去时间跟金钱不过85%门槛大概是为了降低恐慌 纽约大学找1400人测通过率只有73-77%