Re: [讨论] OpenAI GPT o1模型 zxwxz PTT批踢踢实业坊

Re: [讨论] OpenAI GPT o1模型

楼主: zxwxz (zxwxz) 2024-09-18 11:19:17

OpenAI 最近推出了 GPT-o1，但很多人可能还没意识到这件事的严重性。事实上，OpenAI
已经找到了一条通往 AGI（通用人工智能）的阶梯！这个新模型的关键在于，它已经整合了
ToT（思维树）和 RL（强化学习），在大型语言模型（LLM）领域达到了类似 AlphaGo Zer
o 的水准。
很多人以为 LLM 就是个“刷题机器”，记住了大量的资料，所以我们在人类记忆力上输了
。但这种想法只能说对一半。之前的 LLM 确实是从大量资料中，透过模式相似性来猜测答
案。模型够大，猜得也够准，但一旦遇到需要推理和逻辑的超长尾问题，就挂了。没有连贯
的推理能力，肯定解不出来。
然而，o1 模型的训练方式完全不同。它花了大量时间在模型微调上，让模型针对已知的问
答，把所有的思考过程（CoT）都想出来。网络上很多资料只有问题和答案，中间的推理过
程要嘛没有，要嘛只提重点。这些都是靠强化学习逼出来的。
如果有兴趣，建议大家读一下 OpenAI 官网的技术报告和论文：
https://openai.com/index/weak-to-strong-generalization/
。重点在这句：“当我们用这种方法，用 GPT-2 级别的模型来监督 GPT-4 在 NLP 任务上
的表现，结果模型的性能通常介于 GPT-3 和 GPT-3.5 之间。”
在这种新机制下，OpenAI 已经不需要再从网络抓资料了。他们可以透过 LLM 之间的互动，
产生问题和答案，进行更广泛、更完整的训练。而且这种训练方式相当于，你虽然只学过小
学数学，但经过长时间的策略搜索和 ToT 机制，类似于 System 2 的思考，你可以解出国
中数学题。
当这些能力达到单一模型的算力极限时，可以透过扩大模型，把新知识装载进更大的模型，
透过 Transformer 达成 System 1 思考的嵌入。这就像学好国中数学的新模型，开始挑战
高中数学。提升智力的方式是无限的，只受限于你的 GPU 算力。
你知道吗，OpenAI 在解决 AIME 2024 的最新题目时，没有任何过去的考古题可参考，里面
的推导公式连他们的员工都看不懂。难道还有人以为 AI 是靠背题目来解答的吗？
※ 引述《wsad50232 (GGYY)》之铭言：
: 标题: Re: [讨论] OpenAI GPT o1模型
: 时间: Tue Sep 17 12:46:33 2024
: 　
: 　
: 不就是语言模型+题库
: 　
: 题库1000题不够，那就10000题
: 一万题不够，那就10万题
: 看你人的脑袋能装多少题库拼的过吗？
: 　
: 但是对那些非一般性的
: 面向多的，没有标准答案的
: 个别性强，特殊场合，网上找不到答案的
: 资料不足，不完善的
: 　
: AI 就嗝了
: 　
: 某小气公司难得花了大钱买了Licence
: 打算明年缩减一半的人力来完成更多的工作
: 　
: 只能说这些早就不碰技术的高层
: 异想天开脑袋装屎
: 　
: AI 能解的问题人工早就解了
: 人工不能解的 AI 也不能解
: 但是AI会唬烂很多行不通的答案
: 来浪费人工去验证
: 　
:

作者: gogogogo3333 (gogogogo33333) 2024-09-18 13:31:00

AGI is clearly here. But fine … Don’t look up.

作者: likeyousmile 2024-09-18 22:55:00

推

作者: kissa0924307 (瓦斯来一桶) 2024-09-19 01:51:00

天网的原型？

作者: darkangel119 (星星的眷族) 2024-09-19 10:28:00

人类是拿来当电池 ~~

继续阅读

Re: [新闻] 想赴大陆读硕士！清大资工男曝隐忧前辈Subaru5566 [新闻] 最新进度！台积电高雄P3厂本月动工 P1厂jeff0025 [新闻] 真主党成员呼叫器同时爆炸似为台湾制造 KotoriCute [新闻] 台积电德国厂动土后英特尔宣布暂缓德国Angels5566 [新闻] 三星垂涎辉达订单韩媒：品质差hvariables [新闻]面板业纷传售旧厂，施振荣：因中国杀价竞pl132 [新闻] 瞄准33亿美元全球无人船市场！雷虎科技增cjol [新闻] Gogoro创办人陆学森闪辞，润泰集团进入pmes9866 [新闻] Amazon将要求员工每周要进公司5天LinuxKernel Re: [讨论] 板友讨论薪水讲实话被嘘得很惨？mooto