https://openai.com/index/learning-to-reason-with-llms/
OpenAI今天发布经过强化学习训练的新型大语言模型o1
拥有执行复杂推理的能力
这就是传说中的草莓模型
o1在回答前会进行深入思考并产生内部推理链
可以纠正错误并尝试不同方法
o1数学实力=美国奥林匹克竞赛AIME前500名选手
(答对93% 2024 AIME题目)
在模拟Codeforces 程式设计竞赛中,o1位居前11%
在物理、生物和化学领域已经超过人类博士(GPQA考试成绩)