OpenAI o1预览模型发布：推理能力更强可达理科博士生水准

邮箱网 0条评论 1554次浏览 2024年09月13日星期五 10:37

分享到：更多

9月13日消息，今日凌晨，OpenAI正式推出了OpenAI o1预览模型。

对于复杂推理任务而言，新模型代表着人工智能能力的崭新水平，其特点就是会在回答之前花更多时间进行思考，就像人类思考解决问题的过程一样。

OpenAI曾解释过，2023年发布的GPT-4类似于高中生的智能水平，而GPT-5则是完成AI从“高中生跃升至博士”的成长，o1模型就是其中关键的一步。

根据测试，o1模型在国际数学奥林匹克的资格考试中，能够拿到83%的分数，而GPT-4o只能正确解决13%的问题。

而在编程能力比赛Codeforces中，o1模型拿到89%百分位的成绩，而GPT-4o只有11%。

OpenAI表示，根据测试，在下一个更新的版本中，AI在物理、化学和生物学的挑战性基准测试中，表现能够与博士生水平类似。

相较于GPT-4o等现有的大模型，OpenAI o1能够解决更加困难的推理问题，同时改善过往模型中存在的机制性缺陷。

比如在解答编程问题时也会更有条理，在着手写代码前，把整个回答的流程全部思考完一遍，再动手输出代码。

o1会花更多时间思考

在o1模型中，AI会不断试错并打磨答案，从而显著提高生成结果的准确率和质量。

OpenAI 宣布，ChatGPT订阅用户从9月12日起可以访问这两个新模型，o1-preview每周消息数量限制为30条，o1-mini则为50条。（建嘉）

互联网协会反垃圾邮件工作委员会成员中国互联网协会理事单位