极客FUN OpenAI 最新模型「o1」亮相！运用新 AI 推理典范，更接近独立思考

OpenAI 发表了新模型「OpenAI o1」预览版，模型标榜在给出回复之前会花更多时间思考，能针对更复杂的任务进行推理。即日起开放给 ChatGPT Plus 和 Team 的用户在 ChatGPT 中选择 o1-preview 模型来使用。

相较过去的模型，OpenAI o1 可解开更困难的科学、代码和数学问题。新模型在物理、化学和生物学等领域的基准任务上，表现与人类博士生相当；在国际数学奥林匹克资格考试中，正确解答了 83% 的问题（相较 GPT-4o 只解开 13% 问题）；Codeforces 代码编写竞赛中达到第 89 个百分等级。

OpenAI o1 使用了强化学习，在模型得到正确、错误答案时，给予正面或负面回馈，来改善其推理过程，模型也因此会意识到自己的错误，并微调用来得出答案的策略，让思考过程更加完善。

OpenAI o1 仍为预览版，而作为早期模型其不具备 ChatGPT 的部分功能，包括浏览网页、上传文档和图像，且速度较慢，因此短期内 GPT-4o 在许多场景下仍较为强大。

OpenAI o1 是一系列新 AI 模型的首款，公司也发布了更快、更便宜的「OpenAI o1-mini」，较 o1-preview 便宜了 80%，在代码编写上尤其有效。

OpenAI o1 最大特色：采用新推理典范

首席技术官 Mira Murati 表示，AI 模型有两种典范：规模典范、新典范（o1 采用），而 OpenAI 希望能结合两种典范。Murati 透露他们正在打造 GPT-5，规模将比其前身大得多，也有可能加入刚推出的推理技术。

研究 VP Mark Chen 也强调「新模型正在学习独立思考，而不是像传统的 LLM 是试图模仿人类的思考方式。」

OpenAI 想通过 o1 模型展示新开发的推理方法，进一步显示 AI 不需要花费大量的运算能力，「新典范一个令人兴奋的地方在于，能使我们以更便宜的价格提供（人工）智能。」

OpenAI o1 在公司内部代号即为先前传出的「Strawberry」，但新模型并非 GPT-4o 的继承者，而是在补足 GPT-4o。

GitHub 实测：肯定 o1 的代码分析和优化能力

GitHub 实测了将 o1-preview 与 GitHub Copilot 相集成，发现新模型在代码分析和优化方面给出良好的结果，这是因 o1 能一步步思考回复，使 Copilot 可将复杂的任务分解为结构化的步骤。

GitHub 让 o1 模型协助让算法更加完善，新模型的推理能力使其能够更深入理解代码的限制和边缘案例，有助于产生更有效率、更高品质的结果。

另一项实测中，GitHub 发现 o1 模型在几分钟内辨识性能 bug 并开发出解方，反观人类软件工程师可能需花几个小时。

GitHub 也有发现 o1 模型的回复是经过深思熟虑且有目的性，让开发人员能快速查明问题后实施解决方案，而 GPT-4o 会产生一堆代码，但不会给出逐行的解决方案。

OpenAI 最新模型「o1」亮相！运用新 AI 推理典范，更接近独立思考

OpenAI o1 最大特色：采用新推理典范

GitHub 实测：肯定 o1 的代码分析和优化能力

第一批用上苹果AI的人，已经后悔了

当你以为AI发展放缓时，OpenAI推出o3，向AGI迈出关键一步

o3权威评测报告：AI能力实现关键跃升，但仍未达到AGI水平

刚刚，OpenAI放出最后大惊喜o3，高计算模式每任务花费数千美元

AI同时操控200个机器人，任务成功率超90%，半数故障依然「能打」

告别AR滤镜！IG宣布将推AI视频功能用户反应两极

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

OpenAI 最新模型「o1」亮相！运用新 AI 推理典范，更接近独立思考

OpenAI o1 最大特色：采用新推理典范

GitHub 实测：肯定 o1 的代码分析和优化能力

第一批用上苹果AI的人，已经后悔了

当你以为AI发展放缓时，OpenAI推出o3，向AGI迈出关键一步

o3权威评测报告：AI能力实现关键跃升，但仍未达到AGI水平

刚刚，OpenAI放出最后大惊喜o3，高计算模式每任务花费数千美元

AI同时操控200个机器人，任务成功率超90%，半数故障依然「能打」

告别AR滤镜！IG宣布将推AI视频功能 用户反应两极

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

告别AR滤镜！IG宣布将推AI视频功能用户反应两极