OpenAI 发表了新模型「OpenAI o1」预览版,模型标榜在给出回复之前会花更多时间思考,能针对更复杂的任务进行推理。即日起开放给 ChatGPT Plus 和 Team 的用户在 ChatGPT 中选择 o1-preview 模型来使用。
相较过去的模型,OpenAI o1 可解开更困难的科学、代码和数学问题。新模型在物理、化学和生物学等领域的基准任务上,表现与人类博士生相当;在国际数学奥林匹克资格考试中,正确解答了 83% 的问题(相较 GPT-4o 只解开 13% 问题);Codeforces 代码编写竞赛中达到第 89 个百分等级。
OpenAI o1 使用了强化学习,在模型得到正确、错误答案时,给予正面或负面回馈,来改善其推理过程,模型也因此会意识到自己的错误,并微调用来得出答案的策略,让思考过程更加完善。
OpenAI o1 仍为预览版,而作为早期模型其不具备 ChatGPT 的部分功能,包括浏览网页、上传文档和图像,且速度较慢,因此短期内 GPT-4o 在许多场景下仍较为强大。
OpenAI o1 是一系列新 AI 模型的首款,公司也发布了更快、更便宜的「OpenAI o1-mini」,较 o1-preview 便宜了 80%,在代码编写上尤其有效。
OpenAI o1 最大特色:采用新推理典范
首席技术官 Mira Murati 表示,AI 模型有两种典范:规模典范、新典范(o1 采用),而 OpenAI 希望能结合两种典范。Murati 透露他们正在打造 GPT-5,规模将比其前身大得多,也有可能加入刚推出的推理技术。
研究 VP Mark Chen 也强调「新模型正在学习独立思考,而不是像传统的 LLM 是试图模仿人类的思考方式。」
OpenAI 想通过 o1 模型展示新开发的推理方法,进一步显示 AI 不需要花费大量的运算能力,「新典范一个令人兴奋的地方在于,能使我们以更便宜的价格提供(人工)智能。」
OpenAI o1 在公司内部代号即为先前传出的「Strawberry」,但新模型并非 GPT-4o 的继承者,而是在补足 GPT-4o。
GitHub 实测:肯定 o1 的代码分析和优化能力
GitHub 实测了将 o1-preview 与 GitHub Copilot 相集成,发现新模型在代码分析和优化方面给出良好的结果,这是因 o1 能一步步思考回复,使 Copilot 可将复杂的任务分解为结构化的步骤。
GitHub 让 o1 模型协助让算法更加完善,新模型的推理能力使其能够更深入理解代码的限制和边缘案例,有助于产生更有效率、更高品质的结果。
另一项实测中,GitHub 发现 o1 模型在几分钟内辨识性能 bug 并开发出解方,反观人类软件工程师可能需花几个小时。
GitHub 也有发现 o1 模型的回复是经过深思熟虑且有目的性,让开发人员能快速查明问题后实施解决方案,而 GPT-4o 会产生一堆代码,但不会给出逐行的解决方案。
版权声明
本文为本站原创内容,转载需注明文章来源(https://www.eiefun.com),另:文中部分素材可能会引用自其他平台,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除