极客FUN OpenAI 的新 o1-preview 和 o1-mini 模型有何进展？

OpenAI 发布了 2 个新模型，OpenAI o1-preview 和 OpenAI o1-mini 。也被称为“草莓”系列，尽管这张截图可能会说不同

这些新模型旨在在回答之前进行更深入的思考，并比以前更好地解决复杂的问题。

在我们深入探讨之前，我们想提一下，o1 和 o1-mini 仅当您是 ChatGPT Plus 或 Team 用户时才可用，免费用户不可用。

现在……更深层次的推理到底意味着什么？

嗯，这些模型可以完善他们的思维，尝试不同的策略，甚至发现自己的错误。特别是 o1-preview 可以更有效地处理科学、编码和数学等 STEM 领域的复杂任务。

例如，在国际数学奥林匹克 (IMO) 资格考试中，GPT-4o 正确解决了 13% 的问题，而 o1-preview 模型的得分为 83%。

当我们提出一个高级数学问题并通过多个步骤收到答案时，这一点很明显，所有步骤都非常详细且有支持。

甚至不必是高级别的详细响应

当被问及现实生活中的数学场景时，我们会得到其背后的完整思维过程。

即使有有趣和愚蠢的问题，例如臭名昭著的“热狗是三明治吗？”这个模型为我们提供了一种结构化的格式。

看来o1-preview是在说话之前先思考一下

该模型旨在更深入地思考并更好地解释思维过程，而不仅仅是给您答案。这可以在用户界面本身中看到，因为它将分享对问题的思考时间。

与 ChatGPT 4o 相比，这可能会让人感觉明显延迟，但可以看出，响应背后有更多细节。

还实施了新的安全培训

o1-preview 模型经过训练，不仅能够遵循安全指南，还能在上下文中理解和推理它们。这意味着他们可以更有效地应用安全规则，因为他们在生成响应时“仔细考虑”了指南。

这有利于防止“越狱”——用户试图让人工智能绕过其安全协议。 OpenAI 对安全采取了全面的方法，包括严格的测试、与安全机构的合作以及加强内部治理。

除了 o1-preview 之外，OpenAI 还发布了 o1-mini

这是一个更小、更快、更具成本效益的模型，针对编码任务进行了优化。与完整的 o1-preview 模型相比，它便宜 80%，并且代码的减少使得更广泛的用户更容易使用高级 AI 功能。

它非常适合寻求高效人工智能帮助而不需要广泛的世界知识的开发人员、教育工作者和企业。

但熟悉的功能也有一些局限性

与之前的型号不同，o1-preview 无法浏览网站或允许文件上传。对于 o1-mini，每周消息限制为 50 条。然而，Open AI 计划在未来实现和改进这些功能。

API 有什么新功能？

首先，该模型目前仅适用于 API 使用第 5 层的帐户，但应该很快就会向所有人开放。

要获得第 5 级资格，您必须已支付 1,000 美元，并且自首次成功向 OpenAI 付款以来已超过 30 天。

进一步讨论定价，这里有一个快速比较：

GPT-4o — 5.00 美元/100 万个输入代币； $15.00 / 1M 输出代币
o1-preview — 15.00 美元/100 万个输入代币； $60.00 / 1M 输出代币
GPT-4o mini — 0.150 美元/100 万个输入代币； $0.600 / 1M 输出代币
o1-mini — 3.00 美元/100 万个输入代币； $12.00 / 1M 输出代币

两种型号的初始限制均为每分钟 20 个请求 (RPM)，但这一限制可能会发生变化。

当前模型的其他限制包括：

方式：仅文本，不支持图像。
消息类型：仅限用户和助理消息，不支持系统消息。
流媒体：不支持。
Tools ：不支持工具、函数调用和响应格式参数。
Logprobs：不支持。
其他： temperature 、 top_p和n固定为1 ，而presence_penalty和frequency_penalty固定为0 。
Assistants 和 Batch ：Assistants API 或 Batch API 不支持这些模型。

如果您想进一步使用 Python 测试 o1 模型，您可以在此处阅读有关它们的更多信息。

比较响应时间和令牌

响应时间

GPT-4o — 5 秒
o1-预览 — 20 秒
GPT-4o 迷你 — 4 秒
o1-mini — 11 秒

由于其推理能力，o1 模型需要更长的时间才能生成响应

代币

GPT-4o — 401 个代币
o1-preview — 2086 个代币
GPT-4o mini — 415 个代币
o1-mini — 1791 个代币

那么……这个新型号对我来说值得吗？

嗯，这取决于您的用例。到目前为止，o1 模型的一大改进是它为复杂和简单问题提供的推理和解释。

如果您正在创建 STEM 科目或与 STEM 科目密切合作，那么值得在您的设置中尝试 o1 模型。如果您在开发人工智能系统时需要帮助，我们也随时欢迎您致电！

但我们相信，对于您应用程序中的大多数任务，它们还不能证明定价和响应时间合理。不过我们很高兴看到 OpenAI 未来如何改进它。

免责声明
本文内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场，如有侵权或其它，请联系 admin@eiefun.com，我们会第一时间配合删除。

OpenAI 的新 o1-preview 和 o1-mini 模型有何进展？

现在……更深层次的推理到底意味着什么？

甚至不必是高级别的详细响应

看来o1-preview是在说话之前先思考一下

更多的是关于学习

还实施了新的安全培训

除了 o1-preview 之外，OpenAI 还发布了 o1-mini

但熟悉的功能也有一些局限性

API 有什么新功能？

比较响应时间和令牌

那么……这个新型号对我来说值得吗？

《卫报》对人工智能和公共服务的看法：计算机无法解决英国的所有问题

部长们考虑允许私营公司从人工智能推动的 NHS 数据中获利

微软组建新的AI团队瞄准端到端应用开发与部署

头部高校纷纷开设AI大课：重塑教育范式，淘汰老旧课程将成常态

“人工智能+”赋能多场景应用将为经济发展注入“新活力+新动能”

中金董事长陈亮：中国人工智能市场为世界经济注入新增长动能

马慧娟代表：普及“人工智能+养老服务”

OpenAI 的新 o1-preview 和 o1-mini 模型有何进展？

现在……更深层次的推理到底意味着什么？

甚至不必是高级别的详细响应

看来o1-preview是在说话之前先思考一下

更多的是关于学习

还实施了新的安全培训

除了 o1-preview 之外，OpenAI 还发布了 o1-mini

但熟悉的功能也有一些局限性

API 有什么新功能？

比较响应时间和令牌

那么……这个新型号对我来说值得吗？

《卫报》对人工智能和公共服务的看法：计算机无法解决英国的所有问题

部长们考虑允许私营公司从人工智能推动的 NHS 数据中获利

微软组建新的AI团队 瞄准端到端应用开发与部署

头部高校纷纷开设AI大课：重塑教育范式，淘汰老旧课程将成常态

“人工智能+”赋能多场景应用 将为经济发展注入“新活力+新动能”

中金董事长陈亮：中国人工智能市场为世界经济注入新增长动能

马慧娟代表：普及“人工智能+养老服务”

微软组建新的AI团队瞄准端到端应用开发与部署

“人工智能+”赋能多场景应用将为经济发展注入“新活力+新动能”