OpenAI 发布了 2 个新模型,OpenAI o1-preview 和 OpenAI o1-mini 。也被称为“草莓”系列,尽管这张截图可能会说不同
这些新模型旨在在回答之前进行更深入的思考,并比以前更好地解决复杂的问题。
在我们深入探讨之前,我们想提一下,o1 和 o1-mini 仅当您是 ChatGPT Plus 或 Team 用户时才可用,免费用户不可用。
现在……更深层次的推理到底意味着什么?
嗯,这些模型可以完善他们的思维,尝试不同的策略,甚至发现自己的错误。特别是 o1-preview 可以更有效地处理科学、编码和数学等 STEM 领域的复杂任务。
例如,在国际数学奥林匹克 (IMO) 资格考试中,GPT-4o 正确解决了 13% 的问题,而 o1-preview 模型的得分为 83%。
当我们提出一个高级数学问题并通过多个步骤收到答案时,这一点很明显,所有步骤都非常详细且有支持。
甚至不必是高级别的详细响应
当被问及现实生活中的数学场景时,我们会得到其背后的完整思维过程。
即使有有趣和愚蠢的问题,例如臭名昭著的“热狗是三明治吗?”这个模型为我们提供了一种结构化的格式。
看来o1-preview是在说话之前先思考一下
该模型旨在更深入地思考并更好地解释思维过程,而不仅仅是给您答案。这可以在用户界面本身中看到,因为它将分享对问题的思考时间。
与 ChatGPT 4o 相比,这可能会让人感觉明显延迟,但可以看出,响应背后有更多细节。
更多的是关于学习
与 ChatGPT 4 相比,当要求提供简单博客的代码时,o-1 预览版还解释了代码的含义和后续步骤。
还实施了新的安全培训
o1-preview 模型经过训练,不仅能够遵循安全指南,还能在上下文中理解和推理它们。这意味着他们可以更有效地应用安全规则,因为他们在生成响应时“仔细考虑”了指南。
这有利于防止“越狱”——用户试图让人工智能绕过其安全协议。 OpenAI 对安全采取了全面的方法,包括严格的测试、与安全机构的合作以及加强内部治理。
除了 o1-preview 之外,OpenAI 还发布了 o1-mini
这是一个更小、更快、更具成本效益的模型,针对编码任务进行了优化。与完整的 o1-preview 模型相比,它便宜 80%,并且代码的减少使得更广泛的用户更容易使用高级 AI 功能。
它非常适合寻求高效人工智能帮助而不需要广泛的世界知识的开发人员、教育工作者和企业。
但熟悉的功能也有一些局限性
与之前的型号不同,o1-preview 无法浏览网站或允许文件上传。对于 o1-mini,每周消息限制为 50 条。然而,Open AI 计划在未来实现和改进这些功能。
API 有什么新功能?
首先,该模型目前仅适用于 API 使用第 5 层的帐户,但应该很快就会向所有人开放。
要获得第 5 级资格,您必须已支付 1,000 美元,并且自首次成功向 OpenAI 付款以来已超过 30 天。
进一步讨论定价,这里有一个快速比较:
- GPT-4o — 5.00 美元/100 万个输入代币; $15.00 / 1M 输出代币
- o1-preview — 15.00 美元/100 万个输入代币; $60.00 / 1M 输出代币
- GPT-4o mini — 0.150 美元/100 万个输入代币; $0.600 / 1M 输出代币
- o1-mini — 3.00 美元/100 万个输入代币; $12.00 / 1M 输出代币
两种型号的初始限制均为每分钟 20 个请求 (RPM),但这一限制可能会发生变化。
当前模型的其他限制包括:
- 方式:仅文本,不支持图像。
- 消息类型:仅限用户和助理消息,不支持系统消息。
- 流媒体:不支持。
- Tools :不支持工具、函数调用和响应格式参数。
- Logprobs:不支持。
- 其他:
temperature
、top_p
和n
固定为1
,而presence_penalty
和frequency_penalty
固定为0
。 - Assistants 和 Batch :Assistants API 或 Batch API 不支持这些模型。
如果您想进一步使用 Python 测试 o1 模型,您可以在此处阅读有关它们的更多信息。
比较响应时间和令牌
响应时间
- GPT-4o — 5 秒
- o1-预览 — 20 秒
- GPT-4o 迷你 — 4 秒
- o1-mini — 11 秒
由于其推理能力,o1 模型需要更长的时间才能生成响应
代币
- GPT-4o — 401 个代币
- o1-preview — 2086 个代币
- GPT-4o mini — 415 个代币
- o1-mini — 1791 个代币
那么……这个新型号对我来说值得吗?
嗯,这取决于您的用例。到目前为止,o1 模型的一大改进是它为复杂和简单问题提供的推理和解释。
如果您正在创建 STEM 科目或与 STEM 科目密切合作,那么值得在您的设置中尝试 o1 模型。如果您在开发人工智能系统时需要帮助,我们也随时欢迎您致电!
但我们相信,对于您应用程序中的大多数任务,它们还不能证明定价和响应时间合理。不过我们很高兴看到 OpenAI 未来如何改进它。
免责声明
本文内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除。