极客FUN OpenAI「草莓」模型今年秋天发布，大幅强化推理能力，生成数据供给GPT-5

神神秘秘、传闻多日的 OpenAI 「草莓」模型有了更多的消息。

据 The Information 报道，OpenAI 计划在今年秋天，把推理能力大幅强化的代号「草莓」模型集成到 ChatGPT 中，并正为此寻求更多资金支持。

以下内容来自 The Information，Founder Park 编译整理。

点击关注，每天更新深度 AI 行业洞察

01 能解决从未见过的数学问题

OpenAI 的研发团队认为，相较现有的 AI 产品，全新产品能更好地解决复杂问题。「草莓」的强大之处在于，它能够解决之前从未见过的数学问题，而这是目前的生成式智能很难做到的。

这个模型还接受过编程问题的相关训练。不过，它的能力不仅限于技术问题。如果给它更多「思考」时间，「草莓」还能回答一些更为主观的问题，比如产品营销策略。

为了展示「草莓」在语言任务上的能力，OpenAI 的员工向同事们展示了一个实例——它能够解出复杂的字谜题目。

本月早些时候，大家就在猜测 OpenAI 是否有新产品要发布。CEO Sam Altman在推特上发了一张草莓的图片，但没透露更多细节。

CEO Sam Altman 在推特上发的草莓图片

在生成式 AI 或 LLM 领域的激烈竞争中，「草莓」的推出是 OpenAI 创新的一部分成果。这项技术可能影响未来智能体（Agent）产品，它们被用来解决多步骤任务，OpenAI 及其竞争对手都希望这能够为他们带来更多的收入机会。

目前，OpenAI 的业务正以惊人的速度增长：与一年前相比，出售给企业和 ChatGPT 订阅的收入大约增加了三倍，达到每月 2.83 亿美元。尽管每月的亏损可能高于这个数字。这家公司目前的私人估值却已经达到了 860 亿美元。

不过，OpenAI 的未来前景，也有一部分取决于他们正在开发的新旗舰大语言模型——「猎户座」（Orion）的最终发布。这个模型旨在改进去年推出的现有旗舰模型 GPT-4。现在，其他竞争对手已经发布了与 GPT-4 表现相当的大语言模型。

目前还不清楚 OpenAI 是否能够在今年内顺利推出和发布能超越 GPT-4 和 ChatGPT 表现的「草莓」Chatbot。这个版本是「草莓」模型的一个较小、简化的版本，被称为「蒸馏版」（distillation）。它试图在保留大模型性能的同时，简化操作并降低成本。

不过，据知情人士透露，OpenAI 还在利用更大的「草莓」版本生成用于训练「猎户座」的数据。这种由 AI 生成的数据被称为「合成数据」，这意味着「草莓」可以帮助 OpenAI 克服在获取大量高质量数据上的困难，特别是那些从互联网上获取的真实文本或图像数据。

此外，这位人士还表示，「草莓」可能也会对即将推出的 OpenAI 智能体有所帮助。

02 能够减少「幻觉」

Minion AI 的 CEO、前 GitHub Copilot 首席架构师 Alex Graveley 表示，用「草莓」生成更高质量的训练数据，可能有助于 OpenAI 减少模型产生的错误，也就是所谓的「幻觉」。

Graveley 打了个比方，「想象一下一个没有幻觉的模型，你给它出个逻辑难题，它第一次就能答对。」这是因为「训练数据更精准，模型就不需要胡乱猜测了。」

知情人士透露，今年夏天 OpenAI 向国家安全官员展示了「草莓」的能力。

「我们觉得下一个模型的数据已经够用了，」CEO Altman 在五月的一次活动中说，可能是在指 Orion。「我们做了很多实验，包括生成合成数据。」

他还在为公司筹集更多资金，并寻找减少亏损的方法。知情人士透露，自 2019 年以来，OpenAI 已经从 Microsoft 筹集了约 130 亿美元，这笔钱是作为双方商业合作的一部分，合作协议将持续到 2030 年。这位知情人士还说，合作条款可能会调整，比如 OpenAI 如何支付 Microsoft 租赁云服务器的费用，因为云服务器是 OpenAI 最大的成本。

对于这篇报道，OpenAI 的发言人没有发表评论。路透社此前已经报道过「草莓」的名字及其推理目标。

03 有钱赚的场景

能解决复杂数学问题的 AI 可能会成为一个很赚钱的应用，因为现在的 AI 在需要大量数学运算的领域（如航空航天和结构工程）表现得并不理想。

研究人员发现，生成式人工智能像是 ChatGPT——常常给出错误答案，这些错误在数学考试中肯定会不及格。

提升数学推理能力，也能帮助 AI 模型更好地理解客户服务请求等会话查询。Google 和一些初创公司也在加紧开发推理技术。上个月，Google DeepMind 表示，他们的 AI 将在国际数学奥林匹克竞赛中击败大多数人类选手。另一个主要竞争对手 Anthropic 则表示，他们最新的 LLM 可以编写更复杂的软件代码，并且能回答关于图表和数据的问题，这得益于其推理能力的提升。

为了提高模型的推理能力，一些初创公司想出了个更省钱的办法，就是把问题拆分成更小的步骤，虽然这种方法慢且成本不低。

无论「草莓」最终能否上市，大家对「猎户座」Orion 都寄予厚望，期待着 OpenAI 继续保持领先地位，延续它惊人的收入增长。

本月早些时候，Google 抢在 OpenAI 之前发布了一款 AI 语音助手，这款助手能够灵活应对用户打断和突然转换话题的情况，虽然 OpenAI 早在五月就公布了它的版本。

Google、xAI、Anthropic 和 Meta Platforms 等公司开发的 LLM 也在排行榜上迅速赶上了 OpenAI，尽管 OpenAI 的模型依然是企业客户和 AI 应用开发者的首选。

04 Ilya看到了什么？

「草莓」这个项目源自几年前的研究，当时还是 OpenAI 首席科学家的 Ilya Sutskever 启动了这个项目。他最近离职，创立了与 OpenAI 竞争的人工智能实验室。

在他离开前，OpenAI 的研究员 Jakub Pachocki 和 Szymon Sidor 在他的基础上开发了一个新的数学解题模型 Q*，这让一些关注 AI 安全的研究人员感到不安。

在 OpenAI 获得技术突破，发生安全冲突的时候，由 Sutskever 主导的 OpenAI 董事会解雇了 Altman，但很快又把他请回来了。

去年，在 Q*推出前夕，OpenAI 的研究人员开发了一个叫做「测试时计算」（test-time computation）的方法，旨在提高 LLM 的解题能力。这种方法允许模型在回答问题时有更多时间考虑指令的各个细节。当时，Sutskever 还发了一篇相关的博文。

OpenAI「草莓」模型今年秋天发布，大幅强化推理能力，生成数据供给GPT-5

01

能解决从未见过的数学问题

02

能够减少「幻觉」

03

有钱赚的场景

04

Ilya看到了什么？

「草莓」这个项目源自几年前的研究，当时还是 OpenAI 首席科学家的 Ilya Sutskever 启动了这个项目。他最近离职，创立了与 OpenAI 竞争的人工智能实验室。

全球最大AI竞技场竟在国内？五大顶流国产模型化身武侠少女硬核PK

50%优势，力压OpenAI和DeepMind！清华DSAC系列算法全面解析

AI模拟5亿年生物进化，ESM3开启「蛋白质创世纪」！论文登上Science

Mira Murati，ChatGPT 前高级执行官，有一个属于她自己的神秘人工智能项目

OpenAI员工疯狂暗示，内部已成功开发ASI？被曝训出GPT-5但雪藏

基础产品管理：为什么它在人工智能时代更加重要

最好的人工智能程序员，来自 Weights & Biases

OpenAI「草莓」模型今年秋天发布，大幅强化推理能力，生成数据供给GPT-5

01

能解决从未见过的数学问题

02

能够减少 「幻觉」

03

有钱赚的场景

04

Ilya看到了什么？

「草莓」这个项目源自几年前的研究，当时还是 OpenAI 首席科学家的 Ilya Sutskever 启动了这个项目。他最近离职，创立了与 OpenAI 竞争的人工智能实验室。

全球最大AI竞技场竟在国内？五大顶流国产模型化身武侠少女硬核PK

50%优势，力压OpenAI和DeepMind！清华DSAC系列算法全面解析

AI模拟5亿年生物进化，ESM3开启「蛋白质创世纪」！论文登上Science

Mira Murati，ChatGPT 前高级执行官，有一个属于她自己的神秘人工智能项目

OpenAI员工疯狂暗示，内部已成功开发ASI？被曝训出GPT-5但雪藏

基础产品管理：为什么它在人工智能时代更加重要

最好的人工智能程序员，来自 Weights & Biases

能够减少「幻觉」