使用“草莓”模型的目的是使OpenAI的人工智能不仅能够生成查询答案,还能够提前做好充足计划,自主可靠地在互联网上导航,执行OpenAI所说的“深度研究”。
推理是人工智能实现或超人类智能水平的关键。OpenAI正在开发代号为“草莓”(Strawberry)的新推理技术。
据路透社当地时间7月12日报道,OpenAI正在一个代号为”草莓”的项目中研究人工智能模型的新方法。路透社5月份看到的OpenAI内部文件副本显示,OpenAI内部团队正在开发“草莓”,该文件详细说明了OpenAI打算如何使用“草莓”进行研究的计划。
知情人士表示,即使在OpenAI内部,“草莓”的工作原理也是一个严格保密的秘密。该文件描述了一个使用“草莓”模型的项目,目的是使OpenAI的人工智能不仅能够生成查询答案,还能够提前做好充足计划,自主可靠地在互联网上导航,以执行OpenAI所说的“深度研究”。
该文件描述了“草莓”的目标,但未说明如何实现。
有知情人士表示,“草莓”涉及一种处理人工智能模型的专门方式,该模型在非常大的数据集上进行预训练。“草莓”包括一种被称为“后训练”(post-training)的OpenAI生成式人工智能模型专门方法,即在对大量生成数据进行“训练”后,对基础模型进行调整,以特定方式提升性能。知情人士表示,“草莓”与斯坦福大学2022年开发的一种“自学推理”(Self-Taught Reasoner,STaR)方法有相似之处。
STaR创建者之一、斯坦福大学教授诺亚·古德曼(Noah Goodman)告诉路透社,STaR使人工智能模型能够通过迭代创建它们自己的训练数据来“引导”自己达到更高的智能水平,理论上可以用来让大语言模型超越人类的智能水平。“这既令人兴奋又令人恐惧……如果事情继续朝着这个方向发展,我们作为人类就有一些严肃的事情要考虑了。”古德曼表示。
当被问及“草莓”及其相关细节时,OpenAI一位发言人在一份声明中表示,“我们希望我们的人工智能模型能像我们一样看到和理解这个世界。不断研究新的人工智能能力是业界的一种普遍做法,大家相信,随着时间的推移,这些系统将在推理方面得到改进。”发言人并未直接回答有关“草莓”的问题。
据路透社报道,“草莓”项目的前身是Q*,该项目在OpenAI内部已被视为一项突破。两个消息来源描述了今年早些时候OpenAI工作人员告诉他们的Q*演示,它能够回答目前商业模型无法解决的科学和数学问题。
人工智能推理包括形成一个模型,使人工智能能够提前计划,反映物理世界的运作方式,并可靠解决具有挑战性的多步骤问题。从重大科学发现,到规划和构建新的软件应用程序,提高大模型的推理能力被视为解锁模型能力的关键。OpenAI首席执行官山姆·奥特曼今年早些时候表示,在人工智能领域“最重要的进步将围绕推理能力展开”。但研究人员也持不同意见,现代人工智能先驱之一的Yann LeCun就经常说,大模型不具备类似人类的推理能力。