OpenAI 表示,Swarm 的目标是让代理协调和执行变得轻量、高度可控且易于测试。它通过两个关键概念实现这一目标:例程和切换。
例程由指令和工具组成。它可以随时决定将对话移交给另一个代理。OpenAI 表示,这些基本构建块可以表达工具和代理网络之间的复杂动态。
该框架还展示了 OpenAI 的“代理 AI”概念 - 这是一种抽象概念,包括语言模型、具体指令(系统提示)和工具。这些代理可以交互、将任务传递给其他代理并使用可用的工具。
OpenAI 声称,Swarm 允许开发人员测试可扩展的现实问题解决方案,而无需陡峭的学习曲线。该框架主要在客户端运行,不会在调用之间存储状态,类似于 Chat Completions API。该公司强调,Swarm 目前是一个用于探索多代理系统接口的实验性示例框架。它不适用于生产用途,也没有得到官方支持。
核心概念:交接Handoffs和例程routines
Swarm 的主要目标是展示OpenAI Cookbook中描述的交接和例程。交接让代理可以将对话控制权转交给另一个代理,就像电话转接一样。
例程是使用执行这些步骤所需的工具定义的自然语言步骤序列。它们可以被视为语言模型可以稳健处理的状态机。
OpenAI 认为这种方法适合管理许多难以在单个提示中编码的独立功能和指令。
Swarm 提供了一种轻量级、可扩展且可自定义的 Assistants API 替代方案。Assistants 提供完全托管的线程以及集成的内存和调用管理,而 Swarm 则面向希望完全透明并细粒度控制上下文、步骤和工具调用的开发人员。
示例和文档
OpenAI 在 GitHub 上发布了几个 Swarm 使用案例。其中包括一个简单的分类代理、一个天气代理,以及更复杂的设置,如航空公司客户服务和个人购物助理。
Swarm Cookbook介绍了核心概念和框架用法。其中包括运行 Swarm、定义代理和函数以及处理流和评估。
OpenAI 将多智能体系统视为提高 AI 推理能力的一条途径,符合其衡量 AGI 进展的五层标准中的第三层。该公司正在组建一个多智能体研究团队,致力于两种类型的 AI 智能体:一种用于自动执行设备上的复杂任务,另一种用于执行基于网络的任务,例如数据收集和航班预订。
总结
- OpenAI 在 GitHub 上发布了“Swarm”,这是一个用于创建、编排和部署多智能体系统的实验性开源框架。它旨在使智能体的协调和执行变得轻量、可控且易于测试。
- 该框架围绕两个基本抽象构建:包含指令和工具的例程,以及允许代理将对话传递给其他代理的切换。
- Swarm 目前是一个实验性的示例框架,不适用于生产用途。它旨在演示交接和例程的模式。OpenAI 在 GitHub 上提供了示例和详细文档。