上海人工智能实验室、 华东师范大学、 普林斯顿大学、 香港大学推出《OS-Copilot:迈向自我完善的多面手计算机代理》
这是一个构建通用代理的框架,能够与操作系统 (OS) 中的综合元素(包括 Web、代码终端、文件、多媒体和各种第三方应用程序)进行交互。
特点:
- 使用 Python 代码和 GPT-4 语言模型提示的混合构建了一个名为 Friday 的代理;
- 控制 Linux 或 Mac OS 计算机,
- 包括浏览器、Excel 和 PowerPoint,用于执行任务;和
- 自我提升
如何做到:
- 创建了一套顺序提示和代码,按代理进行分组,如
- 规划员--将用户请求分解为更小的任务
- 配置器--中间件,用于接收每个任务,并用内存中的数据或工具库中的方法对其进行配置,然后再传递给执行器
- 声明式内存--用户配置文件和以往操作的历史记录
- 工具库--可用工具
- 工作记忆--保存任务的下一步和以前的历史记录
- 执行器 - 生成可执行命令
- Critic评估者--评估任务是否已成功完成或是否需要反复执行
结果:
- 在一般代理的基准测试中,Friday(代理框架)的性能优于带插件的 GPT-4
- 它能在 Excel 和 PowerPoint 中执行任务,在Web检索、Excel和Powerpoint使用方面的基准测试中,表现优于GPT-4
说明什么?
- 这实际上是 Andrej Karpathy 提出的人工智能操作系统的工作演示
- 这个想法已经流传了一段时间
- 这些系统会变得更好