上海交大团队首次系统梳理AI智能体协议,提出二维分类框架,揭示MCP、A2A、ANP等协议如何构建未来智能体互联网,推动集体智能崛起。
当AI智能体开始“联网”:一场堪比TCP/IP革命的协议大爆发正在上演!
为什么我们今天能用手机刷短视频、点外卖、打车?这一切的背后,其实都离不开一个叫“协议”的东西。比如你熟悉的HTTP、TCP/IP,它们就像互联网世界的“交通规则”,让不同设备、不同系统之间能顺畅沟通。而今天,在AI智能体的世界里,一场类似的协议革命正在悄然爆发!
最近,上海交通大学联合ANP社区的一群顶尖研究者,发布了一篇重磅综述《AI智能体协议综述》。作者包括杨 Yingxuan、柴 Huacan、宋 Yuanyi、戚 Siyuan、温 Muning、李 Ning、廖 Junwei、胡 Haoyi、林 Jianghao(通讯作者)、常 Gaowei(来自ANP社区)、刘 Weiwen、温 Ying、俞 Yong、张 Weinan。这支团队不仅深耕大模型与多智能体系统多年,还在工业界与开源社区拥有广泛影响力——比如常高威就是推动“智能体互联网”理念的核心人物之一。他们首次系统性梳理了当前所有主流AI智能体通信协议,并提出了一个清晰的二维分类框架,堪称AI智能体领域的“协议地图”。
那么,什么是AI智能体协议?简单说,就是让AI智能体(尤其是基于大语言模型的智能体)能够彼此对话、调用工具、共享信息、协同工作的“通用语言”。没有它,每个AI就像一个只会方言的孤岛,哪怕再聪明,也无法组成真正的“智能网络”。
目前,整个AI智能体生态正面临严重的“碎片化”问题。Anthropic、Google、IBM、NEAR、Eclipse基金会、牛津大学……各大机构都在推出自己的协议,但彼此互不兼容。用户想让一个智能体调用天气API?可能要写三套适配代码。企业想让客服智能体和数据分析智能体协作?可能因为协议不同而彻底失败。这就像早期互联网,苹果用AppleTalk,微软用NetBEUI,互相根本连不上——直到TCP/IP横空出世,才真正打通全球。
而这篇论文告诉我们:今天的AI协议,正在走向统一的关键拐点!
作者们把所有协议分为两大维度:
- 第一维度是“面向对象”——分为“上下文导向协议”和“智能体间协议”;
- 第二维度是“应用场景”——分为“通用型”和“领域专用型”。
先说“上下文导向协议”,它的核心任务是:让智能体能安全、高效地获取外部信息。比如你问AI“下周纽约天气如何”,它不能靠自己猜,必须调用天气服务。过去,每个大模型厂商都用自己的函数调用格式,每个工具提供商也有自己的接口,结果开发者苦不堪言。现在,Anthropic推出的“模型上下文协议”(MCP)正在成为事实标准。MCP采用客户端-服务器架构,智能体只需声明“我需要天气数据”,由本地客户端去调用真实API,敏感信息(比如你的账号密码)根本不会上传到云端大模型,极大提升了隐私安全。更妙的是,只要工具方一次接入MCP,全球所有兼容MCP的智能体都能直接使用——这不就是AI世界的“USB接口”吗?
再看“智能体间协议”,这才是未来真正的重头戏!当单个AI不够用时,多个AI必须协作。比如规划一次跨国旅行,可能需要航班智能体、酒店智能体、天气智能体、预算智能体一起开会讨论。这时候就需要“智能体2智能体协议”(A2A)——由谷歌提出,专为企业级复杂协作设计。A2A支持异步长任务、多模态交互(文本、文件、音视频)、任务状态管理,还能在不泄露内部逻辑的前提下完成协作,保护各家的“智能体黑科技”。
而更激进的是“智能体网络协议”(ANP),由ANP社区推动,目标是打造“智能体互联网”。ANP引入去中心化身份(DID),让每个智能体拥有唯一数字身份;通过“元协议层”,智能体甚至能用自然语言自主协商通信规则;再往上,是标准化的应用协议层,实现跨平台发现与调用。想象一下:你家的扫地机器人智能体,能直接和小区物业的维修智能体谈判:“地板漏水了,请派工程师”,全程无需人类插手——这就是ANP描绘的未来。
还有牛津大学提出的“Agora协议”,它更进一步:让智能体自己生成协议!你用自然语言说“帮我订便宜又近机场的酒店”,Agora会自动解析意图,生成结构化协议分发给酒店搜索智能体、价格比对智能体、地图距离计算智能体……每个智能体只处理自己擅长的部分,完全屏蔽了自然语言的模糊性。这就像有个超级秘书,把你的模糊需求翻译成各部门都能执行的精确指令。
当然,领域专用协议也百花齐放。比如“agents.json”让网站能主动向AI宣告“我有哪些API可用”;“LOKA协议”聚焦AI伦理与身份治理,确保智能体行为可追溯、可问责;“CrowdES”则专为机器人设计,让AI能理解人群动态,安全穿行于火车站或商场。
那么,这些协议谁更强?论文从七大维度做了深度对比:效率(延迟、吞吐量)、可扩展性(支持百万智能体吗?)、安全性(防攻击、防数据泄露)、可靠性(断线重连吗?)、可扩展性(能加新功能吗?)、可操作性(好部署吗?)、互操作性(跨平台兼容吗?)。结果发现:MCP在工具集成上遥遥领先;A2A在企业安全协作上无可替代;ANP在开放生态上潜力最大;而Agora则在灵活性上独树一帜。
更关键的是,协议正在快速进化!MCP刚发布时还不支持流式传输,短短几个月就升级了HTTP Streaming和认证机制。这说明今天的协议不是静态标准,而是像生物一样不断演化。未来,作者们预测:短期看,协议将更注重隐私保护与群体通信(比如“智能体群聊协议”);中期看,协议将分层设计,底层管传输,上层管语义,像TCP/IP一样模块化;长期看,协议将不再是“规则”,而是“智能基础设施”——支撑起一个能自我组织、自我优化、涌现出集体智能的“智能体社会”。
这绝不是科幻。当数以亿计的AI智能体通过统一协议互联,它们将形成一种超越单个AI能力的“分布式集体智能”。医疗智能体群可实时分析全球疫情数据;金融智能体网络能提前预警系统性风险;城市智能体集群可动态优化交通与能源——人类将迎来一个由协议驱动的“智能文明新纪元”。
而这一切的起点,就是今天这些看似枯燥的协议标准。正如当年TCP/IP的发明者不会想到它会催生抖音、微信、淘宝,今天的MCP、A2A、ANP,或许就是未来AI世界的“水电煤”。谁掌握了协议,谁就掌握了智能体生态的话语权。