协议之战：谁在定义AI智能体的“互联网”？

上海交大团队首次系统梳理AI智能体协议，提出二维分类框架，揭示MCP、A2A、ANP等协议如何构建未来智能体互联网，推动集体智能崛起。

当AI智能体开始“联网”：一场堪比TCP/IP革命的协议大爆发正在上演！

为什么我们今天能用手机刷短视频、点外卖、打车？这一切的背后，其实都离不开一个叫“协议”的东西。比如你熟悉的HTTP、TCP/IP，它们就像互联网世界的“交通规则”，让不同设备、不同系统之间能顺畅沟通。而今天，在AI智能体的世界里，一场类似的协议革命正在悄然爆发！

最近，上海交通大学联合ANP社区的一群顶尖研究者，发布了一篇重磅综述《AI智能体协议综述》。作者包括杨 Yingxuan、柴 Huacan、宋 Yuanyi、戚 Siyuan、温 Muning、李 Ning、廖 Junwei、胡 Haoyi、林 Jianghao（通讯作者）、常 Gaowei（来自ANP社区）、刘 Weiwen、温 Ying、俞 Yong、张 Weinan。这支团队不仅深耕大模型与多智能体系统多年，还在工业界与开源社区拥有广泛影响力——比如常高威就是推动“智能体互联网”理念的核心人物之一。他们首次系统性梳理了当前所有主流AI智能体通信协议，并提出了一个清晰的二维分类框架，堪称AI智能体领域的“协议地图”。

那么，什么是AI智能体协议？简单说，就是让AI智能体（尤其是基于大语言模型的智能体）能够彼此对话、调用工具、共享信息、协同工作的“通用语言”。没有它，每个AI就像一个只会方言的孤岛，哪怕再聪明，也无法组成真正的“智能网络”。

目前，整个AI智能体生态正面临严重的“碎片化”问题。Anthropic、Google、IBM、NEAR、Eclipse基金会、牛津大学……各大机构都在推出自己的协议，但彼此互不兼容。用户想让一个智能体调用天气API？可能要写三套适配代码。企业想让客服智能体和数据分析智能体协作？可能因为协议不同而彻底失败。这就像早期互联网，苹果用AppleTalk，微软用NetBEUI，互相根本连不上——直到TCP/IP横空出世，才真正打通全球。

而这篇论文告诉我们：今天的AI协议，正在走向统一的关键拐点！

作者们把所有协议分为两大维度：

第一维度是“面向对象”——分为“上下文导向协议”和“智能体间协议”；
第二维度是“应用场景”——分为“通用型”和“领域专用型”。

先说“上下文导向协议”，它的核心任务是：让智能体能安全、高效地获取外部信息。比如你问AI“下周纽约天气如何”，它不能靠自己猜，必须调用天气服务。过去，每个大模型厂商都用自己的函数调用格式，每个工具提供商也有自己的接口，结果开发者苦不堪言。现在，Anthropic推出的“模型上下文协议”（MCP）正在成为事实标准。MCP采用客户端-服务器架构，智能体只需声明“我需要天气数据”，由本地客户端去调用真实API，敏感信息（比如你的账号密码）根本不会上传到云端大模型，极大提升了隐私安全。更妙的是，只要工具方一次接入MCP，全球所有兼容MCP的智能体都能直接使用——这不就是AI世界的“USB接口”吗？

再看“智能体间协议”，这才是未来真正的重头戏！当单个AI不够用时，多个AI必须协作。比如规划一次跨国旅行，可能需要航班智能体、酒店智能体、天气智能体、预算智能体一起开会讨论。这时候就需要“智能体2智能体协议”（A2A）——由谷歌提出，专为企业级复杂协作设计。A2A支持异步长任务、多模态交互（文本、文件、音视频）、任务状态管理，还能在不泄露内部逻辑的前提下完成协作，保护各家的“智能体黑科技”。

而更激进的是“智能体网络协议”（ANP），由ANP社区推动，目标是打造“智能体互联网”。ANP引入去中心化身份（DID），让每个智能体拥有唯一数字身份；通过“元协议层”，智能体甚至能用自然语言自主协商通信规则；再往上，是标准化的应用协议层，实现跨平台发现与调用。想象一下：你家的扫地机器人智能体，能直接和小区物业的维修智能体谈判：“地板漏水了，请派工程师”，全程无需人类插手——这就是ANP描绘的未来。

还有牛津大学提出的“Agora协议”，它更进一步：让智能体自己生成协议！你用自然语言说“帮我订便宜又近机场的酒店”，Agora会自动解析意图，生成结构化协议分发给酒店搜索智能体、价格比对智能体、地图距离计算智能体……每个智能体只处理自己擅长的部分，完全屏蔽了自然语言的模糊性。这就像有个超级秘书，把你的模糊需求翻译成各部门都能执行的精确指令。

当然，领域专用协议也百花齐放。比如“agents.json”让网站能主动向AI宣告“我有哪些API可用”；“LOKA协议”聚焦AI伦理与身份治理，确保智能体行为可追溯、可问责；“CrowdES”则专为机器人设计，让AI能理解人群动态，安全穿行于火车站或商场。

那么，这些协议谁更强？论文从七大维度做了深度对比：效率（延迟、吞吐量）、可扩展性（支持百万智能体吗？）、安全性（防攻击、防数据泄露）、可靠性（断线重连吗？）、可扩展性（能加新功能吗？）、可操作性（好部署吗？）、互操作性（跨平台兼容吗？）。结果发现：MCP在工具集成上遥遥领先；A2A在企业安全协作上无可替代；ANP在开放生态上潜力最大；而Agora则在灵活性上独树一帜。

更关键的是，协议正在快速进化！MCP刚发布时还不支持流式传输，短短几个月就升级了HTTP Streaming和认证机制。这说明今天的协议不是静态标准，而是像生物一样不断演化。未来，作者们预测：短期看，协议将更注重隐私保护与群体通信（比如“智能体群聊协议”）；中期看，协议将分层设计，底层管传输，上层管语义，像TCP/IP一样模块化；长期看，协议将不再是“规则”，而是“智能基础设施”——支撑起一个能自我组织、自我优化、涌现出集体智能的“智能体社会”。

这绝不是科幻。当数以亿计的AI智能体通过统一协议互联，它们将形成一种超越单个AI能力的“分布式集体智能”。医疗智能体群可实时分析全球疫情数据；金融智能体网络能提前预警系统性风险；城市智能体集群可动态优化交通与能源——人类将迎来一个由协议驱动的“智能文明新纪元”。

而这一切的起点，就是今天这些看似枯燥的协议标准。正如当年TCP/IP的发明者不会想到它会催生抖音、微信、淘宝，今天的MCP、A2A、ANP，或许就是未来AI世界的“水电煤”。谁掌握了协议，谁就掌握了智能体生态的话语权。

协议之战：谁在定义AI智能体的“互联网”？

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道