AI上下文图、领域驱动设计

企业经验被编码：行为轨迹与知识实体组成上下文图

通过构建连接行为轨迹与知识实体的上下文图谱，企业将真实流程抽象为概率路径，使智能体具备预测、执行与自我强化能力，实现流程级自动化升级。

所谓"上下文图谱"，本质就是把企业里真实发生的工作过程，从"谁拥有什么"升级成"谁在什么时候做了什么，为什么这么做，接下来通常会发生什么"。一旦把这个过程模型建起来，智能体就从只会查资料的实习生，升级成能跑完整流程的业务骨干。

你兴奋起来没有？我先兴奋一下，因为这玩意儿确实有"万亿级机会"的味道。原因很简单：模型已经会用工具了，企业数据也一堆一堆躺在系统里，真正缺的是对"工作是怎么流动的"这件事的结构化理解。

核心观点：从"有什么"升级到"怎么做"

企业里到处都是记录系统。客户管理系统记客户，工单系统记问题，文档系统记资料，聊天系统记对话。所有系统都在回答一个问题：你拥有什么。

真正的工作发生在"变化"里。销售从线索到成交经历了多少次电话、多少次演示、多少次修改合同。故障从报警到恢复经历了多少轮排查、多少次升级处理。工作是流动的，工作是时间序列，工作是因果链。

上下文图谱就是专门记录"变化轨迹"的模型。节点代表行为，例如创建、查看、评论、升级、解决。边代表因果关系和相关概率，例如"消息触发更新"的概率是多少。时间戳记录顺序，元数据记录影响。

当行为成为图谱的第一公民，模型拥有预测能力。它看到一串动作，就能判断下一个高概率步骤。那一刻你会感受到一种力量：流程从人工经验变成可计算路径。

实战案例：SaaS销售流程的概率化重生

想象一家SaaS公司，销售周期平均45天，成单率20%。传统销售手册写满"第一步、第二步、第三步"，但每个客户都不一样，手册沦为摆设。

上下文图谱抓取了去年500个销售案例的行为轨迹，发现两条截然不同的路径。

高成单路径成单率达到45%，轨迹清晰可复现：线索分配后48小时内电话触达，客户接通后发送产品视频，系统追踪到客户完整观看，第7天预约演示并确保3人以上参与，演示后第12天发送方案，检测到客户内部邮件往来后第15天启动商务谈判，第25天申请特价，第30天签约。每个环节带时间戳，每个动作带概率权重。

低成单路径成单率仅8%，轨迹充满延迟与断裂：线索分配后第5天才电话触达，邮件发送后无响应，第15天再次联系，演示仅1人参与且草草结束，方案发出后沉入沉默。

智能体遇到新线索时自动分析：客户公司规模200人匹配"中型企业"标签，电商行业匹配"高并发需求"特征，官网白皮书下载匹配"主动需求"信号。系统推荐路径清晰浮现：建议48小时内电话触达，延迟会导致成单率下降60%；准备演示时争取技术负责人到场，3人以上参与可将成单率从20%提升至45%；演示重点放在高并发场景；若客户提及预算立即启动特价预审批。

销售执行后智能体持续追踪：客户是否打开邮件，视频播放完成率如何，演示参与人角色是谁。每一步都基于概率分布动态调整，而非死板的"第7天必须发方案"。

这就是行为成为第一公民后的预测威力。流程从人工经验变成可计算路径，且路径持续自我优化。

为什么智能体在企业里常常表现拉胯

智能体已经会调用工具，已经会查知识库，已经会写总结。听起来很强。

真正跨越几周、跨越多个系统的长流程任务，智能体经常晕头转向。因为长流程意味着跨系统拼接知识，意味着不同人用不同习惯处理同一类事情，意味着局部例外和一次性特殊情况。

传统记录系统只展示当前状态，很少保存完整执行轨迹。你看到的是"已关闭工单"，却看不到从报警到关闭的每一步真实动作。你看到的是"成交客户"，却看不到中间的反复沟通。

当智能体基于这种残缺视角工作，它得到的是扁平快照。缺少时间线，就缺少因果。缺少因果，就缺少可自动化的基础。于是自动化容易出偏差，效率也无法保证。

上下文图谱的结构：行为成为核心

图谱的节点变成"行为"：创建、查看、编辑、评论、升级、解决，每一个动作都带时间戳和元数据。行为成为主角。

图谱的边表示因果与相关概率。某条聊天消息之后多大概率触发某次升级操作，某种报警类型之后多大概率进入某种处理路径。

这种建模方式的威力在于，它把流程变成概率分布，而非写死的流程图。你获得的是"常见路径集合"，而不是僵硬规则。

当系统拥有概率路径分布，智能体面对新场景时可以自主选择最可能成功的路径。流程不再需要人工硬编码，系统自己学。那种感觉很爽，像企业经验被抽象成一层隐形操作系统。

洞察"为什么"：从路径到动机

路径分布之上，还会叠加派生洞察。

系统分析路径差异，例如路径甲耗时更长，路径乙更快完成。分析偏差原因，例如涉及不同产品类型、不同客户规模。

回到销售案例，系统发现中型企业路径中"技术负责人参与演示"这一行为的出现频率与成单率呈强正相关，进一步分析发现这类客户决策链较长，技术背书是通关关键。小型企业路径中"快速特价审批"成为高频成功因子，因为决策集中、价格敏感。

当"为什么"被编码进去，智能体运行时不仅知道"怎么走"，还理解"为何这么走"。那一刻你会意识到：流程自动化终于带上了语境。自动化从机械执行升级成带理解的执行。

深度连接器与可观测能力：看见真实工作

构建上下文图谱需要看见真实工作轨迹。这意味着要在文档、聊天、工单、客户管理、邮件、日历、代码、仪表板、内部系统层面建立深度连接。粒度达到文档级别。

案例：一次产品发布背后的数据拼图

假设你要追踪"3.2版本发布"这个流程。传统方式下，信息散落在九个孤岛：

- 飞书文档：产品经理写了PRD，@了设计师和开发负责人，评论区争论了登录流程的交互方案
- 钉钉群：技术总监凌晨2点发消息说"后端API延迟问题解决，可以联调"
- Jira工单：BUG-2847标记为已解决，但备注里写着"临时方案，需后续优化"
- 客户管理系统：销售反馈某大客户催问3.2版本的新功能上线时间
- 邮件：法务确认了新用户协议条款，附件是修订版PDF
- 日历：3月15日14:00-16:00安排了发布评审会，参会人包括测试、运维、产品
- GitLab：代码提交记录显示"feat: 新增多因素认证"，关联了工单AUTH-112
- Grafana仪表板：发布前48小时，错误率曲线有一次异常 spike
- 内部后台：运维手动执行了数据库迁移脚本，没有走自动化流程

上下文图谱的连接器像九头蛇的触角，同时伸进这九个系统，抓取每一个变更事件。不是只存"3月15日发布了3.2版本"这个结果，而是把"设计师在飞书评论里质疑方案→技术总监钉钉确认→Jira标记解决但备注留坑→GitLab提交代码→Grafana异常→运维手动执行→日历会议通过"这一整条因果链串起来。粒度细到"谁在哪个文档的第几行评论了什么"。

每个应用有自己的使用模式。例如某类系统的评论生命周期短，而描述里的链接更权威。系统需要理解这些使用规律，然后统一映射进中央数据模型。

案例：读懂不同系统的"方言"

同样一个"确认"，在不同系统里含义完全不同：

- 钉钉消息里的"收到"：可能只是已读回执，生命周期24小时，过后无意义
- Jira工单描述里的链接：指向PRD文档，这个链接很权威，是需求源头
- 飞书文档评论里的"同意"：伴随@某人，意味着决策达成，需要追踪后续动作
- 邮件签名里的"确认无误"：法务语境，代表责任转移，有合规价值

系统学会这些方言：钉钉的"收到"权重低，只保留3天；Jira描述里的链接权重高，永久保留并建立双向索引；飞书评论的"同意"触发后续任务创建；邮件的"确认"标记流程节点完成。所有信号统一翻译成"行为语言"：谁在什么时候做了什么，对谁做的，结果如何。

维护这个模型需要持续投入。接口差异、身份映射、权限控制都需要长期治理。权限尤为关键，相关性与安全性同时保证，企业才敢用。

案例：当"张三"遇到"张3"

工程师张三在GitLab里叫"zhangsan"，在钉钉里叫"张三"，在Jira里叫"zhangsan@company.com"，在客户管理系统里因为 typo 被登记为"张3"。上下文图谱的身份映射层要认出这是同一个人，否则行为轨迹会断裂成四个碎片。

权限治理更微妙：张三能看自己写的代码，能看所在项目的工单，但不能看HR系统里的薪资数据，不能看其他部门的客户名单。图谱连接所有系统，但必须尊重每个系统的权限边界。当销售总监查询"3.2版本发布延误原因"时，系统展示完整的跨系统轨迹，但自动隐去"某大客户名称"和"具体薪资数据"，只保留"销售反馈客户催问"这个行为摘要。相关性保证流程透明，安全性保证不越界。

两年前开始捕捉所有变更事件，统一转化为行为轨迹。这一步标志着从"存文档"升级为"存变化"。这一步就是通向上下文图谱的起点。

案例：从"存档柜"到"监控录像"

以前的企业系统像存档柜：保存了3月15日的PRD文档v3.2，保存了3月20日的最终版代码，保存了3月25日的发布报告。你知道结果，但不知道过程。

现在的系统像监控录像：3月10日09:23产品经理创建PRD，09:45@设计师，10:12设计师查看，11:30设计师评论"登录流程需要二次确认"，14:00产品经理回复"同意，修改后@我"，16:45产品经理编辑文档增加"二次确认"章节，17:00@开发负责人。每一个变更都是事件，每一个事件带时间戳、操作人、操作类型、前后差异。

两年后，当你问"为什么3.2版本的登录功能花了三周"，系统不是翻出最终文档让你自己猜，而是回放完整的"设计-评审-修改-确认"时间线，并标注"二次确认需求在Day 1下午提出，但开发负责人在Day 3才查看文档，产生两天等待期"。存变化让你看见时间浪费在哪里。

知识图谱：上下文图谱的地基

在行为之下，还有一层知识图谱。

通过机器学习流水线识别更高层实体，例如项目、客户、产品、团队、人员，并推断它们之间关系。识别哪些文档和哪个客户相关，哪些工单属于哪个产品。

案例：给行为贴上"身份标签"

原始行为记录是："zhangsan@company.com 编辑了文档《3.2版本PRD》"。知识图谱层识别出：
- 实体"zhangsan@company.com" = 人员"张三" = 后端开发组 = 汇报给技术总监李四
- 实体"《3.2版本PRD》" = 文档 = 关联项目"3.2版本发布" = 关联产品"企业版SaaS" = 关联客户"某金融大客户（催问新功能）"
- 关系：张三参与项目3.2，项目3.2服务产品企业版，企业版有客户某金融大客户

行为被贴上这些标签后，查询"某金融大客户的需求进展"时，系统能串联起：销售在CRM里的跟进记录、产品经理写的PRD、开发提交的代码、测试报的BUG，尽管这些行为分散在四个不同系统，语言完全不同。

活动信号，例如查看、编辑、评论，持续输入系统，用来理解信息如何被使用。

案例：文档的"热度地图"

《3.2版本PRD》创建后：
- Day 1：产品经理编辑5次，设计师查看2次、评论3条
- Day 3：开发负责人查看1次，停留时间30秒（快速浏览）
- Day 5：测试工程师查看1次，停留时间8分钟（仔细阅读），并创建了测试用例文档
- Day 10：运维人员查看1次，随后创建了部署检查清单

系统理解这些信号：设计师深度参与（高频互动），开发负责人初步了解（快速浏览），测试工程师进入执行（长时间阅读+衍生文档），运维开始准备（阅读+行动）。文档热度随时间变化，参与角色依次登场，构成项目阶段的指示器。

当系统知道"客户管理系统里的某名称"和"支持系统里的某名称"代表同一客户，行为才能正确归类。

案例："宏达科技"的三种活法

客户管理系统里登记为"宏达科技股份有限公司"，支持系统里工单显示为"宏达科技（张经理）"，财务系统里发票抬头是"北京宏达科技股份有限公司"。知识图谱识别出这是同一客户，合并ID为C-2847。

于是系统正确归类：销售小王在CRM里的拜访记录、支持工程师在工单系统里的故障处理、财务在ERP里的回款记录，全部归到客户C-2847名下。当查询"宏达科技的服务历史"，你看到完整轨迹：6个月前销售成交（CRM）、3个月前实施上线（项目系统）、上周报警处理（工单）、昨天财务确认续费（ERP）。没有知识图谱的实体对齐，这四个行为会散落在四个孤立账户里，看起来毫无关联。

行为本身带噪音，知识图谱赋予行为语义。两者结合，才有真实结构。

案例：区分"有效编辑"和"手滑误触"

张三在代码编辑器里连续保存了5次，时间间隔10秒。原始行为记录是"编辑-编辑-编辑-编辑-编辑"。知识图谱结合语义理解：这5次编辑都在同一个函数内，修改的是变量命名（从temp改为userAuthToken），属于同一次逻辑操作。系统合并为"一次代码重构行为"，而非5次独立编辑。

反之，如果5次编辑分别修改了5个不同文件，涉及数据库层、API层、前端层，系统识别为"跨层联调行为"，标记为高风险（容易引入不一致）。语义层把噪音行为聚合成有意义的单元。

个人图谱：先理解一个人的工作流

系统还会为每个人建立个人图谱。

收集跨工具行为流，按照时间顺序拼成时间线，结合知识图谱实体进行丰富化。

案例：张三的周二时间线

原始数据：
- 09:00 钉钉：查看消息（无回复）
- 09:15 GitLab：提交代码（commit message: fix auth bug）
- 09:20 Jira：将工单AUTH-112标记为"处理中"
- 09:45 飞书：编辑文档《认证模块设计回顾》
- 10:00 日历：参加会议"3.2版本站会"
- 10:30 Grafana：查看错误率仪表板
- 10:35 钉钉：@测试工程师"AUTH-112需要验证"
- 11:00 GitLab：提交代码（commit message: add test case for auth）
- 11:30 Jira：将工单AUTH-112标记为"待验证"

丰富化后的个人图谱：
- 09:00-09:20：开始处理工单AUTH-112（认证模块bug修复）
- 09:20-10:00：撰写设计回顾文档（关联工单AUTH-112）
- 10:00-10:30：参加站会（汇报AUTH-112进展）
- 10:30-11:30：验证修复效果，补充测试用例，移交测试

时间线从碎片变成故事：张三上午专注解决了一个认证bug，从编码到文档到验证完整闭环。

接下来进入困难阶段：把低层行为聚合成语义任务。

人类工作高度碎片化。一个文档可能服务多个项目，一次编辑可能属于多个任务。需要结合标题相似性、链接关系、会议邀请、频道名称、时间窗口等信号。

案例：一份文档的三重身份

产品经理李四在周二下午编辑了文档《Q2产品规划》。原始行为很简单：编辑文档。

但系统发现：
- 文档标题包含"Q2"和"规划"
- 文档内链接指向项目A、项目B、项目C的详细PRD
- 李四的日历显示下午14:00-15:00有"项目A评审会"
- 李四在会议前30分钟编辑了文档
- 文档所在文件夹是"项目A/规划"

信号聚合：这次编辑属于"项目A评审准备"任务，而非"项目B"或"季度整体规划"。尽管文档内容涉及多个项目，但时间窗口、会议关联、文件路径指向项目A。

再加上大语言模型对事件序列进行推断，例如判断某一串动作属于"排查报警"或"撰写规格说明"。

案例：是"救火"还是"写文档"？

张三的晚间行为序列：
- 22:00 Grafana：查看仪表板（错误率 spike）
- 22:05 钉钉：@值班同事
- 22:10 日志系统：查询错误日志
- 22:20 GitLab：查看代码（某函数）
- 22:30 编辑器：修改代码
- 22:45 部署系统：执行热修复
- 23:00 Grafana：确认错误率下降

大语言模型推断：这是"排查报警→热修复"任务，标记为P0紧急。尽管涉及查看、编辑、部署多种行为，但时间连续性（45分钟密集操作）、工具切换模式（监控→通讯→日志→代码→部署→监控）、结果导向（错误率下降）共同指向"故障响应"语义。

另一组行为：
- 14:00 飞书：创建文档
- 14:30 飞书：持续编辑（插入表格、流程图）
- 16:00 飞书：@相关人评审
- 次日10:00 飞书：根据评论修改

推断为"撰写规格说明"任务，标记为P2常规，时间跨度长但节奏舒缓，工具单一，协作导向。

最终目标是把混乱时间流切分为清晰任务单元。

个人数据只对个人可见。聚合分析时进行匿名抽象处理，主题开始浮现。

案例：我的数据 vs 我们的模式

张三的个人图谱显示：本周有3次"故障响应"任务，平均耗时2小时，都在晚间。这是张三的私有数据，只有张三自己能看到。

聚合到团队层，匿名化处理：某后端工程师（脱敏为"人员A"）的"故障响应"任务被纳入统计。团队层发现：5个后端工程师本周共发生12次"故障响应"，其中8次与"认证模块"相关。主题浮现：认证模块存在系统性问题，需要工程治理，而非个案修复。

个人层保护隐私，聚合层发现模式。

从个人到整体：抽象化步骤

在聚合阶段，每条个人图谱转化为匿名步骤序列。

包含行为类型、工具类别、涉及实体、推断出的流程标签、轻量级时间与结果特征，例如是否成功解决、是否成交。

案例：销售流程的"脱敏切片"

销售王五的个人图谱：
- 周一：CRM创建线索（客户：宏达科技，行业：金融，规模：500人）
- 周二：电话触达（时长15分钟，结果：预约演示）
- 周三：准备演示材料（PPT，产品：企业版）
- 周五：演示（参与人：客户CTO、技术总监，时长45分钟，结果：客户表示感兴趣）
- 下周二：发送方案（邮件，附件：报价单）
- 下周五：商务谈判（会议，结果：申请特价）
- 两周后：CRM标记成交（金额：50万）

抽象化后：
- 行为序列：创建→电话→准备→演示→发送方案→谈判→成交
- 工具类别：CRM→电话→文档→会议→邮件→会议→CRM
- 涉及实体：线索→客户（行业：金融，规模：中型）→产品（企业版）→交易
- 流程标签：中型企业销售周期
- 时间特征：14天，7个步骤，平均2天/步
- 结果特征：成交，金额区间：50万

原始文本（客户名称、具体对话内容）、用户标识（王五）、客户机密（报价单细节）全部排除。

系统计算轨迹相似度，识别相同流程模式。

案例：找到"另一个王五"

销售赵六的抽象序列：
- 行为序列：创建→电话（未接通）→邮件→电话（接通）→演示→发送方案→沉默→再次跟进→谈判→成交
- 工具类别：CRM→电话→邮件→电话→会议→邮件→无→电话→会议→CRM
- 涉及实体：线索→客户（行业：制造，规模：中型）→产品（企业版）→交易
- 流程标签：中型企业销售周期
- 时间特征：21天，9个步骤
- 结果特征：成交，金额区间：45万

系统计算相似度：王五和赵六的序列在"演示→发送方案→谈判→成交"核心路径上高度重合，尽管前期触达方式不同（王五一次电话接通，赵六多次尝试），行业不同（金融vs制造），但都属于"中型企业销售周期"模式。系统提取公共子序列：触达→演示→方案→谈判→成交，作为该流程的标准步骤。

模式只有在多个独立用户与多条独立轨迹中重复出现时才会保留，稀有模式自动过滤。

案例：过滤"神来之笔"与"倒霉蛋"

销售孙七的轨迹：创建线索→当天成交（客户是前同事，私下已决定购买）。这是极速成交模式，但只出现1次，样本不足，系统标记为"异常值"，不纳入标准流程。

销售周八的轨迹：创建→电话→演示→发送方案→客户公司倒闭→关闭。这是"失败模式"，但同样只出现1次，系统暂存观察，待积累更多失败案例后再分析共性（如"客户规模过小"或"行业处于下行期"）。

只有当"演示后3天内发送方案"这个模式在20个销售、50条轨迹中重复出现时，才被确认为"中型企业销售周期"的关键步骤，赋予高权重。

此时构建的是"通常发生什么"的概率视图。结合时间维度，可以识别高价值流程。耗时长且重复出现的流程，往往价值最高。

案例：发现"隐藏的印钞机"

系统统计所有抽象序列：
- "小型企业快速成交"：平均5天，出现200次，金额区间5-10万
- "中型企业标准周期"：平均18天，出现150次，金额区间30-60万
- "大型企业招投标"：平均90天，出现30次，金额区间100-500万
- "POC验证流程"：平均45天，出现80次，金额区间20-80万，但POC后成交率仅40%

计算单位时间价值：中型企业标准周期虽然耗时，但出现频率高、成交率稳定（65%）、金额适中，总营收贡献最大。POC验证流程耗时更长、成交率更低，但单笔金额高，且80%的POC来自老客户推荐，获客成本极低。

上下文图谱标记"中型企业标准周期"和"POC验证流程"为高价值流程，优先投入智能体建设。小型企业快速成交虽然量大，但标准化程度高，人工处理效率已足够，暂缓智能化。

上下文图谱由此诞生，成为智能体的实战手册。

存储方式：图结构与文本的混合模型

纯图结构刚性强，纯文本难以遍历。

采用混合模型。将自由文本拆分为小段，嵌入实体编号。

案例：一次事故的多维存储

原始事故记录（自由文本）：
> "3月15日凌晨2点，支付网关报警超时。值班工程师小李先查看日志未发现异常，随后在钉钉群里@数据库同事小王，小王确认连接池正常。小李想起上周类似情况，是CDN节点问题，联系运维切换节点，10分钟后恢复。根因：CDN节点在华东区出现短暂故障。"

混合模型存储：
- 图结构节点：
- 事件1：报警触发（类型：支付超时，时间：03-15 02:00，实体ID：INC-452）
- 事件2：查看日志（类型：诊断，执行人：小李，结果：无异常，父节点：INC-452）
- 事件3：Slack消息（类型：协作，对象：数据库团队，响应：正常，父节点：INC-452）
- 事件4：知识检索（类型：查询，关键词：CDN故障，来源：历史案例库，父节点：INC-452）
- 事件5：执行操作（类型：修复，动作：切换CDN节点，耗时：10min，结果：恢复，父节点：INC-452）
- 文本片段（带实体编号）：
- [INC-452-01] "3月15日凌晨2点，支付网关报警超时"
- [INC-452-02] "查看日志未发现异常"（关联事件2）
- [INC-452-03] "@数据库同事小王，确认连接池正常"（关联事件3）
- [INC-452-04] "想起上周类似情况，是CDN节点问题"（关联事件4）
- [INC-452-05] "联系运维切换节点，10分钟后恢复"（关联事件5）

这样智能体可以逐步沿路径行走。

案例：新报警来了，如何"跟老事故对话"

新报警：3月20日凌晨3点，支付网关再次报警超时。

智能体查询图结构：找到相似节点"支付超时"（INC-452），沿边遍历：
- 事件1（报警）→ 事件2（查看日志，结果：无异常）匹配度90%
- 事件2 → 事件3（@数据库团队）匹配度？新案例中尚未发生
- 事件2 → 事件4（查询历史案例）匹配度？新案例中尚未发生

智能体读取文本片段[INC-452-02]："查看日志未发现异常"。读取[INC-452-04]："想起上周类似情况，是CDN节点问题"。

推荐路径浮现："当前处于'查看日志无异常'节点，历史相似案例（INC-452）中，下一步高概率动作是'查询历史案例'或'直接排查CDN'，建议优先排查CDN节点（历史恢复时间10分钟，成功率100%）"。

这种结构适合逐案推理，对于跨上千案例的横向推理存在权衡。系统选择了在可导航性与灵活性之间取得平衡。

案例：个案深度 vs 群体统计

问："INC-452当时怎么解决的？"→ 混合模型精准定位，沿图结构遍历5个事件，读取相关文本片段，还原完整故事。可导航性强。

问："过去一季度所有支付超时事故的常见根因是什么？"→ 图结构快速筛选"支付超时"类型节点（共50个），统计下游事件分布：CDN问题（35次）、数据库问题（8次）、代码问题（5次）、未知（2次）。文本片段用于验证统计结果（读取部分片段确认分类准确）。灵活性足够。

若问："描述所有涉及'小李'且'在凌晨'且'通过回忆解决'的事故"→ 需要跨文本片段的复杂语义匹配，混合模型效率下降。这是权衡所在，系统接受这种局限，优先保证流程推理场景的性能。

智能体轨迹闭环：自我进化

智能体在系统内部运行时，每次执行都会生成新轨迹。

记录调用工具顺序、输入输出、成功与否、效率情况、用户反馈。

案例：智能体第一次独立处理报警

场景：支付网关超时报警，智能体自动执行。

生成的轨迹：
- 02:00 接收报警（输入：报警详情，输出：确认接收）
- 02:01 调用日志查询工具（输入：时间窗口03:00±5min，输出：无异常日志）
- 02:02 调用知识检索工具（输入：关键词"支付超时+无日志异常"，输出：历史案例INC-452、INC-389、INC-201）
- 02:03 调用根因分析工具（输入：3个历史案例+当前特征，输出：CDN节点故障概率75%，数据库概率15%，代码概率10%）
- 02:04 推荐动作：切换CDN节点（置信度：高）
- 02:05 等待人工确认（用户反馈：批准执行）
- 02:06 调用运维工具执行切换（输入：节点ID，输出：执行成功）
- 02:16 调用监控工具验证（输入：时间窗口02:06±10min，输出：错误率下降，恢复成功）
- 结果：成功解决，耗时16分钟

离线阶段进行回放和路径对比，评估正确性、完整性、指令遵循度、效率。

案例：周五复盘会上的轨迹回放

团队回放上述轨迹：
- 正确性：根因判断正确（确实是CDN问题），恢复成功。✓
- 完整性：覆盖了接收→诊断→决策→执行→验证全流程，无遗漏。✓
- 指令遵循度：在关键动作（切换CDN）前请求人工确认，符合"高风险操作需审批"的预设规则。✓
- 效率：16分钟 vs 人类平均25分钟，提升36%。✓

但发现优化点：知识检索步骤返回3个案例，智能体只使用了最相似的INC-452，忽略了INC-389（虽然相似度略低，但涉及不同CDN厂商，有补充价值）。建议：调整检索算法的排序权重。

成功路径强化权重，成为自然语言形式的操作剧本。

案例：从轨迹到"标准作业程序"

上述成功轨迹被转化为自然语言剧本：
> "支付网关超时报警处理剧本（V1.0）：
> 1. 接收报警后，立即查询最近10分钟日志
> 2. 若日志无异常，检索历史案例（关键词：支付超时+无日志）
> 3. 分析历史案例根因分布，优先排查最高概率项（当前：CDN节点）
> 4. 执行修复前，若涉及生产环境变更，请求人工确认
> 5. 执行修复后，验证监控指标，确认恢复"

这个剧本被纳入上下文图谱，成为后续同类报警的推荐路径。权重标记为"高"（基于1次成功执行）。

需要干预的路径暴露反模式，指示上下文不足或工具使用不当。

案例：一次"翻车"的宝贵价值

一周后，智能体处理另一起报警：

轨迹片段：
- 02:00 接收报警（类型：支付超时）
- 02:01 调用日志查询（输出：无异常）
- 02:02 调用知识检索（输出：历史案例）
- 02:03 调用根因分析（输出：CDN节点故障概率75%）
- 02:04 推荐动作：切换CDN节点
- 02:05 等待人工确认（用户反馈：拒绝，要求先检查数据库主从延迟）
- 02:06 人工检查数据库（结果：主从延迟5秒，根因确认）
- 02:15 人工修复主从延迟，恢复成功

回放分析：
- 反模式暴露：智能体过度依赖历史案例的统计概率（CDN问题占75%），忽略了当前报警的细微特征（错误信息包含"timeout after 5000ms"，而历史CDN案例多为"connection reset"）。
- 上下文不足：系统未将"错误信息文本特征"纳入根因分析输入，导致误判。
- 工具使用不当：知识检索工具返回的案例未按"错误信息相似度"排序，而是按"时间近邻"排序。

改进措施：
- 增强上下文：根因分析工具增加"错误信息语义解析"模块
- 优化工具：知识检索增加"错误信息相似度"排序维度
- 剧本更新：增加"检查错误信息关键词，若包含'timeout after'优先排查数据库"分支

长期积累后，上下文图谱成为人类与智能体行为的联合模型。

案例：三个月后的"人机协作图谱"

上下文图谱现在包含：
- 人类轨迹：500次人工处理记录（来自历史数据）
- 智能体轨迹：120次自动处理记录（其中100次成功，20次需干预）
- 联合模式：智能体成功路径中，85%基于人类历史模式，15%为智能体独创（如"先验证再执行"的额外检查步骤，人类常遗漏）

工作不再仅仅记录历史，而是在演化中被持续更新。

数据层与编排层一体化

高价值流程，例如事故响应、销售成交、产品发布，需要上下文层与执行层统一。

上下文图谱提供结构化流程理解，执行层负责规划与迭代并生成新轨迹。

案例：事故响应的"双螺旋"结构

数据层（上下文图谱）：
- 存储所有历史事故的行为轨迹（人类+智能体）
- 提供概率路径：支付超时→排查CDN（75%概率）或数据库（15%概率）
- 提供实体关联：当前报警的支付网关→关联的CDN节点→关联的运维值班表

执行层（智能体编排）：
- 接收报警，查询数据层获取推荐路径
- 规划执行步骤：查询日志→检索案例→根因分析→推荐动作→请求确认→执行→验证
- 执行过程中，每步生成新行为，实时写入数据层
- 若执行偏离推荐路径（如人工拒绝切换CDN），记录偏差原因，更新数据层

两者一体，现实保持一致。系统演化同步。智能体扎根在实时更新的企业模型之中。

案例：销售流程的"活地图"

数据层实时更新：
- 销售A刚完成演示，标记"客户CTO参与"，系统更新"中型企业销售周期"模式：CTO参与后72小时内发送方案的概率从60%提升至85%
- 销售B在谈判阶段申请特价，被驳回，记录"9折以上特价审批通过率仅30%"，更新概率分布

执行层实时响应：
- 销售C的新线索进入系统，数据层推荐路径已包含最新洞察："争取CTO参与演示（权重↑），控制特价在9折以内（新约束）"
- 销售C执行演示，执行层记录"技术总监参与，CTO未参与"，数据层实时标记为"中等概率路径"，调整后续推荐（建议3天内二次触达争取CTO）

那种状态像企业拥有一颗持续成长的"组织大脑"。

内部验证：从人工构建到系统化

最早阶段通过自愿共享个人图谱数据进行内部验证。

案例：工程师小李的"数据裸捐"

小李同意共享个人图谱一周。系统捕捉到：
- 时间分布：40%编码，20%会议，15%代码审查，10%故障响应，15%碎片化沟通
- 任务切换：平均每天23次上下文切换，每次切换平均耗时8分钟恢复专注
- 高频路径："收到BUG→查看代码→本地复现→修复→提交→请求审查→通过→部署"（平均耗时4小时）

与小李访谈验证：切换次数统计与主观感受一致，"确实感觉每天都在被打断"。高频路径与自我认知一致，"大部分BUG都是这个套路"。

分析项目序列与耗时，区分高价值流程。

案例：发现"隐形加班黑洞"

聚合10个工程师的个人图谱，发现：
- "故障响应"任务平均耗时2小时，但50%发生在晚间20:00-24:00
- 进一步分析：晚间故障中，70%是"白天遗留问题的爆发"（如白天部署的代码在晚间流量高峰时暴露性能问题）
- 高价值流程识别："白天部署→晚间故障→紧急修复"模式耗时且影响生活质量，但可通过"加强白天预发布检查"预防

识别重复出现的团队级流程，例如中型市场销售周期、概念验证、值班事故处理、功能发布。

案例：从个人习惯到团队标准

销售团队5人共享数据，发现：
- 王五：演示后平均1天发方案，成交率60%
- 赵六：演示后平均3天发方案，成交率40%
- 孙七：演示后当天发方案，成交率55%
- 周八：演示后平均5天发方案，成交率30%
- 吴九：演示后平均2天发方案，成交率65%

模式浮现："1-2天内发送方案"关联最高成交率。与领域专家（销售总监）验证：符合"趁热打铁"的销售直觉，但数据提供了精确时间窗口（24-48小时）。

团队级流程"中型市场销售周期"正式纳入上下文图谱，标准步骤增加"演示后T+1日发送方案"节点。

与领域专家一起验证路径优劣和偏差原因，识别数据盲区。

案例：专家质疑→数据补全→模型修正

领域专家（技术总监）质疑："故障响应路径中，'查看日志'作为第一步似乎多余，直接查监控更快。"

数据验证：查看历史轨迹，"查看日志"平均耗时8分钟，但40%的案例中日志提供了监控未覆盖的细节（如特定用户的请求参数）。删除"查看日志"步骤的模拟显示，20%的故障会多耗时30分钟以上（因监控信息不足，需回退补查日志）。

结论：保留"查看日志"步骤，但优化为"并行查询日志+监控"，而非串行。专家认可，模型修正。

将高价值流程投入资源构建智能体。

案例：从验证到投产

经过3个月验证，确认"中型企业销售周期"和"值班事故处理"为高价值流程：
- 出现频率高（占各自领域工作量的60%+）
- 标准化程度高（轨迹相似度>70%）
- 改进空间大（当前人工处理存在明显时间浪费）

资源投入：2名工程师+1名产品经理，基于上下文图谱构建专用智能体。6周后上线，接管40%的常规事故处理和30%的销售跟进提醒。

最终目标指向动态演化图谱，而非静态流程集合。

当企业经验被编码

你想象一下。多年沉淀的组织经验，突然被抽象成概率路径。新员工加入，智能体直接带路。事故发生，系统推荐高成功率路径。销售推进，系统提示下一个关键动作。
那种感觉像企业的"隐性知识"被点亮。

案例：新员工的"第一天超能力"

小张，刚毕业，入职某SaaS公司销售部。第一天，打开系统，智能体提示：
> "欢迎！你分配到的第一个线索是'宏达科技'，中型制造企业。根据历史数据，此类客户最佳路径：
> 1. 今天16:00前电话触达（延迟会导致兴趣度下降50%）
> 2. 电话中提到'同行业案例：某汽车厂商'（提升预约演示率30%）
> 3. 争取本周内安排演示，务必邀请技术负责人（3人以上参与成单率65% vs 1人参与20%）
> 需要我调取演示PPT模板和同案例详情吗？"

小张第一天就知道老销售花三年攒下的经验。不是读手册，是实战带路。

流程从口口相传升级为可计算结构。组织学习从慢节奏积累升级为实时强化。

案例：老师傅的"退休礼物"

老李，技术总监，即将退休。过去十年，他处理了800次生产事故，其中200次是复杂的"连环故障"（一个根因引发多个系统报警）。

传统方式：老李写一份20页的《故障处理手册》，新人读完需要一周，实战中还是手忙脚乱。

上下文图谱方式：老李的800次处理记录被抽象为概率路径，200次连环故障被识别为特殊模式"多系统关联故障"。智能体遇到类似场景，推荐路径：
> "检测到3个系统同时报警，历史模式显示82%概率为单一根因（数据库主从延迟）。建议优先排查数据库，而非并行排查三个系统。参考案例：2023-11-08 INC-892（老李处理，耗时15分钟）。"

老李的经验不是写在纸上，是编码在系统里，实时指导每一个值班工程师。老李退休，但他的"决策影子"继续工作。

这件事的震撼在于：工作经验开始拥有记忆、概率与自我修正能力。

案例：午夜时分的"集体智慧"

凌晨3点，支付系统报警。值班工程师是小王，入职仅3个月。

智能体推荐路径："排查CDN节点（概率75%）"。小王执行，失败。

小王标记"未解决"，智能体启动备选路径："排查数据库主从延迟（概率15%）"。小王执行，成功。

第二天，系统自动分析：为何本次CDN路径失效？发现本次报警的错误信息包含新特征"timeout after 5000ms"，与历史CDN案例的"connection reset"不同。更新模型：增加"错误信息语义解析"维度，调整概率分布。

下一次，无论是小王还是其他工程师遇到"timeout after"类报警，系统直接推荐数据库排查。一次人工干预，全员永久受益。经验不是累加，是指数级进化。

这就是上下文图谱的终极承诺：企业经验从"人脑中的模糊记忆"变成"可计算、可传承、自我优化的数字资产"。
作者背景与独特性评价

阿文德·贾恩（Arvind Jain）是企业人工智能公司格林（Glean）的创始人之一，长期从事搜索与企业知识管理相关技术。背景横跨搜索引擎与企业级系统，对"信息如何被使用"拥有深刻理解。

独特性在于将搜索、知识图谱、行为轨迹、强化学习整合为一体结构，强调流程概率建模而非静态知识库。核心价值体现在把"经验路径"转化为智能体可学习的结构。

这种设计强调数据层与执行层一体化，构建持续演化的企业行为模型。企业人工智能从工具调用阶段迈向流程自治阶段。

————————————————————

企业经验被编码：行为轨迹与知识实体组成上下文图

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道