我造了个叫MARVIN的私人AI智能体,现在4个同事也在用了!


放假那会儿,跟很多程序员一样,我闲得没事就开始捣鼓东西。其中一个成果就是个私人助理智能体,我给他起名叫 MARVIN(对,就是那个《银河系漫游指南》里的 Marvin,那个偏执狂机器人)。MARVIN 的底层用的是 Claude Code 这套框架。

一开始吧,我就想让这家伙帮我处理处理邮件,私人的、工作的都管。后来加上了日历。再后来加上了 Jira(项目管理工具)。再后来加上了 Confluence(公司文档库)、Attio(客户关系管理)、Granola(笔记工具),等等等等。等我反应过来的时候,我已经整了 15 个以上的集成接口和 MCP 服务器,搞出来一个真的懂我怎么工作的系统。

但这玩意儿一开始就是个宠物项目,我自己玩玩而已。我压根没指望他能跑出我的笔记本电脑。

几周前,我给营销团队的一个同事演示了一下 MARVIN 能干啥。她问我能不能也让她用用。我就给她开通了账号,30 分钟后她给我发消息:"我刚用 30 分钟干完了一样活儿,这活儿平时得花我 4 个多小时。他现在是我新闺蜜了。"

她开始跟别的同事吹这事儿。昨天我又 onboarding 了两个。昨晚又来了一个。其中一个人马上给我发消息:"我靠。我忘了贴我提到的那份 Confluence 文档链接,结果 MARVIN 比我还快。"MARVIN 居然从上下文里推断出他需要哪份文档,自己从 Confluence 里扒出来,还没等他开口就更新到本地文件里了。

两周内四个人,全是靠口碑传开的。这时候我才意识到,这玩意儿可能不只是我电脑里自娱自乐的小玩具了。

以下是我造智能体学到的东西:

1. 真正的智能体都是乱七八糟的。他们必须能自定义。
不是一套方案走天下。MARVIN 知道我的写作风格、我的目标、我家人的日程、我老板叫啥名。他知道我讨厌 AI 那种拍马屁的回复。他知道我写东西不用破折号(em dashes)。这些背景信息让他有用。没有这些,他就只是个普通聊天机器人。

2. 性格这东西比我想象的重要多了。
MARVIN 为啥叫这个名字?就是因为那个偏执狂机器人啊。他说话带刺儿,讽刺得很。查我邮件之前会先夸张地叹口气。出毛病的时候他会说:"行吧,这跟我预想的一模一样。"听着像花里胡哨的噱头对吧?但实际上这让整个互动感觉不像在用工具,更像在跟一个(稍微有点悲观的)同事共事。我发现自己真的想跟他一起干活,这就意味着我用得更多,他用得越多就学得越好。

3. 持久记忆很难搞。上下文丢失是真的会发生的。
MARVIN 用了一种" bookend "(书挡)的方式来管理一天。输入 /marvin 启动会话,他会先读 state/current.md 看看昨天发生了啥,包括所有任务和上下文。输入 /end 结束会话,他会把所有东西整理成提交记录,生成一份日报,然后更新 current.md 为明天做准备。白天的时候,用 /update 随时保存进度,这样 Claude 压缩上下文或者我开新会话的时候就不会丢东西了。

4. Markdown 是智能体的新编程语言。
结构化格式帮 MARVIN 保持条理。技能存在 markdown 文件里。状态存在 markdown 里。会话日志也是 markdown。因为没有花哨的 UI,我的营销同事们用 Cursor 打开任何 .md 文件就能看明白发生了啥。开销低,透明度高。

5. 你得训练你的智能体。别指望一次就搞定。
如果我雇个真人助理,我会给他 3 个月时间才能真正上手。他得学流程、找信息、理解背景。智能体也一样。我不是把邮件丢给 MARVIN 就说"去吧"。我从一封需要回复的邮件开始。我们一起起草回复。写得不错的时候,我给 MARVIN 反馈,让他更新技能。然后再来一遍。迭代了 30 分钟后,我有信心 MARVIN 能用我的语气回复需要处理的邮件了。

实际效果:

我训练和使用 MARVIN 已经 3 周了。我现在一周干的活儿比以前一个月还多。过去 3 周我完成了:

  • 提交了 3 份会议演讲申请(CFP)
  • 发了 2 篇个人博客 + 5 篇在草稿箱里
  • 发了 2 篇工作博客 + 3 篇在草稿箱里
  • 组织了 6 场以上的开发者聚会,演讲嘉宾全部到位
  • 让 4 个同事成功 onboarding
  • 搭建或优化了 15 个以上的集成接口
  • 让 25 个技能正式跑起来
3 周时间,我从"我想整理一下邮件"变成了"我有了一个可复制的 AI 办公厅主任,连非技术背景的营销人员都能自己搭建"。

最棒的是,我现在能早点下班陪孩子了。我吃饭时不刷 Slack 也不看邮件了,直接关掉。我知道明天 MARVIN 会帮我盯着事儿。我开始有时间给自己了,这好久都没有过了。以前总觉得工作压得喘不过气,现在终于掌控住了。



总结

造一个可自定义、可训练的 AI 助理是超级生产力神器,这个项目就是个绝佳范例。 github点击标题

以下是重点:

  • 怎么工作的:不是什么黑盒子。MARVIN 在终端里用 Claude Code 跑,用了一套巧妙的 markdown 文件系统来存技能、记忆和状态。表面看起来 low-tech(技术含量低),但底层很强大。
  • 你不是一个人在战斗:很多人在造类似的私人智能体。评论里有人提到用 Obsidian 搭建的(比如"Claudesidian")还有其他工具。另一个流行智能体"Doris"的作者甚至现身跟楼主交流心得。这股风很盛。
  • "普通人"难题:楼主和其他人都发现,让非技术人员上手是个关键挑战。教你的营销同事用终端和 markdown 才是真正的终极 boss。
  • 安全警报:有个眼尖的用户在 GitHub 仓库里发现了一个硬编码的 Google 客户端 ID。楼主承认是失误,已经推送修复了。大家互相监督,挺好。
  • 下一步? 楼主个人的 MARVIN 用了 Telegram 集成,计划加到公开模板里。还有人在讨论换成本地 AI 模型,既保护隐私又能让智能体 24/7 运行。


Reddit讨论:

关于Clawdbot的比较

有人问要不要集成Clawdbot(另一个类似工具):
MARVIN已经不是第一次被拿来跟Clawdbot比了。说实话,MARVIN是我自己造的,用了一段时间后才听说Clawdbot。
我得研究下Clawdbot,看看有没有更大的生态可以参与。

安全方面全是本地的。对市场同事,我建了个Google开发者项目让他们连,这样都在内部。其他MCP服务器比如Atlassian有自己的认证。
所有工作都在VPN后面做,所以暂时不担心重大安全问题。

同好探讨

另一个造类似智能体的家伙说:
我也用Claude Code造了个类似的,但选了Claude默认性格当私人助理。值得分享这个想法,但说实话每个人工作和沟通风格独特,我觉得大家应该自己造,边用边调。花1天搭工具,1周通过日常对话调教,现在能处理我95%的工作行政事务。每个人都该有个私人AI助理。

楼主回复:
因为我是开发,加集成很容易,但拉市场同事上车时我录了会话,看他们的痛点在哪。用编程工具对非技术人员真的很吓人。1小时的 onboarding 后,我做了重大改进让他们更容易上手。希望这能继续发展。

对方接着说:
我觉得我不需要开发技能来搭工具,但需要一些开发知识来正确提示Claude,让工具能造出来并正常工作。我觉得今年或明年这门槛会消失,Claude应该能接受"我需要你帮我管工作,你需要啥工具……好,造出来",然后100%正确设置,还能通过跟用户来回对话自己配置——现在肯定还有差距。


有人说这主要是给内容创作者用的

我看了技能,发现这主要是给靠内容创作谋生的人用的。建议编辑下帖子, upfront 说清楚这点。或者分享下你发现的、适合其他场景的好用例。大多数人不是干你这行的。

楼主:好反馈。你说得对,我已经不写整天代码了,写东西更多。如果其他人开始用,我肯定更新。现在我用户群是公司市场团队,所以模板是为他们优化的。


关于Telegram/WhatsApp集成

有人问有没有考虑接Discord/Telegram/WhatsApp改善体验。

楼主:我的私人MARVIN设置就用了Telegram!只要在我电脑上运行,我在哪都能用他。这就是我要搞台Linux机的原因。但现在优先让市场同事用上。这周末我会加新MCP服务器和Telegram。

有人说WhatsApp难搞,楼主:我试过WhatsApp,但老出问题。我在另一个帖子里看到有人提Telegram,就试了试。现在我的私人Marvin有Telegram支持,爽翻了。

跟Obsidian的比较

这就像Claude跑在Obsidian仓库里,带自定义技能和命令,对吧?
类似这个项目:https://github.com/heyitsnoah/claudesidian
我用类似的用了3个月。改变人生。也研究下你的

楼主:对, premise 一样。我以前用Obsidian,但被 block 了一段时间,所以我就建了个仓库用markdown文件,在VS Code里编辑。造MARVIN时,觉得不用Obsidian更简单,虽然 premise 完全一样。

关于架构

有人问架构是啥?

楼主:Claude Code是骨架。
我有个.marvin文件夹放所有机械部件: onboarding 材料、核心脚本、MCP服务器设置。
skills/放所有模板技能,还有个技能制造技能(对,我加了这个,因为他给非技术用户造技能时很挣扎)。
CLAUDE.md文件指示Marvin保存核心性格、核心记忆(比如我常提的人名,老板同事啥的)、目标、技能索引。
其他是markdown文件夹,我们组织所有东西,比如会话、周报、当前状态、研究等。用户可以根据需要加新文件夹。

关于本地AI
有人问能不能用本地AI(比如Ollama),还要Docker化。

楼主说:我在另一个评论里说了,我有台Linux机在路上了,打算搭本地AI看能不能让Marvin一直运行。搞好了告诉你!

有人说可以用Doris项目(用分层Claude和本地AI),楼主说:我们都在为自己解决问题。等不及看接下来几个月会变成啥样。

有人提建议:

好作品!我开始用了,能看出这会大幅改变我的工作流。
首先,这有个PR加Slack MCP,效果很好,我在用它整理团队聊过但一直没定稿发布的博客点子。让Marvin全搞定 :)
https://github.com/SterlingChin/marvin-template/pull/1

做旅行社的人问:
我也在搞类似的。但我还集成了Chrome扩展,因为我们有很多定制网站用来报价啥的。
我的难点是集成邮件。我邮件超多,很多是促销的(复杂HTML模板)。太吃token了。我开始建促销邮件发件人列表,要么跳过要么清理后再分析。这是现在的坎。想问你咋管收件箱的。

楼主:同病相怜。我设了好多过滤器和自动标签,让marvin轻松多了。我自动给邮件加优先级标签,让MARVIN先抓重要的,再往下走。这样不用花token翻每封邮件。如果你用gmail,他们的过滤器很强。

你得训练你的智能体,别指望一次搞定。

大多数人指望AI开箱即用。但真正的魔法来自迭代——就像你 onboarding 人类同事一样。
你的方法 striking 的是:你不是让MARVIN替你做决定。你说你想要啥,给反馈,让他执行。这跟"问AI要建议"的心理模型很不一样。
好奇:MARVIN自信地做错事时你咋处理?特别是邮件——发错一封就尴尬了。

这太有意思了!我想用MARVIN或类似的来做日常组织和内容生产(博客和相关社媒内容),还有我的日常工作(法医临床评估)。但我刚开始学用AI,从免费Claude开始。如果有人知道从这儿到能有效使用Marvin这种私人AI助理的路咋走,想听听!
楼主:乐意帮忙!我带了3个非技术市场同事走完设置,教他们用Marvin。

关于Obsidian迁移
有人问把Marvin装到已有90天深度的Obsidian仓库会不会有问题。

楼主:我觉得完全没问题!MARVIN可以用你的obsidian仓库,只要指给他看从哪拉文件。我喜欢能推到私人仓库,所以这也是把东西放marvin里的原因,但说实话,只要告诉MARVIN从哪拉文件、存文件,你就没问题。如果你试了遇到问题告诉我,我可以造迁移脚本或专门的obsidian集成。

关于家庭/个人使用
有人问有没有用于个人/家庭事务的例子,或者计划做。比如跟踪孩子学校截止日期、管理家庭项目之类的。看到的大多是工作相关(邮件、Jira、市场),好奇私人场景能不能用。

关于Markdown vs Confluence
有人问既然Confluence页面基本就是markdown页面,为啥不直接用Confluence。

楼主:我们内部工作很多在confluence里,所以有atlassian集成,但为了快速写作和起草,本地存markdown文件更方便。我能在cursor里编辑、迭代。有些东西会推回confluence,但我大部分需要做的是引用现有confluence文档,不是造新的。

有人补充技巧:不知道你是不是已经在这么做,但教claude用Atlas(ADF/Json)格式的v2 api,claude处理confluence会好得多。我基本让claude只以ADF格式从confluence推拉。同时我让claude把ADF转成markdown,这样我能在发布前审阅修改。
结果一致性高得多,还能用confluence页面比markdown多的格式功能,比如表格颜色。

关于生产力提升的具体例子
有人问具体咋用,能不能给例子。

楼主:好!
我在湾区给公司组织开发者 meetup。每次有些固定任务要做,我在物流方面快淹死了。我造了个技能,包含我的工作流和任务清单,然后通过MCP给所有系统开权限。但除了物流,我有超长的联系人列表,还有超多表达过想在活动上演讲的人。把自定义CRM和 meetup 工作流技能通过MCP结合,我已经能排好接下来4个月的 meetup 了,全在1周内搞定。邮件、Slack消息,全是通过Marvin和他的技能完成的。

关于市场团队具体用例
有人问能不能分享Marvin帮市场部门的具体任务。

楼主:可以!
我昨晚刚遇到这事。我意识到如果市场人员直接克隆仓库就用,如果我拉新集成、技能或MCP服务器,他们分支上可能会意外删掉所有东西。所以现在 onboarding 时,Marvin会建新目录,复制文件,链接到原仓库。这样如果我加新功能,他们能从主仓库拉最新版,然后跑集成脚本。

关于与LangChain比较
有人问有没有看过LangChain的openwork,也在给内部团队部署类似智能体,在Claude Code方案和命令行外的聊天界面之间摇摆。

楼主:谢谢!没看过,但会研究他们在干啥。
我用终端用习惯了,所以没觉得需要造UI。但对市场同事,我可能会造一个。