Hermes本地云端双模型配置教程与自动化简报实战

#Hermes

2026-07-02 4K banq

Hermes agent工具的核心玩法是让你同时拥有本地隐私模型和云端强力模型，还能让它们互相隔离，互不干扰。本文用一个每日新闻简报机器人的实战案例，手把手拆解安装、配置、反馈循环的全过程，顺便告诉你为啥大多数 AI 工具其实根本没在“学习”。

安装桌面版就像下载游戏客户端，但多了几个心眼

打开 Hermes 的官方发布页面，找到适合你电脑系统的安装包，Windows 用户点 .exe，Mac 用户点 .dmg，Linux 用户找 .AppImage。下载完双击安装，一路“下一步”就行，这步骤跟装个游戏没啥区别。

但装完之后别急着双击图标打开，先得想清楚一件事：你打算让它跑在哪儿。如果只是本地跑跑小模型，那直接开干没问题。要是想连接云端的强力模型，比如 OpenAI 的 GPT 系列，就得提前准备好 API 密钥，这东西相当于你家大门的门禁卡，没它进不去。

装好之后首次启动，Hermes 会问你要不要创建第一个代理配置文件，建议直接选“本地模式”先试试水。这时候它会在你的电脑系统里自动生成一个隐藏文件夹，专门用来存放各种配置文件、技能脚本和聊天记录。别手贱去删它，删了代理就失忆了。

本地模型跑起来，Ollama 是你的免费咖啡机

Hermes 本身不带模型，它只是个调度中心，真正干活的是模型文件。想让它在本地免费跑，最省事的办法是装个 Ollama，这玩意儿相当于模型界的应用商店，在终端里敲一行命令就能下载模型。

比如说想用 Gemma 12B 这个模型，就在终端里执行 ollama run gemma:12b。但 Hermes 对模型有个特殊要求，上下文窗口必须达到 65536 个 token，不然调用工具的时候会报错或胡言乱语。所谓“上下文窗口”就是模型一次性能记住多少字，记性太差的话你跟它说三句话它就忘了第一句。

解决办法是自己动手改配置文件，用命令行创建一个上下文窗口更大的模型变体。大概长这样：

bash
ollama create gemma:12b-64k -f ./Modelfile

这里的 Modelfile 是你自己写的配置文件，里面指定了 parameter context_length 65536。改完之后 Hermes 才能跟它愉快地聊天，不然就像让一个只能记住三句话的人去当会议记录员，纯属折磨。

云模型和本地模型双开，互相隔离还能随时切换

很多人的真实需求是：写日记用本地模型保护隐私，写代码用云端模型图它聪明。Hermes 允许你创建多个代理配置文件，每个配置可以绑定不同的模型来源和参数，相当于给每个模型都配了一个独立房间，谁也不碍着谁。

操作路径是打开设置面板，找到“模型配置文件”选项，点击新建。第一个配置选 Ollama 本地连接，给它起名叫“隐私保镖”；第二个配置选 OpenAI 的 API，填好密钥，起名叫“算力外挂”。两个配置各自拥有独立的技能文件夹和历史记录，不会串台。

实际使用中，写个人周记的时候就切到“隐私保镖”，让数据留在自己电脑里。需要解析复杂代码或者处理长文档的时候，再切到“算力外挂”让云端大力出奇迹。切换方式也很无脑，界面右上角点一下下拉菜单就能换，比换输入法还简单。

消息网关是你的手机遥控器，Telegram 最省事

代理跑在电脑上，但你不可能一直蹲在电脑前看它干活。消息网关的作用就是架一座桥，让手机能收发代理的消息。Hermes 支持 Discord、iMessage、WhatsApp、Telegram 等多种网关，其中 Telegram 的配置门槛最低。

先在手机上下载 Telegram 并注册账号，然后在应用里搜索 BotFather 这个官方机器人，发 /newbot 指令创建一个新机器人，它会回你一串 token，这串字符就是连接密码。接着再找一个叫 userinfobot 的机器人，让它告诉你自己的用户 ID，这串数字用来确保只有你能操控自己的代理。

把 token 和用户 ID 填进 Hermes 的网关设置里，点启用。从此你的手机 Telegram 就能收到代理发来的消息，也能直接发指令给它。这套组合拳打完，相当于给你的 AI 代理装了个远程对讲机。

技能文件是Hermes 的大脑说明书，学会写它才能定制干活方式

Hermes 怎么干活、干成什么样，全写在技能文件里。

Hermes 的技能文件本质上是 Markdown 格式的说明文档，存放在配置文件夹下的 skills 子目录中。你想让代理每天整理什么信息、按什么格式输出、发给谁，都靠这些文档指挥。

举个例子，做个每日新闻简报技能，就先在 skills 文件夹里新建一个 daily_news.md 文件，里面写清楚：搜索哪些关键词、过滤掉哪些网站、输出格式要求是分条列出还是概括总结、最终发给哪个消息网关。代理每天早上读到这个文件，就会按指令去执行。

技能文件的写法非常口语化，不需要会编程。直接写“每天早上 8 点搜索 AI 新闻，排除广告网站，总结成五条发到我 Telegram”这种大白话，Hermes 也能理解个八九不离十。但想让它理解得更精准，还是得用一些固定的术语，比如用 search_web 表示搜索网络，用 send_to_gateway 表示发送消息。

反馈循环让Hermes 真的在“学习”，而不是原地踏步

绝大多数 AI 工具所谓的“学习”就是个摆设，你教它什么它转头就忘。Hermes 的内置学习循环机制不一样，它能把你通过 Telegram 发回去的反馈意见固化下来，变成下一次执行时的依据。

关键操作是在 cron 定时任务之前，先跑一个“技能更新”脚本。这个脚本会读取你最近发给代理的消息，提取出修改意见，比如“多给点技术细节少给点融资新闻”，然后把这段话追加到 user.md 这个记忆文件里。下次代理执行任务时，会优先参考这个文件里的偏好。

具体配置方式是在设置里找到自动化任务选项，添加两个 cron 表达式。第一个负责每天定时跑简报任务，第二个比第一个早五分钟执行，专门用来读取聊天记录、更新用户偏好。这样一来，你不需要手动修改技能文件，通过手机发条消息就能让代理调整工作方式，等于远程指挥它自己改自己。

硬件不够也能曲线救国，VPS 和 OpenRouter 是备胎

不是每个人都有一台能跑大模型的电脑，这点不用藏着掖着。如果本地跑 12B 模型卡成幻灯片，可以租一台云服务器做主力，这就是 VPS 方案。或者用 OpenRouter 这类聚合平台，它把各家模型接口统一打包，按次收费，不用自己折腾服务器。

用 VPS 跑 Hermes 的步骤跟本地差不多，只是把安装和配置过程搬到了远程机器上。SSH 连上去之后下载安装包，配好环境变量，剩下的操作一模一样。OpenRouter 更省事，只需要在模型配置里把 API 地址换成 OpenRouter 的地址，填上自己的密钥，就能用他们提供的各种模型。

代价是隐私和预算。数据过云端就谈不上绝对隐私，API 调用也不是免费的，每次请求按 token 数量扣钱。所以个人建议把敏感任务留给本地小模型，非敏感的重体力活才丢给云端，两头各取所需。

大多数 AI 根本没在学习，只有你在原地教它

很多人用 AI 助手越用越觉得智障，因为它每天给出的答案几乎一样，不会因为你用久了就变聪明。

Hermes 的反馈循环机制其实是把“人的反馈”当成新的输入数据，重新写进技能文件和记忆文件里，等于你每次提意见都是在帮它更新配置文件。

但这套机制也有个隐藏陷阱：如果你从来不通过网关发反馈意见，它的学习循环就是个死循环，空转不产生任何变化。换句话说，你不主动指挥它调整，它就永远是那个刚装好的状态，不会自动进化。所以所谓的“越用越好用”的前提是“越用越主动地教”。

从这个角度看，工具本身并不自带智力增长，它只是提供了一条让用户持续干预的通道。真正在学习的不是 AI，是用户自己在不断调整指令和偏好。把反馈机制设计得再丝滑，也架不住用户懒得动嘴。

折腾了半天才发现，智能体的进化速度完全取决于你愿不愿意每天花三十秒发条语音反馈。机器不会自己变聪明，但人能通过它变得更懒。