我拿Hermes Agent到底干了啥(附省钱套路)

怎么用Hermes Agent干活。从记下日常烦心事开始,分配合适模型,别一上来就烧钱。搞个提醒喝水的破模型都比瞎折腾强。

别一上来就问“AI代理能干嘛”,那跟问“锤子能干嘛”一样废话。你得先看看自己每天干哪些破事又烦又费时间,然后把最烦的那几件扔给AI当跑腿。我折腾了几个礼拜,最后发现最有用的AI代理,一个是帮我查病的科研资料,另一个是特么提醒我喝水。对,你没听错,喝水。所以别整那些虚的,从你生活里最真实的痛点下手,花最少的钱。

我一开始也懵逼,装完软件盯了一小时不知道干嘛

几周前我也跟风装了OpenClaw。装完之后我就盯着屏幕,盯了一个小时,然后关了,再也没打开过。

为啥?

因为我不知道拿它干嘛。

X上天天刷到什么Mac Mini搞机群、什么AI自动干活,我看着就挠头。我心里也痒啊,也想上车,但就是找不到上车点。

后来我琢磨明白了:不是AI代理没用,是我压根没想清楚自己需要它帮我干个啥。

所以我就干了一件事——拿张纸,记下来一天里我到底干了哪些事。不是那种“工作8小时”的大话,而是很具体的:早上查邮件烦了20分钟、中午想不出来吃啥、下午查医学资料查得眼瞎、晚上忘了喝水头疼……

记了一个礼拜,我再看这个单子,问自己两个巨俗的问题:

哪些事特别花时间?  
哪些事我不得不做,但做完跟没做一样,对我没啥价值?

比如查医学资料,我特么有慢性病,MCAS加上严重食物过敏,网上信息乱七八糟,我自己一条条筛能筛到崩溃。这事儿花时间、费脑子、还没啥成就感——完美适合扔给AI。

再比如想晚饭吃啥。我每顿都得自己做,有些日子站在厨房里就是“啊……又要做饭”的死循环。这种决定,我完全不想动脑子。

你看,问题找到了,AI代理就有了活路。


我到底配了哪些AI代理,每个干不同的傻活

Hermes这玩意儿好的一点是,你可以配多个“档案”,每个档案用不同的模型,在终端界面里随便切。我喜欢折腾,这就很爽,可以同时对比几个模型谁更智障。

下面是我目前的代理阵容,每个干嘛用、用的啥模型,都给你交代清楚。我主要通过Hermes的终端界面和Telegram来使唤它们。

科研代理帮我查论文,我要的是引用来源而不是干活

这个代理专门用来查东西。我会扔给它一个主题,让它给我出一份研究简报,还得带上引用链接。

为啥要引用?因为我不想让它替我思考,我想自己去看原始论文。比如我想学怎么做模型量化,我不是让代理替我干,而是让它教我方法,我自己动手。

这个代理目前在Nous Portal上跑,用的是MiniMax M2.7。之前也试过NVIDIA NIM上的免费模型。它的价值就是帮我缩小搜索范围,把最相关的资料怼到我面前,省得我自己像无头苍蝇一样乱搜。

技术代理啥都干,连我终端界面都是它改的

这个代理就是传说中的“万能工”。我昨天刚让它把所有代理的终端界面样式改了一遍。之前还拿它测试过无数模型。

它现在跑的是GPT 5.5,用的是我自己的ChatGPT Plus订阅(注意不是API,是订阅,一个月20美金)。万一配额用完了,我得再想个备胎方案。

我还特意分了个工:一个技术代理负责研究(比如查资料、读文档),另一个负责执行(比如实际改配置)。这样不容易乱。

喝水代理听起来傻,但改变了我人生

你们要笑就笑吧。我专门搞了一个代理,每天定时提醒我喝水。

离谱吗?太离谱了。

有用吗?巨有用。

写这篇文章的时候我还在想,干脆再让它提醒我检查坐姿——我在电脑前驼背了十几年,最近半年拼命在纠正。再加个久坐提醒,到点了就起来走两步。

这个代理走的是OpenRouter上的免费模型:NVIDIA Nemotron 3 Super。咋说呢,一个免费的小模型就能干这么一件小事,但比我那些高大上的技术代理还实实在在改善了我的生活。

健康代理替我翻遍全网找医疗研究,顺便帮我决定晚饭吃啥

我身体有毛病,MCAS加严重食物过敏。所以专门搞了一个代理,天天帮我搜最新的医学研究、临床试验、相关新闻。

这玩意儿帮我省下的时间没法算。以前我自己搜,看完一篇又一篇,脑子都要炸了。现在代理先筛一遍,给我摘要和链接,我自己判断哪篇值得精读。

另外它还干一个蠢萌的活:帮我决定晚饭。我把自己常做的菜谱列表扔给它,每天到了饭点,它随机给我选一个。或者我告诉它家里有啥食材,它给我出主意能做啥。

你知道那种“又要做饭了”的绝望感吗?这个代理把这层“决定”的压力给卸了。不是它做饭,是它替我选,我就少烦一件事。

这个代理跑在本地模型上,你敢信?就我这破笔记本,8GB显存的RTX 4070,用的还是Qwen 3.5 9B量化版本,64k上下文。通过无线网络连到Hermes。说实话,这个本地小模型的表现最让我惊喜,又便宜又好使。


怎么挑模型又不烧钱?我的抠门套路

我给自己定了个目标:能多省就多省。网上有些人连Anthropic的API,一天烧掉几百美金。这种“恐怖故事”我见多了,打死不干。

所以下面是我现在用的几个主要来源,按便宜程度排。

OpenRouter上的免费模型,先充10块拿更多请求

OpenRouter上有一堆免费模型。纯免费账号一天只有50次请求,一会儿就用完了。所以我充了10美金进去,不花它,就为了拿到每天1000次请求和每分钟20次请求的额度。

我现在最喜欢的免费模型是:nvidia/nemotron-3-super-120b-a12b:free。够用。

Nous Portal一个月10美金的订阅,带工具调用

我买了一个月10美金的Nous Portal订阅,纯粹为了实验。它走API,我用得挺省。支持工具调用,这个有时候有用。目前我用MiniMax M2.7。

本地模型,破笔记本也能跑得动

我的本地设备挺一般的,但意外地跑得挺好。一台笔记本,RTX 4070 8GB显存,用llama.cpp跑,64k上下文。目前最爱的是一个Qwen 3.5 9B量化版。我也喜欢乱试各种蒸馏版或者“去拒答”版模型。

你肯定猜不到,我还在M1 MacBook 16GB内存上跑过同样的模型。真的,很多人手头的设备就能跑本地模型,就是不敢试。LMStudio是最简单的入门方式,而且现在Hermes可以直接连它。

ChatGPT Plus一个月20美金,用订阅连GPT 5.5

我是最近一两天才试的,用我的ChatGPT Plus订阅连GPT 5.5。用起来几乎没毛病,也没碰到配额问题。我就在想,我为啥等了这么久才试。

这个适合当你需要一个强劲的万能型代理时使用,比如我的那个技术代理。

NVIDIA NIM免费模型,白嫖一堆模型随便试

去build.nvidia.com,你会发现一大堆模型是免费的。注册个账号拿API Key,就能试很多模型,感受一下每个模型“手感”咋样。

DeepSeek v4的API,现在打折75%

我还没试,但X上好多人让我去试DeepSeek v4的API。到五月底之前打75%折,价格爽翻。还记得我刚才说的“补贴”吗?这就是典型。


最后一句大实话:别从技术出发,要从你的烦心事出发

我见过很多人搞AI代理最大的错误——上来就折腾技术,一堆3090显卡、各种框架、API文档读得贼溜,但就是不知道干嘛用。

别这样。

先看你的生活、你的工作、你每天被啥事卡住。记下来,然后挑最烦的三件事,让代理帮你干。

哪怕只是提醒你喝水呢。

然后你就动起来。

别想太多,别买太贵,别从头搭火箭。先用免费模型、本地模型、便宜订阅,跑起来再说。

就这么简单。