手机里装个AI管家?我把Hermes Agent塞进了手机桌面
摘要:想用手机随时看Hermes Agent的状态,但官方只有聊天界面。我把它的Dashboard做成了PWA插件,扫码就能装到手机桌面,同一账号登录,不用额外开服务器。目前还是测试版,但天天用,顺便求iOS用户帮忙踩坑。
聊天界面只是冰山一角
Hermes Agent这东西跑在家里一台小电脑上,也就是所谓的“盒子”里。它自己闷头干活,我该干嘛干嘛,互不打扰。
跟它交流主要靠Telegram。发条消息过去,它能回话、切换会话、批个请求什么的。我每天都用,挺顺手。但聊着聊着就发现问题了——聊天窗口只能看到对话,看不到别的。
我想看的是它到底在忙啥。任务列表、项目进度、看板上的卡片、定时任务有没有跑飞、系统状态怎么样、各个AI小助手都在干什么。这些东西在聊天框里根本塞不下。
就像你给朋友发微信问他“忙啥呢”,他回一句“在写代码”。你只知道他在写代码,但他到底在写什么代码、写了多少、遇到啥问题了,你一概不知道。你得有个面板看全局。
聊天是交互用的,仪表盘是观察用的。这俩缺一不可。有了仪表盘,你才知道“哦原来它刚才卡在编译那步了,难怪半天没回我”。
别人做的面板挺好但我就是不想用
其实市面上已经有人做了第三方的仪表盘和网页界面,有的还支持PWA,就是那种能直接装到手机桌面当App用的网页。对那些懒得折腾的人来说,直接拿来用就行。
但我不甘心。我电脑上已经跑着Hermes自己的Dashboard了,再开个别的服务器,总觉得多此一举。就像你已经装了一个空调,再在旁边装个风扇,说“辅助制冷”,听着就多余。
而且还得重新登录一遍,多输一次账号密码。万一API Key(应用程序接口密钥,相当于给程序用的密码)没放对地方,还可能泄露。这种风险我懒得冒。
我就想要一个轻量的东西,直接长在原有的Dashboard上。别整第二台服务器,别整第二套登录。点一下Dashboard里的新标签页,扫码,完事。
插件方案把麻烦降到最低
所以我决定把它做成Dashboard的一个插件。这样它就像Dashbaord自己长出来的一块肉,而不是贴上去的创可贴。
装好之后,Dashboard里会多出一个叫Mobile的标签页。点进去,屏幕上会出现一个二维码。拿手机扫一下,浏览器会弹出一个提示,问你要不要把这个页面加到桌面。
点了“添加到主屏幕”,手机桌面上就多了个图标,长得跟普通App一样。点开它,看到的还是原来那个Dashboard的内容,但界面自动适配成手机大小。
关键是不用再输一遍密码。因为它是从同一台电脑的Dashboard派生的,登录状态直接继承。就像你用同一个钥匙串,开了大门之后,里面的小门不用再掏钥匙。
而且API Key不会跑到手机端去。所有敏感信息都留在服务器上,手机只是个显示器和触摸板。
安装命令其实比你想象的简单
装这个插件有两种办法。一种是直接用Hermes自己的插件管理命令。在终端里敲:
hermes plugins install stasstepv/hermes-pwa
hermes plugins enable hermes-pwa
第一句是从网上下载插件包,第二句是把它激活。装完就能用。如果走这条官方推荐的路,基本不会出啥岔子。
另一种是走npm,就是Node.js的包管理器。先跑一句:
npx hermes-pwa install
然后再执行 hermes plugins enable hermes-pwa 把它启用。效果一样的,只是安装源不同。
偷懒的话,甚至可以直接跟你的Hermes Agent说“帮我装那个PWA插件”,如果你已经在系统里配好了插件仓库的访问权限。AI代劳,动嘴不动手。
装好之后有个小建议:先把Dashboard挂到Tailscale上。Tailscale是个组网工具,能让外网的设备访问家里内网的服务,相当于拉了一根虚拟网线。这样手机在外面也能连上,安装过程更顺畅。
手机桌面上的样子其实挺能打
装完之后点开手机桌面那个图标,先看到的是Dashboard的移动版首页。上面有活动记录,能看到Hermes最近在执行什么任务、有没有报错、有没有需要你确认的操作。
往下翻是项目看板。每个任务卡片标着状态:待处理、进行中、已完成。用手点一下就能切换状态,或者在卡片上留个备注。
再往下是定时任务列表。Cron(Linux系统里的定时任务调度器)配置的脚本都列在那里,下一次执行时间、上次执行结果、成功还是失败,一目了然。要是哪个任务卡住了,点一下就能重跑。
还有一个子Agent列表。如果你给Hermes配置了多个专用AI助手,比如一个管代码、一个管文档、一个管测试,它们都会出现在这个树状图里。每个子Agent的状态在线还是离线、当前在干什么,都标得清楚。
最爽的是审批操作。比如Hermes想执行一个高风险命令,得等你确认。以前得开电脑登录Dashboard点批准。现在掏出手机点一下就行,跟刷朋友圈一样方便。
登录验证不走寻常路
有人可能担心:手机丢了怎么办?谁都能点开这个图标看我的Dashboard吗?
其实不会。因为PWA本质上还是你的Dashboard,只是套了个手机壳。如果你给Dashboard设了登录密码,手机上第一次打开照样要输密码。浏览器会记住登录态,但不会把密码存到图标里。
而且PWA是独立于浏览器的应用容器。它有自己的缓存、自己的存储空间,和Safari或Chrome浏览器的数据是隔开的。就算你在手机上用浏览器打开Dashboard并登录了,PWA里的登录态还是独立的,得另外再输一次。
当然你也可以关掉Dashboard的密码验证,只在内网用。但那就等于家门不上锁,建议只在信得过的WiFi环境里这么干。
作者在安全方面留了一手:不把API Key扔给客户端。手机App只做展示和触发动作,所有真正干活的操作还是服务器自己执行。手机就是个遥控器,不是发动机。
一周晚上加AI帮忙居然真能跑起来
这个插件是作者一个人利用晚上的空闲时间写的,前后大概花了一周多。用了他自己的话说,“很多AI帮忙”。现在AI编程工具已经很成熟了,写个前端界面、调个API接口,AI能顶半个开发。
当然还是有些地方比较粗糙。版本号标的是0.1.2-beta,一看就是还在打磨阶段。Beta就是测试版的意思,可能会有小毛病,但核心功能都跑得通。
作者自己天天在用。这一点很关键——如果一个工具作者自己都不用,那说明连他自己都没信心。他自己每天点开手机图标看状态、批任务,说明这玩意儿至少不会崩到没法用。
他还特意注明这不是官方出品,跟Nous Research没半毛钱关系。Nous Research是Hermes Agent背后的研发机构。这个插件是第三方用公开接口做的,属于“看了说明书自己改装”的DIY项目。
许可证是MIT,也就是最开放的授权协议。你想怎么改、怎么用、甚至拿去做商业产品都行,只要保留版权声明。
iOS上的PWA安装是个体力活
作者在帖子最后特意点了iOS的事。他说在iPhone上,PWA安装和推送通知特别折腾。
确实如此。安卓上装PWA基本是“点一下菜单、选添加到主屏幕、完事”三步走。iPhone上步骤更多,而且不同iOS版本、不同Safari版本表现还不一样。有时候甚至找不到“添加到主屏幕”的选项,得在分享菜单里翻半天。
推送通知在iOS上更麻烦。安卓的PWA可以直接用浏览器推送,iPhone得走Apple的推送服务,还得额外配置证书。作者说这部分还在摸索中,很可能在某些iOS版本上根本不响。
所以他特别呼吁:如果你在用Hermes,又在iPhone上试了这个插件,不管装没装上,都去GitHub的Issues页面(问题反馈区)给他提个反馈。哪怕只说一句“装不上,卡在第几步”都行,至少能帮他定位问题。
这就像你买了一盒拼图,发现缺了一块,马上告诉厂家,下一批货就可能补上。
作者其实是懂得取舍的
仔细想想这个项目挺有意思。作者没有把Hermes Agent本身改得面目全非,只是在它旁边加了个方便的入口。他没有重写核心逻辑,没有发明新的交互方式,就做了一件事:把Dashboard拉到手机桌面上。
这个思路很“懒”也很有智慧。真正有用的工具不是功能最多的,而是最顺手的那一个。就像你厨房里最好用的刀,往往不是最贵那把,而是每天拿起来最顺手的。
他放弃了做全套App的野心,放弃了跟官方竞争的功能堆砌,甚至主动说“你们也可以用第三方的面板,不一定非用我做的”。这种心态反而让人放心。
他还给自己划清了界限:“非官方、独立、与Nous Research无关”。听起来像免责声明,实际是诚实。他不吹嘘这个插件能替代官方产品,只说“我用着挺顺手,你们试试,坏了告诉我”。
评论区都在等小白鼠反馈
发帖之后评论区很快就有人冒泡了。有人说“晚点试试,谢谢分享”,属于标准的客气围观群众。
作者每条都认真回:如果装的时候出问题,尤其是手机端和PWA相关的部分,一定跟他说。他说“我还在磨那些毛刺”,就是还在修小bug的意思。
还有个回复干脆只有一句“will try this out”,显然是个行动派。另外有人说“traceback这个词展开说说”?Traceback就是程序报错时打印的那串堆栈信息,后面跟着具体哪行代码崩了。
作者解释:那个截图里的traceback指的是Hermes Agent本身处理任务时的报错,不是这个PWA插件出的问题。PWA插件只是把报错信息从服务器端显示到手机上,本身不产生报错。
他还特意说:如果插件坏了,不用发什么正式的调试报告,就说“啥设备、啥浏览器、干了个啥、屏幕上显示啥了”,有截屏更好。接地气的反馈比格式化的报告更管用。
普通用户其实也能装着玩
有人会觉得这东西是给技术宅准备的,普通人玩不转。其实门槛没那么高。
你只需要有一台跑着Hermes Agent的电脑或树莓派,然后会打开命令行输几行命令。剩下的就是点按钮、扫二维码、加到桌面。
而且装完之后,你甚至不用再碰命令行。日常使用全在手机上点来点去。看任务进度、批请求、查系统状态,跟刷短视频一样滑溜。
如果你根本没听说过Hermes Agent,那这个东西对你确实没用。但如果你已经在用或者打算用,它就像给车加了个倒车影像——没有也能开,有了方便一万倍。
作者把门槛设得很低:不用另外租服务器,不用配数据库,不用折腾Docker容器。就一条命令装插件,再一条命令启用,搞定。比装个手机游戏还快。
总结:你以为AI管理工具只有坐在电脑前才能用,结果有人用一周晚上加AI辅助就把它怼到手机桌面上了,而且安全方案比想象中更敷衍又更靠谱——API Key死活不下放给客户端,手机只当个遥控器。
屏幕截图:
完整图库请查看README文件。