本文是【大模型API中转站】系列篇。本系列致力于用最低的成本、最清晰的方法,帮你打通多模型 API 的任督二脉。建议先收藏,随用随查。

Nous Research 刚刚把它家的开源 AI Agent —— Hermes 做成了桌面应用(Hermes Agent v0.15.2,MIT 开源),支持 macOS / Windows / Linux 三端一键安装。这意味着你不用再折腾命令行环境,下载即用。但实测下来有一个绕不开的坑:桌面版当前无法在图形界面里直接填自定义 API(base_url + key),必须中断当前运行的模型、用 hermes model 手动重选一次才能生效。本文带你把它跑起来,并给出这个 bug 的稳妥规避姿势。

下载地址(官方):https://hermes-agent.nousresearch.com/desktop


1. 开篇:我为什么需要这个方案

痛点:很多人想用 Hermes 接 Claude、GPT 这些主力模型,却卡在几个老问题上——

场景:你是一个国内开发者 / 独立创作者,想用 Hermes 这种"一个 Agent 管全平台(Telegram、Discord、Slack、邮件、CLI)"的工具,统一接入你手上已有的中转 API(比如通过 4sapi 这类中转站拿到的 OpenAI 兼容 Key),结果在桌面版第一步就卡住了。

本文目标:给你一条"国内 → 中转 → Claude/GPT"在 Hermes Desktop 上的可行通路,附带完整配置步骤,并重点讲清楚如何绕开"无法在 GUI 自定义 API"这个 bug


2. Hermes 到底强在哪:六大能力一次看懂

先别急着配置,得让你知道这玩意儿为什么值得折腾。Hermes 不是又一个套壳聊天框,它是 Nous Research 打磨的"会成长的 Agent"——一句官方 slogan 叫 "The Agent That Grows With You"。实测下来,它真正能打的地方有六块:

① Connect · 一个分身,活在所有平台。 这是我最想吹的一点。Hermes 不是只待在桌面窗口里,它能同时接管 Telegram、Discord、Slack、WhatsApp、Signal、邮件和 CLI——而且所有平台共享同一份记忆。你在 Slack 上交代的事,回头在 Telegram 上问它照样记得。一个 Agent,七个入口,再也不用在十个 App 之间复制粘贴上下文。

② Remember · 持久记忆 + 自动长技能。 它会记住你的项目、你的习惯,甚至把解决过的问题自动沉淀成可复用的"技能"。用得越久越顺手,越像一个真正懂你的老搭档,而不是每次都从零开始的金鱼脑。

③ Schedule · 自然语言定时,无人值守跑。 想让它每天早上 8 点给你出一份行业简报?每周自动备份?直接用大白话说一句就行,剩下的它通过网关在后台默默跑,不用你守着。

④ Delegate · 子 Agent 并发,任务翻倍。 Hermes 能开出一堆互相隔离的子 Agent,每个有自己独立的对话、终端和 Python RPC 脚本,互不抢上下文。复杂流水线拆给子分身并行处理,主线程一点不卡——这才是"一个人当一个团队用"。

⑤ Search · 不止聊天,能上网、能看图、能出图。 内置 Web 搜索、浏览器自动化、视觉识别、图像生成、文字转语音,还有多模型协同推理。一句话:它能真正"动手干活",而不是只会嘴上说。

⑥ Experiment · 五种沙箱后端,安全隔离。 本地、Docker、SSH、Singularity、Modal 五选一,配合容器加固和命名空间隔离。想让它跑点有风险的代码?丢沙箱里随便造,炸了也伤不到你的主机。

一句话总结:它把"连接 + 记忆 + 定时 + 委派 + 上网 + 沙箱"打包进了一个开源(MIT)桌面应用里。 而这六块能力全都要靠底层大模型撑着——模型够强、够快、够便宜,Hermes 才能发挥到满血。

而这恰恰是关键:Hermes 越强,越吃模型。 它的多模型推理、子 Agent 并发、视觉与出图,每一项都在烧 token。如果你用官方按量付费,多平台 7×24 跑下来账单很可观;想又快又省,把模型这一层换成稳定的中转 API 才是正解。后面方案二会教你怎么把它接到 4sapi 这类 OpenAI 兼容中转上,一把 Key 喂饱上面所有功能。


3. 原理速览

Hermes 本身是"模型无关(provider-agnostic)"的,它不锁定任何一家。请求的真实流向是这样:

你的应用 / Hermes Desktop
        ↓
   中转服务(国内云服务器 / OpenAI 兼容网关)
        ↓
   Claude / GPT 官方 API

中转站这一层帮你处理了三件事:

Hermes 支持的 Provider 很全:Nous Portal、OpenRouter、OpenAI、z.ai/GLM、Kimi/Moonshot、MiniMax、Hugging Face…… 以及最关键的 "Your own endpoint"(自定义 OpenAI 兼容端点)。我们要用的就是最后这一条——把 endpoint 指向中转站(如 4sapi),就能用一把 Key 同时驱动 Claude、GPT、Gemini 等多家模型,省去逐个开户、各自充值的麻烦。


4. 方案

方案一:官方直连(Nous Portal)

最省事的路子是直接用官方的 Nous Portal。一条命令搞定 OAuth 登录、设定 Nous 为 Provider、并开启工具网关:

hermes setup --portal

Portal 自带 300+ 模型、统一订阅(Free / Plus / Super / Ultra 四档),还顺带把 Web 搜索、图像生成、TTS、云端浏览器都包了。适合不想折腾、能接受官方计费的人。

缺点:要海外支付、按 Portal 的定价走,国内访问 Claude/GPT 仍可能受网络影响,且无法用你已有的中转 Key 省钱。


方案二:中转站接入(重点,含 bug 规避)

如果你想接入自己的中转 API(OpenAI 兼容),就走这条。注意:桌面版 GUI 的自定义 API 表单当前有 bug,光在界面里填不生效,必须配合命令行手动重选模型。 下面是实测可行的完整流程。

1)环境准备
2)先在 GUI 里走一遍(确认 bug)

打开桌面版,进入设置里的模型 / Provider 配置,选 "Your own endpoint / Custom",填入 base_urlkey。你会发现:保存后并不会真正切到你的自定义端点,对话仍然走默认模型或直接报错。这就是当前那个未修复的 bug——GUI 写入没有正确落到运行时配置。

3)中断运行 + 命令行手动重选(关键步骤)

正确的兜底姿势是绕过 GUI 表单,用命令行写配置并强制重选模型:

# 第一步:中断当前正在运行的 Hermes 模型
#   - CLI 里按 Ctrl+C,或直接发一条新消息打断
#   - 消息平台里发 /stop

# 第二步:把自定义端点写进配置(OpenAI 兼容)
hermes config set provider custom
hermes config set base_url https://4sapi.com/v1
hermes config set api_key sk-你的中转Key

# 第三步:手动重选模型,让配置真正生效
hermes model
#   在交互菜单里选 "Your own endpoint / Custom",
#   再选择具体模型(如 claude-3-7-sonnet / gpt-4o 等)

核心原因:Hermes 的模型加载发生在 hermes model 这一步。GUI 改了配置但没触发重新加载,所以必须先中断、再用 hermes model 手动重选一次,新端点才会被真正挂载。

4)启动并测试
# 对话中临时切换 / 验证模型也可以用 slash 命令
/model custom:claude-3-7-sonnet

# 然后随便问一句,确认走的是你的中转端点

如果回复正常、计费走的是你中转账户的余额,就说明自定义 API 接通了。以后每次想换模型,对话里直接 /model provider:model 即可,不必再重启。

提示:在官方修复 GUI 表单之前,"中断 → hermes model 手动重选" 是唯一稳定的接入方式,记得收藏。


5. 成本与风险提示


6. 总结与系列导航

一句话总结适用人群:想用 Hermes Desktop 统一管理多平台 AI Agent、又手握中转 API 想省钱的国内开发者和独立创作者——可以上,但记住"GUI 填 API 暂时无效,必须中断后用 hermes model 手动重选"这个坑。

如果你有更顺手的 Hermes 自定义 API 配置方法,或者发现官方已经修了这个 bug,欢迎在评论区分享你的方案,我会更新到文末。中转 API 推荐自取:4sapi