32. 案例 8:多 agent 并行调研
这个案例你将做出来
让 Hermes 派 5-10 个 subagent 同时调研 同一个话题的不同角度:
- 一小时调研 10 家公司
- 一晚上扫 200 篇论文找规律
- 30 分钟生成全面对比报告
效率比单 agent 串行高 5-10 倍。
Hermes 杀手特性之一,OpenClaw / Claude Code 都做不到这种"研究级"并行。
32.1 任务设定
我们做一个真实任务:
调研 5 家 AI 编程助手公司(Anthropic / OpenAI / Cursor / Replit / Cognition):
- 创始人背景
- 最近 12 个月融资
- 核心产品 + 定价
- 用户增长 / GitHub stars
- 最近 3 个月动态
- 对 Hermes 的潜在威胁
1 小时内交付对比报告。
32.2 单 agent 做要多久
hermes "调研 [5 家公司],每家深挖以上 6 个维度"- 一家家调研,串行
- 调用 web_search → 拉网页 → 整理 → 下一家
- 预估时间:每家 15 分钟,5 家 ≈ 75 分钟
- 而且 context 越填越满,后面调研质量下降
32.3 Subagent 并行做
hermes "
派 5 个 subagent 同时调研:
- subagent A: Anthropic
- subagent B: OpenAI
- subagent C: Cursor
- subagent D: Replit
- subagent E: Cognition
每个 subagent 用以下 schema:
- founders
- funding (last 12 months)
- products + pricing
- growth_metrics
- recent_news (last 3 months)
- threat_assessment
汇总成对比表。
"Hermes 内部:
🚀 派 5 个 subagent...
subagent-a [Anthropic]: model=claude-sonnet-4-6, backend=local
subagent-b [OpenAI]: model=claude-sonnet-4-6, backend=local
subagent-c [Cursor]: model=deepseek-chat, backend=local
subagent-d [Replit]: model=deepseek-chat, backend=local
subagent-e [Cognition]: model=deepseek-chat, backend=local
⏳ 并发执行中(最大 5 个并发)...
[12 分钟后]
✓ subagent-a 完成 (Anthropic)
✓ subagent-b 完成 (OpenAI)
✓ subagent-c 完成 (Cursor)
✓ subagent-d 完成 (Replit)
✓ subagent-e 完成 (Cognition)
📋 主 agent 汇总成对比表:
| 维度 | Anthropic | OpenAI | Cursor | Replit | Cognition |
|---|---|---|---|---|---|
| Founders | Dario+Daniela | Sam Altman | Aman+Sualeh | Amjad Masad | Scott Wu |
| Funding 12M | $7.3B Series E | $6.6B | $400M Series C | $97M | $2B |
| ...
总耗时: 15 分钟(含主 agent 汇总)
成本: ¥6.5(5×subagent + 主 agent)15 分钟 vs 单 agent 75 分钟,5x 加速。
32.4 进阶:异构 subagent(不同 model + backend)
不同任务难度给不同资源:
subagents:
pools:
deep-research:
model: claude-sonnet-4-6
backend: modal # 云端,独立沙箱
max: 3
quick-fact-check:
model: deepseek-chat
backend: local # 便宜快
max: 10你: 调研 50 家创业公司:
先用 quick-fact-check 池过一遍每家基础信息(5 维度),
然后用 deep-research 池深挖 top 10 有潜力的。Hermes 智能分配:
Stage 1 (quick-fact-check):
10 个并发 × 5 分钟/家 = 25 分钟(50 家)
每家成本 ¥0.10
Stage 2 (deep-research):
3 个并发 × 20 分钟/家 = 70 分钟(top 10)
每家成本 ¥3.50
总成本: 50 × ¥0.10 + 10 × ¥3.50 = ¥40
总时间: 25 + 70 = ~1.5h
单 agent 做要 30+ h32.5 Subagent 互相协作
主 agent 不只是分发-汇总,还能让 subagent 互相校验:
你: 调研 GPT-5 的 benchmark 数据:
- subagent A 去官方网站抓
- subagent B 去 OpenAI 博客抓
- subagent C 去第三方评测站(HF / lmsys)抓
抓完互相对比,找出官方 vs 第三方差异Hermes:
Stage 1: 3 个 subagent 并行抓数据
Stage 2: 主 agent 收 3 份数据
Stage 3: 派 1 新 subagent "对比员" 找差异
Stage 4: 主 agent 整合最终报告
总结:
官方报告 MMLU 92.3%,但 lmsys 测出来 89.1%。
差异原因(推测):
- 官方用 5-shot, lmsys 用 0-shot
- 官方测试集可能有 contamination
建议引用第三方数据更可信。完整 pipeline 30 分钟搞定。
32.6 实战配置
config.yaml
subagents:
enabled: true
max_concurrent: 10
pools:
fast-cheap:
model: deepseek/deepseek-chat
backend: local
max: 10
budget_per_run_usd: 0.10
timeout: 5m
deep-quality:
model: anthropic/claude-sonnet-4-6
backend: modal
max: 3
budget_per_run_usd: 1.00
timeout: 30m
private-isolated:
model: ollama/qwen2.5:14b
backend: docker
max: 2
worktree:
enabled: true # subagent 改代码时用
base_dir: ~/.hermes/worktrees
observability:
log_each_subagent: true
progress_update_interval: 30s主 agent soul 加协调能力
## 并行调研策略
收到调研任务时:
1. 拆分: 把任务拆成可并行的子任务(≤10 个)
2. 派单: 简单子任务用 fast-cheap pool,复杂的用 deep-quality
3. 监控: 每 30s 看进度,超时 / 失败的 subagent 替换或 skip
4. 汇总: 收齐结果后整合,找异常 / 矛盾
5. 校验: 重要发现派额外 subagent 验证32.7 实时监控
跑长任务时看进度:
hermes subagent list --live终端实时刷新:
ID TASK POOL STATUS COST ELAPSED PROGRESS
sa_001 Anthropic 调研 deep-quality running $0.45 8m 23s ▓▓▓▓▓▓░░ 75%
sa_002 OpenAI 调研 deep-quality running $0.52 8m 21s ▓▓▓▓▓░░░ 60%
sa_003 Cursor 调研 fast-cheap done ¥0.08 3m 02s ✓
sa_004 Replit 调研 fast-cheap done ¥0.06 2m 45s ✓
sa_005 Cognition 调研 fast-cheap running ¥0.04 2m 18s ▓▓▓▓▓▓▓░ 85%
Total: 3 running, 2 done | $0.97 + ¥0.18 spent | Avg ETA: 4 min32.8 常见误用
❌ 子任务有依赖关系还派并行
错: subagent A 写代码,subagent B 测代码 ← B 需要等 A
对: A 完成后主 agent 再派 B(顺序而非并行)❌ 子任务全用最贵 model
省钱设计:杂活 deepseek,深度活 claude。
❌ 不设 timeout
某 subagent 死循环跑一晚上 → 早起看账单哭。永远设 timeout。
❌ subagent 数 > 实际有用
调研 5 家公司派 20 subagent → 重复浪费。每个 subagent 应有明确独立任务。
32.9 跨工具组合:Hermes Subagent + Codex/Claude Code
让 subagent 调外部编程工具:
你: 派 3 个 subagent,每个负责 1 个仓库的迁移:
- subagent A: 把 repo-1 从 Vue 2 升 Vue 3,用 Codex
- subagent B: 把 repo-2 从 Python 3.8 升 Python 3.11,用 Claude Code
- subagent C: 把 repo-3 的 React 类组件改成 hooks,用 CodexHermes:
subagent A: shell_exec("codex --task '升 Vue 3'") in worktree-1
subagent B: shell_exec("claude --task '升 Python 3.11'") in worktree-2
subagent C: shell_exec("codex --task '改 hooks'") in worktree-3
并行 3 倍速完成 3 个仓库迁移。详见 33 章 联动其他工具。
32.10 资源 / 成本估算
按上述 5 家公司调研任务:
| 配置 | 时间 | 成本 |
|---|---|---|
| 单 agent 串行 deepseek | 75 min | ¥2 |
| 单 agent 串行 claude | 75 min | ¥30 |
| 5 subagent 全 deepseek | 15 min | ¥4 |
| 5 subagent 全 claude | 15 min | ¥60 |
| 异构(2 claude + 3 deepseek) | 15 min | ¥25 |
异构是性价比之王。
32.11 安全
10 个 subagent 同时跑 = 10 倍滥用风险。必做:
- [ ] 每个 subagent 设
budget_per_run上限 - [ ] 跨 subagent 共享只读 storage
- [ ] subagent 不能改主 agent 配置
- [ ] 高危工具(shell / browser)按池配置 allow/deny
- [ ] 日志全留,定期审计
看完这个案例你应该会
✅ Subagent 并行做调研 5-10x 加速 ✅ 异构 pool(fast-cheap + deep-quality) ✅ Subagent 互相协作(校验 / 对比) ✅ 实时监控进度 ✅ 跨工具组合:subagent 调 Codex / Claude Code ✅ 安全清单不能少
下一步:33. 案例 9:联动 Codex / Claude Code / OpenClaw →
下一个:把本站 4 个工具串起来跑组合工作流。