Skip to content

22. 国内 LLM 接入

本章你将学到

  • 5 大国产 LLM 完整对接教程(DeepSeek / 通义千问 / Kimi / 智谱 / Ollama)
  • 每家的定价、速度、能力简评
  • OpenClaw 配置完整 yaml
  • 国内聚合方案(硅基流动 / OpenRouter)什么时候用
  • 哪种场景该选哪个模型

不用读全

按你选定要用的那家直接跳到对应小节。新手如果还没决定,看完 22.2 选型表后选一个开始

22.1 国产 LLM 全景

模型公司价格区间中文编码多模态国内直连
DeepSeek-V3深度求索🟢 最便宜★★★★★★★★★
DeepSeek-R1深度求索🟢 便宜★★★★★★★★★
通义千问 Plus阿里🟢 便宜★★★★★★★★★有 Qwen-VL
通义千问 Max阿里🟡 中等★★★★★★★★★★
Kimi K2月之暗面🟡 中★★★★★★★★文档强
智谱 GLM-4.5智谱AI🟡 中★★★★★★★★有 GLM-4V
Ollama 本地自部署🟢 免费看模型看模型看模型✅(不用网)

22.2 选型建议(按场景)

我的场景推荐
入门 / 学习 / 预算紧DeepSeek V3(便宜质量好)
中文写作 / 文档通义千问 Plus
编程 / 代码相关DeepSeek V3 或 Claude(如果能上)
长文档分析Kimi K2(128K context 起步)
多模态(看图)通义 Qwen-VL / 智谱 GLM-4V
隐私 / 离线Ollama 本地
想一个 Key 调多家硅基流动(见 22.7)

22.3 DeepSeek 完整对接

价格(2026 年 5 月)

模型输入 ¥/1M tokens输出 ¥/1M tokens
deepseek-chat¥1¥2
deepseek-reasoner¥1¥8

打个比方:来回聊一万条普通对话约 ¥3-5。新手 ¥10 起步用一个月没问题

申请步骤

  1. 访问 platform.deepseek.com
  2. 注册 → 实名(必须)
  3. 充值至少 ¥10
  4. 「API Keys」→ 创建 → 复制 sk-xxxx

OpenClaw 配置

.env:

bash
DEEPSEEK_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxx

providers.yaml:

yaml
providers:
  - id: deepseek
    type: openai-compatible
    base_url: https://api.deepseek.com/v1
    api_key: ${DEEPSEEK_API_KEY}
    models:
      - name: deepseek-chat
        context_window: 64000
        max_output: 8000
      - name: deepseek-reasoner
        context_window: 64000
        max_output: 8000
        reasoning: true

default:
  provider: deepseek
  model: deepseek-chat

验证

bash
openclaw providers test deepseek
openclaw agent -m "你是谁"

22.4 通义千问 完整对接

价格

模型输入 ¥/1M输出 ¥/1M
qwen-plus¥4¥12
qwen-max¥40¥120
qwen-turbo¥0.3¥0.6(最便宜,但能力弱)

新用户大礼包

开通 DashScope 通常送 ¥10-50 免费额度,可以白嫖一段时间。

申请步骤

  1. 阿里云首页 注册 / 登录
  2. DashScope 控制台 → 开通
  3. 「API-KEY 管理」→ 创建新 KEY → 复制

OpenClaw 配置

.env:

bash
DASHSCOPE_API_KEY=sk-xxxxxxxxxxxxxxxxxxxx

providers.yaml:

yaml
providers:
  - id: qwen
    type: openai-compatible
    base_url: https://dashscope.aliyuncs.com/compatible-mode/v1
    api_key: ${DASHSCOPE_API_KEY}
    models:
      - name: qwen-plus
        context_window: 131000
        max_output: 8000
      - name: qwen-max
        context_window: 32000
        max_output: 8000
      - name: qwen-turbo
        context_window: 8000
        max_output: 2000

阿里 base_url 容易写错

https://dashscope.aliyuncs.com/compatible-mode/v1https://dashscope.aliyuncs.com/api/v1(那是阿里专有协议,不兼容 OpenAI 格式)

22.5 Kimi 完整对接

价格

模型¥/1M tokens
moonshot-v1-8k¥12
moonshot-v1-32k¥24
moonshot-v1-128k¥60

128K 上下文场景(长文档分析、超大代码库)适合用 Kimi。

申请

  1. platform.moonshot.cn 注册
  2. 充值 → 创建 API Key

配置

bash
# .env
MOONSHOT_API_KEY=sk-xxxxxxxxxxxxxxxxxxxx
yaml
# providers.yaml
providers:
  - id: kimi
    type: openai-compatible
    base_url: https://api.moonshot.cn/v1
    api_key: ${MOONSHOT_API_KEY}
    models:
      - name: moonshot-v1-8k
        context_window: 8000
      - name: moonshot-v1-32k
        context_window: 32000
      - name: moonshot-v1-128k
        context_window: 128000

22.6 智谱 GLM 完整对接

价格

模型¥/1M tokens
glm-4.5¥10-20
glm-4.5-flash¥1
glm-4v(多模态)¥50

申请

  1. open.bigmodel.cn
  2. 注册 → 实名 → 「API Keys」创建

配置

bash
ZHIPU_API_KEY=xxxxxxxxxxxxxxxxxxxxxxxxxxxx
yaml
providers:
  - id: zhipu
    type: openai-compatible
    base_url: https://open.bigmodel.cn/api/paas/v4
    api_key: ${ZHIPU_API_KEY}
    models:
      - name: glm-4.5
        context_window: 128000
      - name: glm-4.5-flash
        context_window: 128000

22.7 聚合方案:硅基流动 / OpenRouter

不想配 5 家?用聚合服务一个 Key 调多家。

硅基流动(国内)

  • 网站:siliconflow.cn
  • 支持:DeepSeek / Qwen / GLM / Llama / 等几十家
  • 价格:略加 5-10% 服务费
  • 优势:一个账号、人民币付款、国内直连、有免费额度

配置:

yaml
providers:
  - id: siliconflow
    type: openai-compatible
    base_url: https://api.siliconflow.cn/v1
    api_key: ${SILICONFLOW_API_KEY}
    models:
      - name: deepseek-ai/DeepSeek-V3
      - name: Qwen/Qwen2.5-72B-Instruct
      - name: meta-llama/Llama-3.3-70B-Instruct

OpenRouter(国外为主)

  • 网站:openrouter.ai
  • 支持:Claude / GPT / Gemini / Llama / 全球几乎所有模型
  • 优势:能调 Claude / GPT 不需国外信用卡(虚拟卡 / Crypto 充值)
  • 缺点:国内不一定直连,常需代理

22.8 Ollama 本地完整对接

装 Ollama

bash
# macOS / Linux
curl -fsSL https://ollama.com/install.sh | sh

# Windows: 下载安装包 ollama.com

下推荐模型

bash
# 平衡(中文友好,7B 需 8GB 显存)
ollama pull qwen2.5:7b

# 编码强(13B 需 16GB)
ollama pull deepseek-r1:8b

# 性能强但要好显卡(70B 需 48GB+)
ollama pull qwen2.5:72b

OpenClaw 配置

yaml
providers:
  - id: ollama
    type: openai-compatible
    base_url: http://localhost:11434/v1
    api_key: ollama          # 占位,Ollama 不验证
    models:
      - name: qwen2.5:7b
        context_window: 32000
      - name: deepseek-r1:8b
        context_window: 32000

default 切换到 ollama:

yaml
default:
  provider: ollama
  model: qwen2.5:7b

Ollama 优势 / 劣势

✅ 优势

  • 完全免费
  • 数据不出本机(隐私 ★★★★★)
  • 离线也能用
  • 没有 token 限制

❌ 劣势

  • 需要好显卡(8B 模型至少 8GB 显存)
  • 7B/8B 模型质量比 Claude/GPT-4 弱一档
  • 跑得比云端慢(除非 RTX 4090 级别)

22.9 多 provider 混用

可以同时配多家,agent 按需切换。

yaml
providers:
  - id: deepseek
    type: openai-compatible
    base_url: https://api.deepseek.com/v1
    api_key: ${DEEPSEEK_API_KEY}
    models:
      - name: deepseek-chat

  - id: qwen
    type: openai-compatible
    base_url: https://dashscope.aliyuncs.com/compatible-mode/v1
    api_key: ${DASHSCOPE_API_KEY}
    models:
      - name: qwen-max

  - id: ollama
    type: openai-compatible
    base_url: http://localhost:11434/v1
    api_key: ollama
    models:
      - name: qwen2.5:14b

default:
  provider: deepseek
  model: deepseek-chat

# 当默认 provider 挂了,自动切到 fallback
fallback:
  provider: qwen
  model: qwen-plus

不同 agent 用不同 provider:

yaml
# coder-bot/agent.yaml
model: { provider: deepseek, model: deepseek-reasoner }   # 写代码用推理强的

# chat-bot/agent.yaml
model: { provider: ollama, model: qwen2.5:14b }           # 闲聊用免费的

# secret-bot/agent.yaml(处理敏感数据)
model: { provider: ollama, model: qwen2.5:14b }           # 强制本地

22.10 成本对比实测

跑同样的 1000 次对话(短问答)的实际花费:

方案总花费速度质量
DeepSeek-V3¥3-5不错
通义 qwen-plus¥10-15
通义 qwen-max¥80-120顶级
Kimi 32k¥15-25
GPT-4o-mini¥30-50
Claude Sonnet 4.6¥80-150顶级
Ollama 7B免费一般

结论:日常用 DeepSeek 性价比无敌,遇到难题切到通义 Max 或 Claude。

22.11 常见报错

401 UnauthorizedInvalid API Key

  • Key 错或过期,去服务商后台重新生成

429 Too Many Requests

  • 调用频率太高,OpenClaw 已经在自动 retry,等等就好
  • 高频场景考虑升级账户层级

Insufficient Balance

  • 账户余额不够,充值

DashScope 报 Model not found: qwen-plus

  • 检查 base_url 是否是 compatible-mode/v1
  • 检查模型名拼写:阿里官方是 qwen-plus 不是 qwen2.5-plus

Ollama 报 ECONNREFUSED

  • Ollama 服务没启。ollama serve 或 macOS 打开 Ollama 应用

看完这一章你应该知道

✅ 5 大国产 LLM 价格和能力对比 ✅ DeepSeek 性价比无敌(推荐新手起步) ✅ 通义 Max / Claude 适合高质量场景 ✅ Kimi 适合超长文档 ✅ Ollama 适合隐私 / 离线 ✅ 硅基流动 一个 Key 调多家


下一步23. 国内 channel 接入 →

模型搞定,下一章让你的 agent 接到飞书 / 钉钉 / 企业微信 / QQ / 微信。

面向中文用户的 AI 工具学习站 · 持续更新