跳转到主要内容

OpenAI

OPENAI_API_KEY

Anthropic

ANTHROPIC_API_KEY

Google Gemini

GOOGLE_API_KEY

Fireworks AI

FIREWORKS_API_KEY

xAI

XAI_API_KEY

Perplexity

PERPLEXITY_API_KEY

DeepSeek

DEEPSEEK_API_KEY

Groq

GROQ_API_KEY

Cohere

COHERE_API_KEY

Cerebras

CEREBRAS_API_KEY

Mistral

MISTRAL_API_KEY

Moonshot

MOONSHOT_API_KEY

按使用场景的模型推荐

选择合适的模型取决于你的具体需求。以下指南可帮助你根据自身需求选择最适合的模型提供商和模型:

工具调用与函数使用

最适合: 构建需要调用外部工具或函数的智能体和应用
  • anthropic/claude-opus-4-5 - 在结构化输出场景下具备极高的工具调用可靠性
  • anthropic/claude-sonnet-4-5-20250929 - 工具使用能力强且性能优异
  • openai/gpt-5 - 原生函数调用支持,返回结构化响应
  • openai/gpt-4o - 适用于生产环境的可靠工具调用
  • deepseek/deepseek-chat - 支持多步推理的高级工具使用能力

编程与开发

最适合: 代码生成、调试和技术实现
  • deepseek/deepseek-coder - 专为编程任务打造
  • openai/gpt-5-codex - 面向代码生成与补全的专用模型
  • anthropic/claude-opus-4-5 - 具备出色的代码理解与生成能力
  • anthropic/claude-sonnet-4-5-20250929 - 代码能力优秀,响应更迅速
  • xai/grok-code-fast-1 - 面向代码的高速模型

推理与复杂问题求解

最适合: 数学推理、逻辑分析和复杂决策
  • anthropic/claude-opus-4-5 - 高级推理能力
  • openai/o3 - 面向复杂问题的深度推理
  • openai/o1 - 强大的多步推理能力
  • deepseek/deepseek-reasoner - 专门面向推理任务的模型
  • xai/grok-4-fast-reasoning - 为推理任务优化

速度与效率

最适合: 需要高速响应的高吞吐量应用
  • anthropic/claude-haiku-4-5-20251001 - 以较低成本提供快速性能
  • google/gemini-2.5-flash - 为高吞吐量和低延迟进行了优化
  • openai/gpt-5-mini - 轻量且快速的模型
  • openai/gpt-5-nano - 超高速,适用于简单任务
  • xai/grok-4-fast-non-reasoning - 在不进行复杂推理的情况下提供快速响应

长上下文任务

最适合: 处理大型文档、代码库或长时对话
  • google/gemini-2.5-pro - 支持超过 100 万个 token 的上下文窗口
  • google/gemini-2.0-flash - 大上下文窗口且性能快速
  • anthropic/claude-opus-4-5 - 适合复杂分析的扩展上下文
  • anthropic/claude-sonnet-4-5-20250929 - 强大的长上下文能力
  • openai/gpt-4-32k - 扩展的 32K 上下文窗口

视觉与多模态

最适合用于: 图像理解、文档分析和各类视觉任务
  • openai/gpt-4o - 具备强大视觉能力的对话模型
  • anthropic/claude-opus-4-5 - 高级多模态理解能力
  • anthropic/claude-sonnet-4-5-20250929 - 多模态且性能高速
  • google/gemini-2.5-pro - 高级视觉与多模态处理
  • xai/grok-2-vision-1212 - 多模态理解能力
许多服务提供商都会提供多个模型档位(例如 mini、standard、pro、opus),以在成本、速度和能力之间取得平衡。建议先使用较小的模型进行测试,再根据性能要求逐步升级。

支持的模型

通过编程方式发现: 使用 GET /v1/models 列出 所有具备不同能力(视觉、工具、思考、流式传输)的数百个模型及其 路由元数据。非常适合用于构建模型选择器,或在 n8n 等工具中自动填充下拉列表。

OpenAI

对话模型

  • openai/gpt-5.2
  • openai/gpt-5.1
  • openai/gpt-5
  • openai/gpt-5-mini
  • openai/gpt-5-nano
  • openai/gpt-5-chat-latest
  • openai/gpt-4.1
  • openai/gpt-4.1-mini
  • openai/gpt-4.1-nano
  • openai/gpt-4o
  • openai/gpt-4o-2024-05-13
  • openai/gpt-5.2
  • openai/gpt-4o-search-preview
  • openai/gpt-4o-mini-search-preview
  • openai/chatgpt-4o-latest
  • openai/gpt-4-turbo
  • openai/gpt-4-turbo-2024-04-09
  • openai/gpt-4
  • openai/gpt-4-0125-preview
  • openai/gpt-4-1106-preview
  • openai/gpt-4-0613
  • openai/gpt-3.5-turbo
  • openai/gpt-3.5-turbo-0125
  • openai/gpt-3.5-turbo-1106

推理模型

  • openai/o1
  • openai/o3
  • openai/o3-mini
  • openai/o4-mini

图像生成

  • openai/dall-e-3

语音转写

  • openai/whisper-1

嵌入模型

模型价格
openai/text-embedding-3-large$0.13 / 每 100 万 tokens
openai/text-embedding-3-small$0.02 / 每 100 万 tokens
openai/text-embedding-ada-002$0.10 / 每 100 万 tokens

Anthropic (Claude)

Claude 4.6 系列

  • anthropic/claude-opus-4-6

Claude 4.5 系列

  • anthropic/claude-opus-4-5
  • anthropic/claude-haiku-4-5-20251001
  • anthropic/claude-sonnet-4-5-20250929

Claude 4 系列

  • anthropic/claude-opus-4-1-20250805
  • anthropic/claude-opus-4-20250514
  • anthropic/claude-opus-4-5

Claude 3.7 系列

  • anthropic/claude-3-7-sonnet-20250219

Claude 3.5 系列

  • anthropic/claude-3-5-haiku-20241022

Claude 3 系列

  • anthropic/claude-3-haiku-20240307

Google(Gemini)

Gemini 3 系列

  • google/gemini-3-pro-preview
  • google/gemini-3-flash-preview

Gemini 2.5 系列

  • google/gemini-2.5-pro
  • google/gemini-2.5-flash
  • google/gemini-2.5-flash-lite

Gemini 2.0 系列模型

  • google/gemini-2.0-flash
  • google/gemini-2.0-flash-exp
  • google/gemini-2.0-flash-001
  • google/gemini-2.0-flash-lite

嵌入模型

  • google/text-embedding-004

xAI(Grok)

Grok 4 系列

  • xai/grok-4-1-fast-reasoning
  • xai/grok-4-1-fast-non-reasoning
  • xai/grok-4-fast-reasoning
  • xai/grok-4-fast-non-reasoning
  • xai/grok-code-fast-1
  • xai/grok-4-0709

Grok 3 系列

  • xai/grok-3
  • xai/grok-3-mini

Grok 2 系列

  • xai/grok-2-vision-1212

DeepSeek

  • deepseek/deepseek-chat
  • deepseek/deepseek-reasoner
  • deepseek/deepseek-coder

Mistral

  • mistral/mistral-large-latest
  • mistral/mistral-medium-latest
  • mistral/mistral-small-latest
  • mistral/codestral-2508
  • mistral/open-mistral-nemo-2407
  • mistral/pixtral-12b

Groq

为开源模型提供超高速推理。
  • groq/llama-3.1-8b-instant
  • groq/llama-3.3-70b-versatile
  • groq/openai/gpt-oss-120b
  • groq/openai/gpt-oss-20b
  • groq/whisper-large-v3
  • groq/whisper-large-v3-turbo

Cerebras

在定制芯片上的超高速推理。

生产环境模型

  • cerebras/llama3.1-8b
  • cerebras/llama-3.3-70b
  • cerebras/gpt-oss-120b
  • cerebras/qwen-3-32b

预览版模型

  • cerebras/qwen-3-235b-a22b-instruct-2507
  • cerebras/zai-glm-4.7

Moonshot(Kimi)

Moonshot AI 提供的高级推理与超长上下文模型。
  • moonshot/kimi-k2.5
  • moonshot/kimi-k2-0905-preview
  • moonshot/kimi-k2-0711-preview
  • moonshot/kimi-k2-turbo-preview
  • moonshot/kimi-k2-thinking
  • moonshot/kimi-k2-thinking-turbo