AI Model Pricing
主要 OpenAI、Anthropic 和 Google Gemini 模型每 100 万个 Token 的输入与输出费用。更新于 2026 年 4 月。
OpenAI
GPT-5.4
OpenAI 针对专业任务的最强模型——具备顶尖的推理与代码编写能力
GPT-5.4 mini
目前最强的迷你型号——擅长编程、计算机操作及子任务代理
GPT-5.4 nano
价格最低的 GPT-5.4 级别模型——专为处理简单、高吞吐量的任务而生
GPT-4.1
OpenAI 的前代旗舰产品——在编程、逻辑推理及指令遵循方面依然强劲
GPT-4.1 mini
轻量化的 GPT-4.1——大多数生产环境负载下的可靠默认之选
GPT-4o
具备视觉功能的多模态模型——通过一个 API 即可处理文本、图像和音频
GPT-4o mini
GPT-4o 家族中速度最快、成本最低的变体——非常适合大规模且对延迟敏感的任务
o3
OpenAI 的推理模型——虽然速度较慢且价格较高,但在多步骤逻辑处理上表现显著更优
o4-mini
紧凑型推理模型——比 o3 更便宜,但在逻辑任务上仍远强于 GPT-4o
Google Gemini
Gemini 3.1 Pro
Google 最新的旗舰产品——支持 2M Token 上下文,在推理、代码及多模态任务上表现出色
Gemini 2.5 Pro
上一代 Gemini 旗舰——拥有 1M Token 上下文,已在大量生产环境中部署
Gemini 2.5 Flash
快速且具成本效益——大规模生产环境中的首选 Gemini 模型
Gemini 2.0 Flash
Google 的实惠之选——处理简单、大批量任务时成本最低的 Gemini 模型
Anthropic
Claude Opus 4.6
Anthropic 最智能的模型——胜任复杂 Agent、编程及高难度推理任务的最佳选择
Claude Sonnet 4.6
在智能水平、成本与速度之间取得了最佳平衡——Anthropic 面向大多数生产负载的主力产品
Claude Haiku 4.5
Claude 系列中速度最快、性价比最高——完美适配高吞吐量且对延迟敏感的应用场景
Claude Opus 4.1
旧款高性能 Opus 型号——供已基于其构建的工作负载继续使用
Claude Sonnet 4
上一代 Sonnet——目前在生产环境中仍有广泛应用
Claude Haiku 3
最实惠的 Claude 型号——对于不需要最新代际功能的简单任务,极具性价比