Token Plan 企业版专业套餐是专为企业和团队打造的大模型 API 预付费方案,采用按月结算模式。该套餐支持自定义月度预算(购买积分额度池,在调用模型时,依据各模型的 Token 单价从池中实时扣除,不同模型费率各异)及多 Key 配额管理功能,非常适合团队和企业利用积分体系统一调配多模型调用额度。
快速入门
若您已熟悉 Token Plan 企业版专业套餐,可直接参考
快速入门指南 进行操作。套餐详情
核心概念
套餐 → 积分池 → API Key,三者之间的关系如下:
层级 | 描述 |
账号 | 单个腾讯云账号支持购买多个独立的套餐,每个套餐均配备独立的积分池、API Key 配额及有效期,各套餐之间互不干扰。非常适合按照部门、具体项目或业务条线分别进行采购和管理。 |
套餐(积分池) | 每一个套餐对应一个独立的积分池,池子的大小取决于购买时设定的月预算(100 积分价值 1 元)。积分池是该套餐下所有 API Key 共享的总额度,无论调用哪个模型,都会从同一个积分池中实时扣减。 注意: 积分不具备货币属性,不具有法定货币的流通功能,严禁在账号之间交易,也不能用于支付、购买实物商品或兑换腾讯的其他产品和服务。积分一经售出或发放,不支持折现或退款。 |
API Key | 每个套餐下允许创建多个 API Key,数量上限与套餐积分配比成正比(每拥有 1 万积分可创建 1 个 Key)。每个 Key 均可独立配置可用模型、专属配额、用量上限以及调用速率(TPM),从而实现团队内部精细化的分发和管控。 |
积分规则
积分换算:100 积分兑换价格为 1 元。
积分共享:同一套餐名下的所有 API Key 共用该套餐的积分池,依据实际调用量进行实时扣减。
配额管理:支持为每个 Key 设置独占配额(仅限该 Key 使用的专属积分)和配额上限(该 Key 可使用的积分总额,包含独占与共享部分),未设置独占配额的部分归入共享池,各 Key 遵循先到先得原则。
扣费逻辑:调用模型时,系统按照各模型的 Token 单价从积分池中实时扣除,不同模型单价各异,具体详情请查阅 模型与积分换算说明。
套餐规格
配置项 | 描述 |
月预算 | |
购买时长 | 1 ~ 12 个月 |
可用模型 | Auto 智能路由、GLM-5、GLM-5.1、GLM-5-Turbo、Kimi-K2.5、Kimi-K2.6、MiniMax-M2.5、MiniMax-M2.7、DeepSeek-V4-Flash、DeepSeek-V4-Pro(持续更新中) 提示: 当前模型暂不支持图片、视频等多模态能力。 |
积分抵扣细则
模型与积分换算说明
说明:
输入价(命中缓存):指命中上下文缓存的输入 Token 价格。
输入价(未命中缓存):指未命中缓存的输入 Token 价格。
Auto 智能路由:系统依据请求内容自动甄选模型进行响应,并按照固定价格计费。
实际扣减积分 = Token 消耗量 × 对应单价 。
模型 | 阶梯条件 | 命中缓存输入价 (积分/百万 tokens) | 未命中缓存输入价 (积分/百万 tokens) | 输出价 (积分/百万 tokens) |
GLM-5 | 输入 [0, 32k) | 100 | 400 | 1800 |
| 输入 32k+ | 150 | 600 | 2200 |
GLM-5.1 | 输入 [0, 32k) | 130 | 600 | 2400 |
| 输入 [32k+) | 200 | 800 | 2800 |
GLM-5-Turbo | 输入 [0, 32k) | 120 | 500 | 2200 |
| 输入 [32k+) | 180 | 700 | 2600 |
Kimi-K2.5 | - | 70 | 400 | 2100 |
Kimi-K2.6 | - | 110 | 650 | 2700 |
MiniMax-M2.5 | - | 21 | 210 | 840 |
MiniMax-M2.7 | - | 42 | 210 | 840 |
DeepSeek-V4-Flash | - | 20 | 100 | 200 |
DeepSeek-V4-Pro | - | 100 | 1200 | 2400 |
Auto 智能路由 | - | 50 | 324 | 1596 |
Token 数量测算说明
鉴于不同模型的 Token 单价各不相同(区分缓存命中输入、未命中缓存输入、输出三种计费模式),为便于用户直观评估“特定预算能兑换多少 Token”,平台提供了基于 2026 年运营经验数据的综合单价测算。
注意:
本测算结果仅作为企业预算规划的参考依据,并不代表实际可使用的 Token 数量。
综合单价的计算过程已纳入各模型历史缓存命中率,若页面展示价格存在四舍五入情况,可能会导致测算结果产生细微差异。
实际可使用的 Token 数量受用户真实业务场景的调用复杂度直接影响,最终以真实调用时的实际缓存命中率、输入输出 Token 比例、模型混合使用情况及实时定价规则为准,请密切关注积分消耗情况。
模型 | 综合单价预估 (积分/百万 tokens) | 50 万积分可抵扣 Token 数预估(亿 tokens) | 100 万积分可抵扣 Token 数预估(亿 tokens) |
GLM-5 | 约 440 | 约 11.36 | 约 22.73 |
GLM-5.1 | 约 380 | 约 13.16 | 约 26.32 |
GLM-5-Turbo | 约 340 | 约 14.71 | 约 29.41 |
Kimi-K2.5 | 约 230 | 约 21.74 | 约 43.48 |
Kimi-K2.6 | 约 280 | 约 17.86 | 约 35.71 |
MiniMax-M2.5 | 约 110 | 约 45.45 | 约 90.91 |
MiniMax-M2.7 | 约 100 | 约 50.00 | 约 100.00 |
DeepSeek-V4-Flash | 约 70 | 约 71.43 | 约 142.86 |
DeepSeek-V4-Pro | 约 930 | 约 5.38 | 约 10.75 |
Auto 智能路由 | 约 190 | 约 26.32 | 约 52.63 |
综合单价公式:
综合单价 = (缓存命中率 × 命中缓存输入价 + (1 - 缓存命中率)× 未命中缓存输入价)× 输入占比 + 输出价 × 输出占比 ,若模型存在阶梯定价(例如 GLM-5 按上下文长度分档),建议优先按最长上下文档位进行预算评估,以获取更为保守的预估结果。
可购买 Token 数 = 预算金额 ÷ 综合单价
测算参数来源:
以下参数源自平台 2026 年运营经验数据,反映了实际业务场景下的典型调用特征,并非用户自定义: