Token Plan 企业专业版是专为企业及团队打造的大模型 API 预付费方案,采用月度付费模式。该方案支持自定义月度预算(即购置积分池,在实际调用模型时,依据各模型的 Token 单价从池中实时划扣),并允许多 Key 配额分配,非常适合团队与企业级场景通过积分制对多模型调用额度进行统一统筹管理。
快速入门
方案详情
核心概念
方案 → 积分池 → API Key
,三者关系阐述如下:
|
层级
|
描述
|
|
账号
|
单个腾讯云账号支持开通多个独立方案,每个方案均拥有独立的积分池、API Key 配额及有效期,彼此互不干扰。这非常适合按照部门、具体项目或业务条线进行独立的采购与管理。
|
|
方案(积分池)
|
每个方案对应一个专属的积分池,池子容量取决于购买时设定的月预算(每 100 积分售价 1 元)。积分池是该方案下所有 API Key 共享的总额度,无论调用哪个模型,都从同一池子中实时扣除。
注:
积分不具备货币属性,非法定货币,严禁账号间交易,亦不可用于支付、购买实物或兑换腾讯其他产品服务。积分一经售出或发放,概不支持折现或退款。
|
|
API Key
|
每个方案下支持生成多个 API Key,其数量上限与方案积分成正比(每 1 万积分可创建 1 个 Key)。每个 Key 均可独立配置可用模型、独享配额、总额度上限及调用速率(TPM),从而实现团队内部精细化的分发与管控。
|
积分机制
积分换算:每 100 积分对应人民币 1 元。
共享模式:同一方案下的所有 API Key 共用该方案的积分池,按实际调用量实时划扣。
配额控制:支持为每个 Key 设定独享配额(仅限该 Key 使用的积分)与上限(该 Key 最大可消耗的积分总量,含独享+共享部分),未设独享配额的部分归入共享池,各 Key 依先到先得原则使用。
扣除逻辑:调用模型时,系统依据各模型的 Token 单价从积分池中实时扣费,不同模型单价各异,详情请参阅
模型积分换算说明
。
方案规格
|
配置项
|
说明
|
|
月度预算
|
|
|
购买时长
|
1 ~ 12 个月
|
|
可用模型
|
Auto 智能路由、GLM-5、GLM-5.1、GLM-5-Turbo、Kimi-K2.5、Kimi-K2.6、MiniMax-M2.5、MiniMax-M2.7、DeepSeek-V4-Flash、DeepSeek-V4-Pro(持续增加中)
注:
目前上述模型暂不支持图片、视频等多模态能力。
|
积分抵扣规则
模型与积分换算说明
注:
输入价(命中缓存):即命中上下文缓存后的输入 Token 价格。
输入价(未命中缓存):即未命中缓存的输入 Token 价格。
Auto 智能路由:系统依据请求内容自动甄选模型进行响应,并按固定费率计费。
实际扣除积分 = Token 消耗量 × 对应单价。
|
模型
|
阶梯条件
|
命中缓存输入价
(积分/百万 tokens)
|
未命中缓存输入价
(积分/百万 tokens)
|
输出价
(积分/百万 tokens)
|
|
GLM-5
|
输入 [0, 32k)
|
100
|
400
|
1800
|
|
|
输入 32k+
|
150
|
600
|
2200
|
|
GLM-5.1
|
输入 [0, 32k)
|
130
|
600
|
2400
|
|
|
输入 [32k+)
|
200
|
800
|
2800
|
|
GLM-5-Turbo
|
输入 [0, 32k)
|
120
|
500
|
2200
|
|
|
输入 [32k+)
|
180
|
700
|
2600
|
|
Kimi-K2.5
|
-
|
70
|
400
|
2100
|
|
Kimi-K2.6
|
-
|
110
|
650
|
2700
|
|
MiniMax-M2.5
|
-
|
21
|
210
|
840
|
|
MiniMax-M2.7
|
-
|
42
|
210
|
840
|
|
DeepSeek-V4-Flash
|
-
|
20
|
100
|
200
|
|
DeepSeek-V4-Pro
|
-
|
100
|
1200
|
2400
|
|
Auto 智能路由
|
-
|
50
|
324
|
1596
|
Token 数量测算说明
鉴于不同模型的 Token 单价各异(区分缓存命中输入、未命中缓存输入及输出三种计价模式),为协助用户直观评估“
特定预算可购入多少 Token
”,平台依据
2026 年运营经验数据
提供了综合单价测算功能。
注意:
本测算结果仅供企业预算规划参考,
不代表实际可使用的 Token 数量。
综合单价计算已嵌入各模型历史缓存命中率,页面展示价格若经四舍五入处理,可能导致测算产生细微差异。
实际可用 Token 数受用户真实业务场景的调用复杂度直接影响,最终以真实调用时的实际缓存命中率、输入输出 Token 比例、模型混合使用情况及实时定价规则为准,请留意积分消耗情况。
|
模型
|
综合单价预估
(积分/百万 tokens)
|
50 万积分可抵扣
Token 数预估(亿 tokens)
|
100 万积分可抵扣
Token 数预估(亿 tokens)
|
|
GLM-5
|
约 440
|
约 11.36
|
约 22.73
|
|
GLM-5.1
|
约 380
|
约 13.16
|
约 26.32
|
|
GLM-5-Turbo
|
约 340
|
约 14.71
|
约 29.41
|
|
Kimi-K2.5
|
约 230
|
约 21.74
|
约 43.48
|
|
Kimi-K2.6
|
约 280
|
约 17.86
|
约 35.71
|
|
MiniMax-M2.5
|
约 110
|
约 45.45
|
约 90.91
|
|
MiniMax-M2.7
|
约 100
|
约 50.00
|
约 100.00
|
|
DeepSeek-V4-Flash
|
约 70
|
约 71.43
|
约 142.86
|
|
DeepSeek-V4-Pro
|
约 930
|
约 5.38
|
约 10.75
|
|
Auto 智能路由
|
约 190
|
约 26.32
|
约 52.63
|
综合单价公式:
综合单价 = (缓存命中率 × 命中缓存输入价 + (1 - 缓存命中率)× 未命中缓存输入价)× 输入占比 + 输出价 × 输出占比。若模型存在阶梯定价(如 GLM-5 按上下文长度分档),建议优先按最长上下文档位进行预算评估,以获取更保守的预估结果。
可购 Token 数 = 预算金额 ÷ 综合单价
测算参数来源:
以下参数源自平台 2026 年运营经验数据,反映了实际业务场景下的典型调用特征,非用户自定义:
|
参数
|
取值
|
说明
|
|
缓存命中率
|
70%
|
指输入 Token 中命中缓存的比例。
|
|
输入占比
|
85%
|
指总 Token 中输入 Token 的占比。
|
|
输出占比
|
15%
|
指总 Token 中输出 Token 的占比。
|