Token Plan 企业版专业套餐是专为团队和企业级用户打造的大模型 API 月度预付费方案。该套餐支持灵活设定月度预算(通过购买积分池,模型调用时依据各模型 Token 定价从池中实时扣除,不同模型费率各异)及多 Key 配额分配,非常适合利用积分制对多模型调用额度进行统一管理的团队与企业场景。
快速入门
方案详情
核心概念
套餐 → 积分池 → API Key,这三者的层级关系说明如下:
|
层级
|
说明
|
|
账号
|
单个腾讯云账号支持购买多个独立套餐,每个套餐拥有独立的积分池、API Key 配额及到期时间,各套餐之间互不干扰。适用于按部门、项目或业务线进行独立的采购与管理。
|
|
套餐(积分池)
|
每个套餐对应一个独立的积分池,池子大小由购买时的月预算决定(100 积分售价 1 元)。该积分池是套餐下所有 API Key 共享的总额度,调用任何模型均从同一个池内实时扣减。
注:
积分不具备货币属性,不具有法定货币流通性质,严禁在账号间交易,亦不可用于支付、购买实物产品或兑换腾讯其他产品/服务。积分一经售出或发放,不支持折现或退还。
|
|
API Key
|
每个套餐下可创建多个 API Key,数量上限与套餐积分数值成正比(每满 1 万积分可创建 1 个 Key)。每个 Key 可单独配置可用模型、独占配额、配额上限及调用速率(TPM),从而实现团队内部的精细化分发与管控。
|
积分机制
积分换算:100 积分对应人民币 1 元。
积分共享:同一套餐下的所有 API Key 共用该套餐的积分池,按实际调用实时扣除。
配额管控:支持为每个 Key 设置独占配额(仅限该 Key 使用的专属积分)和配额上限(该 Key 可使用的积分总量,包含独占 + 共享部分),未设置独占配额的部分归入共享池,各 Key 依调用顺序先到先得。
扣费规则:调用模型时,按各模型的 Token 单价从积分池中实时扣除,不同模型单价各异,具体详情请参阅 模型与积分换算说明。
套餐规格
|
配置项
|
说明
|
|
月预算
|
|
|
购买时长
|
1 ~ 12 个月
|
|
可用模型
|
Auto 智能路由、GLM-5、GLM-5.1、GLM-5-Turbo、Kimi-K2.5、Kimi-K2.6、MiniMax-M2.5、MiniMax-M2.7、DeepSeek-V4-Flash、DeepSeek-V4-Pro(持续扩充中)
注:
当前所支持的模型暂不包含图片、视频等模态能力。
|
积分抵扣规则
模型与积分换算说明
说明:
输入价(命中缓存):即命中上下文缓存的输入 Token 价格。
输入价(未命中缓存):即未命中缓存的输入 Token 价格。
Auto 智能路由:系统根据请求内容自动甄选模型进行响应,并按固定费率计费。
实际扣除积分 = Token 消耗量 × 对应单价 。
|
模型
|
阶梯条件
|
命中缓存输入价
(积分/百万 tokens)
|
未命中缓存输入价
(积分/百万 tokens)
|
输出价
(积分/百万 tokens)
|
|
GLM-5
|
输入 [0, 32k)
|
100
|
400
|
1800
|
|
|
输入 32k+
|
150
|
600
|
2200
|
|
GLM-5.1
|
输入 [0, 32k)
|
130
|
600
|
2400
|
|
|
输入 [32k+)
|
200
|
800
|
2800
|
|
GLM-5-Turbo
|
输入 [0, 32k)
|
120
|
500
|
2200
|
|
|
输入 [32k+)
|
180
|
700
|
2600
|
|
Kimi-K2.5
|
-
|
70
|
400
|
2100
|
|
Kimi-K2.6
|
-
|
110
|
650
|
2700
|
|
MiniMax-M2.5
|
-
|
21
|
210
|
840
|
|
MiniMax-M2.7
|
-
|
42
|
210
|
840
|
|
DeepSeek-V4-Flash
|
-
|
20
|
100
|
200
|
|
DeepSeek-V4-Pro
|
-
|
100
|
1200
|
2400
|
|
Auto 智能路由
|
-
|
50
|
324
|
1596
|
Token 数量测算说明
各模型 Token 单价不一(区分缓存命中输入、未命中缓存输入、输出三种计费方式),为帮助用户直观评估“特定预算能购买多少 Token”,平台提供基于 2026 年运营经验数据的综合单价测算。
注意:
本测算结果仅供企业预算规划参考,不代表实际可用的 Token 数量。
综合单价计算中已嵌入各模型历史缓存命中率,若页面展示价格存在四舍五入,可能导致测算结果产生差异。
实际可用 Token 数量受用户真实业务调用复杂度直接影响,最终以真实调用时的缓存命中率、输入输出 Token 比例、模型混合使用情况及实时定价规则为准,请留意积分消耗情况。
|
模型
|
综合单价预估
(积分/百万 tokens)
|
50 万积分可抵扣
Token 数预估(亿 tokens)
|
100 万积分可抵扣
Token 数预估(亿 tokens)
|
|
GLM-5
|
约 440
|
约 11.36
|
约 22.73
|
|
GLM-5.1
|
约 380
|
约 13.16
|
约 26.32
|
|
GLM-5-Turbo
|
约 340
|
约 14.71
|
约 29.41
|
|
Kimi-K2.5
|
约 230
|
约 21.74
|
约 43.48
|
|
Kimi-K2.6
|
约 280
|
约 17.86
|
约 35.71
|
|
MiniMax-M2.5
|
约 110
|
约 45.45
|
约 90.91
|
|
MiniMax-M2.7
|
约 100
|
约 50.00
|
约 100.00
|
|
DeepSeek-V4-Flash
|
约 70
|
约 71.43
|
约 142.86
|
|
DeepSeek-V4-Pro
|
约 930
|
约 5.38
|
约 10.75
|
|
Auto 智能路由
|
约 190
|
约 26.32
|
约 52.63
|
综合单价公式:
综合单价 = (缓存命中率 × 命中缓存输入价 + (1 - 缓存命中率)× 未命中缓存输入价)× 输入占比 + 输出价 × 输出占比 。如模型存在阶梯定价(例如 GLM-5 按上下文长度分档),建议优先按最长上下文档位进行预算评估,以获得更保守的预估结果。
可购买 Token 数 = 预算金额 ÷ 综合单价
测算参数来源:
以下参数取自平台 2026 年运营经验值,反映了实际业务场景下的典型调用特征,并非用户自定义:
|
|