TokenHub 企业版：大模型服务平台的 Token Plan 专享方案

Token Plan 企业版专业套餐是专为企业和团队打造的大模型 API 预付费方案，采用按月结算模式。该套餐支持自定义月度预算（购买积分额度池，在调用模型时，依据各模型的 Token 单价从池中实时扣除，不同模型费率各异）及多 Key 配额管理功能，非常适合团队和企业利用积分体系统一调配多模型调用额度。

快速入门

若您已熟悉 Token Plan 企业版专业套餐，可直接参考

快速入门指南进行操作。

套餐详情

核心概念

套餐 → 积分池 → API Key，三者之间的关系如下：

层级	描述
账号	单个腾讯云账号支持购买多个独立的套餐，每个套餐均配备独立的积分池、API Key 配额及有效期，各套餐之间互不干扰。非常适合按照部门、具体项目或业务条线分别进行采购和管理。
套餐（积分池）	每一个套餐对应一个独立的积分池，池子的大小取决于购买时设定的月预算（100 积分价值 1 元）。积分池是该套餐下所有 API Key 共享的总额度，无论调用哪个模型，都会从同一个积分池中实时扣减。注意：积分不具备货币属性，不具有法定货币的流通功能，严禁在账号之间交易，也不能用于支付、购买实物商品或兑换腾讯的其他产品和服务。积分一经售出或发放，不支持折现或退款。
API Key	每个套餐下允许创建多个 API Key，数量上限与套餐积分配比成正比（每拥有 1 万积分可创建 1 个 Key）。每个 Key 均可独立配置可用模型、专属配额、用量上限以及调用速率（TPM），从而实现团队内部精细化的分发和管控。

积分规则

积分换算：100 积分兑换价格为 1 元。

积分共享：同一套餐名下的所有 API Key 共用该套餐的积分池，依据实际调用量进行实时扣减。

配额管理：支持为每个 Key 设置独占配额（仅限该 Key 使用的专属积分）和配额上限（该 Key 可使用的积分总额，包含独占与共享部分），未设置独占配额的部分归入共享池，各 Key 遵循先到先得原则。

扣费逻辑：调用模型时，系统按照各模型的 Token 单价从积分池中实时扣除，不同模型单价各异，具体详情请查阅模型与积分换算说明。

套餐规格

配置项	描述
月预算	1,000 元/月 ~ 20,000 元/月，步长为 1,000元（具体数值请以控制台显示为准）。若需更高额度，请联系销售顾问或提交工单申请。
购买时长	1 ~ 12 个月
可用模型	Auto 智能路由、GLM-5、GLM-5.1、GLM-5-Turbo、Kimi-K2.5、Kimi-K2.6、MiniMax-M2.5、MiniMax-M2.7、DeepSeek-V4-Flash、DeepSeek-V4-Pro（持续更新中）提示：当前模型暂不支持图片、视频等多模态能力。

积分抵扣细则

模型与积分换算说明

说明：

输入价（命中缓存）：指命中上下文缓存的输入 Token 价格。

输入价（未命中缓存）：指未命中缓存的输入 Token 价格。

Auto 智能路由：系统依据请求内容自动甄选模型进行响应，并按照固定价格计费。

实际扣减积分 = Token 消耗量 × 对应单价。

模型	阶梯条件	命中缓存输入价（积分/百万 tokens）	未命中缓存输入价（积分/百万 tokens）	输出价（积分/百万 tokens）
GLM-5	输入 [0, 32k)	100	400	1800
	输入 32k+	150	600	2200
GLM-5.1	输入 [0, 32k)	130	600	2400
	输入 [32k+)	200	800	2800
GLM-5-Turbo	输入 [0, 32k)	120	500	2200
	输入 [32k+)	180	700	2600
Kimi-K2.5	-	70	400	2100
Kimi-K2.6	-	110	650	2700
MiniMax-M2.5	-	21	210	840
MiniMax-M2.7	-	42	210	840
DeepSeek-V4-Flash	-	20	100	200
DeepSeek-V4-Pro	-	100	1200	2400
Auto 智能路由	-	50	324	1596

Token 数量测算说明

鉴于不同模型的 Token 单价各不相同（区分缓存命中输入、未命中缓存输入、输出三种计费模式），为便于用户直观评估“特定预算能兑换多少 Token”，平台提供了基于 2026 年运营经验数据的综合单价测算。

注意：

本测算结果仅作为企业预算规划的参考依据，并不代表实际可使用的 Token 数量。

综合单价的计算过程已纳入各模型历史缓存命中率，若页面展示价格存在四舍五入情况，可能会导致测算结果产生细微差异。

实际可使用的 Token 数量受用户真实业务场景的调用复杂度直接影响，最终以真实调用时的实际缓存命中率、输入输出 Token 比例、模型混合使用情况及实时定价规则为准，请密切关注积分消耗情况。

模型	综合单价预估（积分/百万 tokens）	50 万积分可抵扣 Token 数预估（亿 tokens）	100 万积分可抵扣 Token 数预估（亿 tokens）
GLM-5	约 440	约 11.36	约 22.73
GLM-5.1	约 380	约 13.16	约 26.32
GLM-5-Turbo	约 340	约 14.71	约 29.41
Kimi-K2.5	约 230	约 21.74	约 43.48
Kimi-K2.6	约 280	约 17.86	约 35.71
MiniMax-M2.5	约 110	约 45.45	约 90.91
MiniMax-M2.7	约 100	约 50.00	约 100.00
DeepSeek-V4-Flash	约 70	约 71.43	约 142.86
DeepSeek-V4-Pro	约 930	约 5.38	约 10.75
Auto 智能路由	约 190	约 26.32	约 52.63

综合单价公式：

综合单价 = （缓存命中率 × 命中缓存输入价 + （1 - 缓存命中率）× 未命中缓存输入价）× 输入占比 + 输出价 × 输出占比，若模型存在阶梯定价（例如 GLM-5 按上下文长度分档），建议优先按最长上下文档位进行预算评估，以获取更为保守的预估结果。

可购买 Token 数 = 预算金额 ÷ 综合单价

测算参数来源：

以下参数源自平台 2026 年运营经验数据，反映了实际业务场景下的典型调用特征，并非用户自定义：

点击查看文章原文

返回列表