新闻

TokenHub 企业版:大模型服务平台的 Token Plan 专享方案

新闻 2026-05-14 0 次浏览
Token Plan 企业版专业套餐是专为企业和团队打造的大模型 API 预付费方案,采用按月结算模式。该套餐支持自定义月度预算(购买积分额度池,在调用模型时,依据各模型的 Token 单价从池中实时扣除,不同模型费率各异)及多 Key 配额管理功能,非常适合团队和企业利用积分体系统一调配多模型调用额度。

快速入门

若您已熟悉 Token Plan 企业版专业套餐,可直接参考
快速入门指南 进行操作。

套餐详情

核心概念

套餐 → 积分池 → API Key,三者之间的关系如下:
层级
描述
账号
单个腾讯云账号支持购买多个独立的套餐,每个套餐均配备独立的积分池、API Key 配额及有效期,各套餐之间互不干扰。非常适合按照部门、具体项目或业务条线分别进行采购和管理。
套餐(积分池)
每一个套餐对应一个独立的积分池,池子的大小取决于购买时设定的月预算(100 积分价值 1 元)。积分池是该套餐下所有 API Key 共享的总额度,无论调用哪个模型,都会从同一个积分池中实时扣减。
注意:
积分不具备货币属性,不具有法定货币的流通功能,严禁在账号之间交易,也不能用于支付、购买实物商品或兑换腾讯的其他产品和服务。积分一经售出或发放,不支持折现或退款。
API Key
每个套餐下允许创建多个 API Key,数量上限与套餐积分配比成正比(每拥有 1 万积分可创建 1 个 Key)。每个 Key 均可独立配置可用模型、专属配额、用量上限以及调用速率(TPM),从而实现团队内部精细化的分发和管控。

积分规则

积分换算:100 积分兑换价格为 1 元。
积分共享:同一套餐名下的所有 API Key 共用该套餐的积分池,依据实际调用量进行实时扣减。
配额管理:支持为每个 Key 设置独占配额(仅限该 Key 使用的专属积分)和配额上限(该 Key 可使用的积分总额,包含独占与共享部分),未设置独占配额的部分归入共享池,各 Key 遵循先到先得原则。
扣费逻辑:调用模型时,系统按照各模型的 Token 单价从积分池中实时扣除,不同模型单价各异,具体详情请查阅 模型与积分换算说明

套餐规格

配置项
描述
月预算
1,000 元/月 ~ 20,000 元/月,步长为 1,000元(具体数值请以控制台显示为准)。若需更高额度,请联系销售顾问或 提交工单 申请。
购买时长
1 ~ 12 个月
可用模型
Auto 智能路由、GLM-5GLM-5.1GLM-5-TurboKimi-K2.5、Kimi-K2.6MiniMax-M2.5、MiniMax-M2.7、DeepSeek-V4-Flash、DeepSeek-V4-Pro(持续更新中)
提示:
当前模型暂不支持图片、视频等多模态能力。

积分抵扣细则

模型与积分换算说明

说明:
输入价(命中缓存):指命中上下文缓存的输入 Token 价格。
输入价(未命中缓存):指未命中缓存的输入 Token 价格。
Auto 智能路由:系统依据请求内容自动甄选模型进行响应,并按照固定价格计费。
实际扣减积分 = Token 消耗量 × 对应单价 。
模型
阶梯条件
命中缓存输入价
(积分/百万 tokens)
未命中缓存输入价
(积分/百万 tokens)
输出价
(积分/百万 tokens)
GLM-5
输入 [0, 32k)
100
400
1800

输入 32k+
150
600
2200
GLM-5.1
输入 [0, 32k)
130
600
2400

输入 [32k+)
200
800
2800
GLM-5-Turbo
输入 [0, 32k)
120
500
2200

输入 [32k+)
180
700
2600
Kimi-K2.5
-
70
400
2100
Kimi-K2.6
-
110
650
2700
MiniMax-M2.5
-
21
210
840
MiniMax-M2.7
-
42
210
840
DeepSeek-V4-Flash
-
20
100
200
DeepSeek-V4-Pro
-
100
1200
2400
Auto 智能路由
-
50
324
1596

Token 数量测算说明

鉴于不同模型的 Token 单价各不相同(区分缓存命中输入、未命中缓存输入、输出三种计费模式),为便于用户直观评估“特定预算能兑换多少 Token”,平台提供了基于 2026 年运营经验数据的综合单价测算。
注意:
本测算结果仅作为企业预算规划的参考依据,并不代表实际可使用的 Token 数量。
综合单价的计算过程已纳入各模型历史缓存命中率,若页面展示价格存在四舍五入情况,可能会导致测算结果产生细微差异。
实际可使用的 Token 数量受用户真实业务场景的调用复杂度直接影响,最终以真实调用时的实际缓存命中率、输入输出 Token 比例、模型混合使用情况及实时定价规则为准,请密切关注积分消耗情况。
模型
综合单价预估
(积分/百万 tokens)
50 万积分可抵扣
Token 数预估(亿 tokens)
100 万积分可抵扣
Token 数预估(亿 tokens)
GLM-5
约 440
约 11.36
约 22.73
GLM-5.1
约 380
约 13.16
约 26.32
GLM-5-Turbo
约 340
约 14.71
约 29.41
Kimi-K2.5
约 230
约 21.74
约 43.48
Kimi-K2.6
约 280
约 17.86
约 35.71
MiniMax-M2.5
约 110
约 45.45
约 90.91
MiniMax-M2.7
约 100
约 50.00
约 100.00
DeepSeek-V4-Flash
约 70
约 71.43
约 142.86
DeepSeek-V4-Pro
约 930
约 5.38
约 10.75
Auto 智能路由
约 190
约 26.32
约 52.63
综合单价公式:
综合单价 = (缓存命中率 × 命中缓存输入价 + (1 - 缓存命中率)× 未命中缓存输入价)× 输入占比 + 输出价 × 输出占比 ,若模型存在阶梯定价(例如 GLM-5 按上下文长度分档),建议优先按最长上下文档位进行预算评估,以获取更为保守的预估结果。
可购买 Token 数 = 预算金额 ÷ 综合单价
测算参数来源:
以下参数源自平台 2026 年运营经验数据,反映了实际业务场景下的典型调用特征,并非用户自定义:
点击查看文章原文
上一篇
算力Token套餐不断涌现 推动AI商业化加速落地
下一篇
千帆大模型 - Token 资源包与企业级 Agent 开发平台
返回列表