💡 输入与输出 Token 的差异
AI 服务商通常对 输入 tokens(包含提示词、上下文信息、指令说明)和 输出 tokens(即模型生成的回复内容)采取分开计费的模式。输出 tokens 的单价往往要高出 2 到 8 倍,这是因为生成过程需要消耗更多的算力资源。
🏷️ 模型分级
旗舰级 模型能提供最顶尖的生成质量。推理型 模型擅长处理逻辑复杂的难题。经济型 模型则在成本与效果之间取得了良好的平衡。建议根据你的具体质量要求及预算情况来灵活选择。
📊 千次请求成本预估
表格中的“~Cost/1K req”栏目预估了调用 1,000 次 API 的大致开销。该预设基于每次请求包含 750 个输入 tokens 和 250 个输出 tokens 的平均值。请注意,你最终的实际账单会根据提示词长度及回复长度的不同而产生波动。
💰 省钱技巧
利用 提示词缓存(Prompt Caching)功能来削减重复输入带来的成本。对于非实时任务,可以尝试使用 批量 API(Batch APIs),这通常能享受半价优惠(最高 50% off)。开发初期优先使用便宜的模型,只有在确有质量刚需时再切换到高端模型。