胜算云Tokens Plan 套餐细则

Token Plan 是胜算云推出的 AI 模型调用包月订阅服务。用户按月付费，即可在额度内不限次数调用多种主流大模型，告别按量计费焦虑，适合高频AI模型切换场景的开发者和工具用户。

本文档将帮助您全面了解 Token Plan 的套餐内容、计费规则、支持模型、接入工具及活动规则。

1. 套餐概览

Token Plan 提供 3 种订阅套餐，满足从轻度尝鲜到高强度开发的不同场景需求。

1.1 套餐对比

对比项	Lite	Pro（推荐）	Enterprise（(后续上线，可联系Daming预约)）
月付价	99 模力	699 模力	2,999 模力
年付价（暂未开放）	999 模力	6,999 模力	29,999模力
月额度（Credits）	15 万	120 万	200 万
周限额	6.75 万	54 万	77.5 万
RPM（每分钟请求数）	600	1,800	12,000
API Key 数量	2 个	5 个	不限
并发数	2	5	不限

模力说明：1 模力 = 1 元人民币。您可使用平台模力余额支付，余额不足部分可通过微信 / 支付宝补充。

1.2 套餐选择建议

Lite：适合轻度使用、尝鲜体验的个人开发者，日均调用量较低的场景。

Pro（推荐）：适合中高频开发者，日常使用 AI Coding 工具或运行智能体的主力套餐。

Enterprise：适合重度使用、团队级或企业级高并发调用场景。

2. 支持模型

Token Plan 支持调用 50+ 款主流大模型，覆盖国内外顶级模型厂商，三档套餐均可使用全部模型。可用在cline、Claude code、Codex、openclaw、opencode等工具，需要选择openai兼容格式，按以下base url和模型ID填入使用。

2.1 模型列表

Token plan base url

https://router.shengsuanyun.com/api/cp/v1

厂商前缀	原始模型名称	适配后的标准格式
anthropic	Claude Haiku 4.5	`anthropic/claude-haiku-4.5`
anthropic	Claude Haiku 4.5 Thinking	`anthropic/claude-haiku-4.5:thinking`
anthropic	Claude Opus 4.5	`anthropic/claude-opus-4.5`
anthropic	Claude Opus 4.6	`anthropic/claude-opus-4.6`
anthropic	Claude Sonnet 4	`anthropic/claude-sonnet-4`
anthropic	Claude Sonnet 4 ( Thinking )	`anthropic/claude-sonnet-4:thinking`
anthropic	Claude Sonnet 4.5	`anthropic/claude-sonnet-4.5`
anthropic	Claude Sonnet 4.5 Thinking	`anthropic/claude-sonnet-4.5:thinking`
anthropic	Claude Sonnet 4.6	`anthropic/claude-sonnet-4.6`
anthropic	Claude-3.7-sonnet	`anthropic/claude-3.7-sonnet`
bigmodel	GLM-4.5	`bigmodel/glm-4.5`
bigmodel	GLM-4.6	`bigmodel/glm-4.6`
bigmodel	GLM-4.7	`bigmodel/glm-4.7`
bigmodel	GLM-5	`bigmodel/glm-5`
bytedance	Doubao-Seed-1.8	`bytedance/doubao-seed-1.8`
deepseek	DeepSeek V3.1	`deepseek/deepseek-v3.1`
deepseek	Deepseek V3.2	`deepseek/deepseek-v3.2`
deepseek	DeepSeek V3.2 Thinking	`deepseek/deepseek-v3.2-think`
deepseek	DeepSeek-R1-0528	`deepseek/deepseek-r1-0528`
deepseek	DeepSeek-V3:latest	`deepseek/deepseek-v3`
google	Gemini 2.5 Flash	`google/gemini-2.5-flash`
google	Gemini 2.5 Pro	`google/gemini-2.5-pro`
google	Gemini 3 Flash Preview	`google/gemini-3-flash`
google	Gemini 3.1 Flash Image Preview	`google/gemini-3.1-flash-image-preview`
google	Gemini 3.1 Flash Lite Preview	`google/gemini-3.1-flash-lite-preview`
google	Gemini 3.1 Pro Preview	`google/gemini-3.1-pro-preview`
kuaishou	KAT-Coder-Air-V1	`streamlake/kat-coder-air-v1`
kuaishou	KAT-Coder-Exp-72B-1010	`streamlake/kat-coder-exp-72b-1010`
minimax	MiniMax M2	`minimax/minimax-m2`
minimax	MiniMax M2.1	`minimax/minimax-m2.1`
minimax	MiniMax M2.1 lightning	`minimax/minimax-m2.1-lightning`
minimax	MiniMax M2.5	`minimax/minimax-m2.5`
moonshot	Kimi K2.5	`moonshot/kimi-k2.5`
openai	GPT-4.1-nano	`openai/gpt-4.1-nano`
openai	GPT-5	`openai/gpt-5`
openai	GPT-5-Nano	`openai/gpt-5-nano`
openai	GPT-5.1	`openai/gpt-5.1`
openai	GPT-5.2	`openai/gpt-5.2`
qwen	Qwen-Plus	`ali/qwen-plus-latest`
qwen	Qwen3-235B-A22B-Instruct-2507	`ali/qwen3-235b-a22b-instruct-2507`
qwen	Qwen3-Coder-480B-A35B-Instruct	`ali/qwen3-coder-480b-a35b-instruct`
qwen	Qwen3-Coder-Plus	`ali/qwen3-coder-plus`
qwen	Qwen3-Max	`ali/qwen3-max`
qwen	Qwen3-Max-2026-01-23	`ali/qwen3-max-2026-01-23`
qwen	Qwen3-Max-Preview	`ali/qwen3-max-preview`
qwen	Qwen3.5-397B-A17B	`ali/qwen3.5-397b-a17b`
qwen	Qwen3.5-Plus	`ali/qwen3.5-plus`
x-ai	Grok 4 Fast	`x-ai/grok-4-fast`

什么是「消耗速率」？

Token Plan 采用 Credits 作为统一计量单位，不同模型消耗 Credits 的速率不同。模型倍率决定Credits消耗的放大系数，倍率越高消耗越大。平台将模型分为多档倍率等级，经济型模型倍率较低，适合大批量低成本任务；标准型模型倍率适中，适合日常使用；高端模型倍率较高，提供更强的推理和创作能力。选择模型时需平衡任务需求与成本预算，高倍率模型能力更强但消耗更多Credits，建议根据实际场景灵活搭配使用。

3. 计费规则

3.1 计费单位

Credits：Token Plan 的统一用量计量单位。调用模型时，系统根据该模型的消耗速率（倍率）扣除对应数量的 Credits。

模力：Token Plan 的计价货币单位（1 模力 = 1 元人民币），用于套餐购买和续费。

3.2 套餐有效

套餐按 订阅月 计算，从购买当天起至下个月同一天 23:59:59。

如果目标月没有对应日期，则取当月最后一天。

举例：1 月 4 日购买 → 2 月 4 日 23:59:59 到期；1 月 31 日购买 → 2 月 28 日 23:59:59 到期（非闰年）。

3.3 三层限额机制

Token Plan 通过三层限额控制用量节奏，保障服务稳定性：

限额类型	说明	恢复方式
5 小时滑动窗口限额	任意连续 5 小时内的用量不能超过上限	随时间自动恢复（早期用量"滑出"窗口后释放）
周限额	每周总用量不能超过上限	每周一 00:00 自动重置
月限额	整个订阅月的 Credits 总上限	新的订阅月开始时重置

额度耗尽不额外扣费：当任一层级额度用完后，系统会直接拒绝请求（返回 HTTP 429 错误码），不会额外扣除您的模力余额。您可以等待对应周期自动恢复，或升级到更高套餐扩容额度池。

3.4 续费规则

未到期续费：新周期从当前到期时间往后顺延，不浪费剩余时间。

已到期续费：新周期从购买时刻重新开始计算。

支持月付和年付两种计费周期，年付享受更大折扣。

3.6 退款

首版支持 人工退款，请联系客服协商处理。退款金额会按比例扣除已使用 Credits 对应的费用。

4. 接入工具

Token Plan 兼容 OpenAI API 格式，支持所有主流 AI 编程工具和智能体平台。购买即开通，无需额外创建接入点。

4.1 支持的智能体平台示例（接口合适都可接入）

工具名称	说明
OpenClaw	胜算云自研的开源智能体平台，Token Plan 的最佳搭配。在 OpenClaw 中使用 Token Plan 的 API Key，即可享受包月额度调用各类大模型。
Coze（扣子）	字节跳动推出的 AI 应用开发平台，支持通过自定义 API 接入 Token Plan。
Dify	开源的大语言模型应用开发平台，在模型供应商设置中添加 Token Plan 的 API Base URL 和 Key 即可。
GPTs	OpenAI 自定义 GPTs，支持通过 Actions 接入 Token Plan 提供的模型服务。

4.2 支持的 AI Coding 工具示例（接口合适都可接入）

工具名称	说明
Cursor	AI 代码编辑器，在 Settings → Models 中配置 Token Plan 的 API Base URL 和 API Key，选择对应模型即可使用。
Cline	VS Code 插件，支持 OpenAI 兼容的 API 接入，在设置中配置 Token Plan 信息即可。
Claude Code	Anthropic 官方 CLI 工具，通过环境变量配置 Token Plan 的 API 端点和密钥。
Roo Code	AI 编程助手，支持 OpenAI 格式 API，直接配置 Token Plan 信息即可接入。
Kilo Code	AI 编程工具，在工具设置中添加 Token Plan 的 API 配置。
Codex CLI	OpenAI 命令行编程工具，通过环境变量设置 API Base URL 和 Key 使用 Token Plan。

4.3 快速接入步骤

购买套餐：在 Token Plan 产品页选择合适的套餐并完成支付。

获取 API Key：进入用户控制台，点击「新建密钥」，填写 Key 名称，创建后 立即复制保存（明文仅显示一次）。

配置工具：在您使用的 AI 工具中，将 API Base URL 设置为胜算云提供的接入地址，将 API Key 粘贴到对应位置。

选择模型：在工具中选择 Token Plan 支持的模型名称（如 deepseek-v3.2、claude-sonnet-4 等），即可开始调用。

API Key 管理须知

API Key 明文 只在创建时显示一次，请务必及时复制保存。

同一账号下的多个 Key 共享同一额度池，不单独计量。

您可以为单个 Key 设置 RPM（每分钟请求数）和 TPM（每分钟 Token 数）上限，但不支持 Key 级额度限制。

5. 活动规则

5.1 限时折扣

所有套餐均提供 限时折扣价，月付和年付均享优惠（详见套餐对比表中的划线价）。

年付更省：敬请期待，年付即将上线

5.2 购买规则

同一账号同一时间只能有 一个生效中的套餐。

当月不支持重复购买同等级套餐，如需更多额度请升级到更高档位。

支付方式：模力余额 / 微信扫码 / 支付宝扫码，支持模力余额优先抵扣。

支付成功后套餐 立即生效，无需等待审核。

5.3 计费周期说明

周期	说明
月付	按月支付，有效期为一个订阅月（购买日 → 下月同日 23:59:59）。
年付	一次性支付 12 个月费用，享受年付折扣价。有效期 12 个订阅月。

6. 服务协议

6.1 服务范围

Token Plan 为胜算云提供的 AI 模型调用包月订阅服务，用户在额度范围内可通过 API 调用平台支持的大语言模型。

本服务仅提供模型推理接口，不包含模型训练、微调等服务。

6.2 额度与计费

套餐以 Credits 计量模型调用消耗，不同模型的消耗倍率不同。

额度用尽后系统自动停止服务，不会产生额外费用，不会扣除账户模力余额。

未使用完的额度 不支持结转至下一周期，到期自动清零。

6.3 使用规范

用户应合理使用套餐额度，不得转售、共享 API Key 给第三方。

禁止利用本服务生成违法违规内容。

平台有权对异常使用行为（如疑似转售、恶意高频调用等）采取暂停或封禁措施。

6.4 退款政策

首版仅支持七天内因平台问题原因退款。

退款金额 = 支付金额 − 已使用额度对应的费用。

全额退款后套餐立即失效；部分退款不影响当前订阅状态。

6.5 免责声明

因模型厂商上游故障导致的服务中断，胜算云将尽力恢复但不承担赔偿责任。

平台保留根据市场情况调整套餐价格、模型列表和额度规则的权利，调整前将提前通知用户。

7. 常见问题（FAQ）

Q1: Credits是什么？如何衡量消耗？

A: Credits是Token Plan的统一计价单位，一套额度可通用于所有支持的模型。消耗计算公式为：Credits消耗 = API返回Token数 × 模型倍率。不同模型倍率不同，高能力模型倍率较高，经济型模型倍率较低。相同Token输出量下，选择低倍率模型可大幅节省Credits消耗,用户可根据使用需求灵活选择。

Q2: 额度用完了怎么办？

A: 额度耗尽时API将返回QUOTA_EXCEEDED错误，拒绝服务。用户可选择五种应对方案：等待下一个计费周期自动重置（适合非紧急任务）；升级到更高套餐立即获得更多额度（立即生效）；购买临时额度补充包；切换到低倍率经济型模型降低消耗速度；或提前续费延长订阅周期。建议设置80%额度告警，提前规划用量。

Q3: Tokens Plan 提供哪些套餐类型？

A: Tokens Plan提供三档套餐：Lite（月度¥99/年度¥999）适合个人轻量使用；Pro（月度¥699/年度¥6,999）适合专业工作场景；Enterprise（月度¥2,999/年度¥29,999）适合企业级需求。

Q4: 支持哪些工具和平台？

A: 支持多种接入方式：兼容OpenAI（/v1/chat/completions、/v1/responses）、Anthropic（/v1/messages）、Gemini（/v1beta/models/*）格式接口，只需在工具中选择供应商或填入API Key和Base URL即可使用，一套额度通用于Claude code、cline、codex、opencode、openclaw等主流平台。

Q5: 各套餐的额度配置机制是什么？

A: 套餐采用多时间维度额度控制：月额度（总量控制）、周额度（约月额度45%）、日额度（约月额度40%）、5小时额度（约月额度20%），以及TPM（每分钟Token数）和RPM（每分钟请求数）速率限制。这种设计防止单时间窗口过度消耗，确保算力池稳定性。Lite套餐TPM为15,000、RPM为600；Pro套餐TPM为75,000、RPM为1,800；Enterprise套餐TPM为225,000、RPM高达12,000。

Q6: 模型倍率机制如何影响实际消耗？

A: 模型倍率决定Credits消耗的放大系数，倍率越高消耗越大。平台将模型分为多档倍率等级，经济型模型倍率较低，适合大批量低成本任务；标准型模型倍率适中，适合日常使用；高端模型倍率较高，提供更强的推理和创作能力。选择模型时需平衡任务需求与成本预算，高倍率模型能力更强但消耗更多Credits，建议根据实际场景灵活搭配使用。

Q7: 不同倍率模型的使用场景建议？

A: 代码生成和批量任务推荐经济型低倍率模型，成本最低；日常对话和轻量问答推荐性价比型模型；专业内容创作推荐标准型模型；复杂推理任务推荐增强型模型；高质量代码重构推荐高端模型；创意写作推荐旗舰型模型；战略决策分析推荐顶级模型。建议日常70%使用低倍率模型处理基础任务，30%使用高倍率模型处理复杂需求，实现成本与质量的最佳平衡。

Q9: Pro套餐与Enterprise套餐的核心差异？

A: 两套餐核心差异在于并发能力：Enterprise的RPM高达12,000次/分钟，是Pro的1,800次的6.7倍；月额度150万是Pro 50万的3倍；TPM 225,000是Pro 75,000的3倍。Pro适合5人以下技术团队日常开发；Enterprise适合10人以上团队或有对外API服务需求的企业，高并发场景下Enterprise的RPM优势明显，可支持50+并发用户同时调用。

8. 错误码参考

当 API 请求被拒绝时，响应会包含以下错误码，帮助您快速定位问题：

HTTP	错误码	说明与建议
401	invalid_api_key	API Key 无效或已被删除，请检查 Key 是否正确。
403	model_not_allowed	当前套餐不支持该模型，请确认模型名称或升级套餐。
403	subscription_expired	套餐已过期，请续费后继续使用。
429	monthly_limit_reached	月额度已到达上限，请等待下周期刷新或升级套餐。
429	weekly_limit_reached	本周用量已到达上限，将于下周一 00:00 重置。
429	5h_limit_reached	近 5 小时用量已到达上限，请稍后重试，额度将随时间自动恢复。
429	rpm_limit_reached	每分钟请求数超限，请降低请求频率。
429	tpm_limit_reached	每分钟 Token 数超限，请减少单次请求长度或降低频率。
429	concurrency_limit_reached	并发请求数超限，请稍后重试。
500	internal_error	服务端内部出错，请稍后重试。如持续出现请联系客服。

如有任何问题，请添加客服微信或通过平台「联系客服」入口获取帮助。

本Token plan套餐与销售规则最终解释权归胜算云团队所有

胜算云Tokens Plan 套餐细则

1. 套餐概览#

1.1 套餐对比#

1.2 套餐选择建议#

2. 支持模型#

2.1 模型列表#

Token plan base url#

3. 计费规则#

3.1 计费单位#

3.2 套餐有效#

3.3 三层限额机制#

3.4 续费规则#

3.6 退款#

4. 接入工具#

4.1 支持的智能体平台示例（接口合适都可接入）#

4.2 支持的 AI Coding 工具示例（接口合适都可接入）#

4.3 快速接入步骤#

5. 活动规则#

5.1 限时折扣#

5.2 购买规则#

5.3 计费周期说明#

6. 服务协议#

6.1 服务范围#

6.2 额度与计费#

6.3 使用规范#

6.4 退款政策#

6.5 免责声明#

7. 常见问题（FAQ）#

8. 错误码参考#