胜算云文档
胜算云
胜算云
  1. 使用指南
  • 模型API
    • 快速入门
    • ❇️ Claude Code 配置使用胜算云( Anthropic 兼容接口模式)
    • ❇️ Claude Code 桌面版IDE(免登录、超方便、全功能)
    • ❇️ Claude 桌面端免登录接入胜算云 API
    • ❇️ Codex 桌面版应用接入胜算云API
    • ❇️ Codex CLI 接入胜算云API
    • ❇️ OpenCode 接入胜算云(桌面版IDE)
    • ❇️ OpenClaw 最新版接入胜算云 API 文档
    • ❇️ Hermes Agent 最新版接入胜算云 API 文档
    • 更新公告
    • 使用指南
      • 账号指南
      • 开发者快速入门指南
      • N8N-Nodes-Shengsuanyun 安装使用指南(已上线n8n社区)
      • 使用ComfyUI 调用胜算云API (暂支持同步任务节点,异步任务节点开发中)
      • VS Code插件快速入门指南
      • 胜算云AI群聊 Chrome扩展插件
      • LangBot 接入胜算云API
      • 使用Cherry Studio接入胜算云API
      • 使用LobeChat接入胜算云API
      • AI群聊快速入门指南
      • 胜算云Tokens Plan 套餐细则
    • 大厂模型-大语言
      • 错误处理
      • 常见问题
      • API 错误代码说明
      • OpenAI兼容API
        • 联网搜索
        • 模型路由
        • 工具调用
        • 聊天补全
        • 文本向量化
      • Anthropic兼容API
        • 创建消息
      • Google兼容API
        • SDK 调用
        • 内容生成 (v1)
          • 生成内容
          • 流式生成内容
        • 内容生成 (v1beta)
          • 生成内容(Beta)
          • 流式生成内容(Beta)
        • Live API
          • Google Gemini Live API
      • 获取APIKey详情
    • 大厂模型-多媒体
      • 支持的模型(逐步更新)
      • 基础接口
        • 异步任务提交
        • 查询任务状态
        • 同步图像生成
        • 同步图像编辑
        • 同步音频转录
      • 模型特有参数(进行中)
        • 通义千问
          • qwen image 特有参数
          • Wan视频生成
      • 测试API接口
        • 阿里
          • wan
            • 创建 万相 视频生成任务
          • HappyHorse-1.0
            • 创建 HappyHorse 视频生成任务
          • 阿里Paraformer
            • Paraformer-v2音频转录-异步
          • Qwen-Image
            • 千问图像生成/编辑-异步
            • 千问图像编辑-同步
        • 可灵
          • 可灵 API
          • 3D 模型生成(豆包 Seed3D / 数美 3D / 影眸 3D)
        • 即梦
          • 即梦生图参数详解
          • 即梦视频生成
          • 即梦生图
        • 豆包
          • 豆包视频生成参数详解
          • 3D 模型生成(豆包 Seed3D / 数美 3D / 影眸 3D)
          • 豆包生视频-异步
          • 豆包生图-异步
          • 豆包生图-同步
          • 豆包视频2.0
        • Google
          • Veo3视频生成
          • 🍌1 / 🍌 pro 图像生成-异步
          • 🍌1 / 🍌 pro 图像生成-同步
          • 🍌 1 图像生成-Chat接口
        • Minimax
          • 视频生成 API
          • Minimax视频生成
        • Vidu
          • 视频生成 API
          • Vidu视频生成
        • OpenAI
          • Sora 视频生成 API
          • Image1 图像生成
          • sora2视频生成
          • sora视频生成
          • Whisper1音频转录-同步
          • Whisper1音频转录-异步
          • Image2 / 1.5 / 1 图像生成/编辑-异步
          • Image2 / 1.5 / 1 图像生成-同步
          • Image2 / 1.5 / 1 图像编辑-同步
        • 火山引擎
          • 火山引擎图片处理
        • Runway
          • 视频生成
          • 文本生成音频
          • 音效生成
        • 腾讯混元
          • 混元生3D-专业版
          • 混元生3D-极速版
          • 纹理生成
          • 智能拓扑
          • UV展开
          • 组件生成
    • GPU租赁
      • GPU租赁与选型指南
      • 容器实例
      • 数据与存储
      • 费用相关
    • 条款与协议
      • 用户协议
      • 隐私政策
      • 用户充值协议
      • 付费充值协议
      • 使用条款
      • 数据安全协议和分析
    • 数据模型
      • Schemas
        • 即梦4.0生图请求
        • Gemini 图片生成请求体-Messages
        • Sora2视频生成请求体
        • 千问文生图异步参数
        • 豆包3D生成请求体
        • HappyHorseVideoRequest
        • WanVideoRequest
        • HappyHorseInput
        • WanInput
        • HappyHorseMediaItem
        • WanMediaItem
        • HappyHorseParameters
        • WanParameters
        • RunwayTaskGenerationRequest
        • Runway视频生成请求体
        • 阿里音频转录请求体
        • Whispher 音频转录请求体
        • 即梦文生图请求
        • OpenAI-Chat 请求体
        • OpenAI图像生成参数
        • 可灵视频生成请求体
        • 豆包视频生成请求体
        • Whispher 音频转录 响应- json
        • OpenAI-Chat 请求体-Message
        • Minimax视频生成请求体
        • Gemini 图片生成请求体-常规
        • 即梦视频生成请求体
        • OpenAI-Chat 请求体- StreamOptions
        • Sora1视频生成请求体
        • OpenAI-Chat 请求体-Function
        • 千问图生图同步参数
        • 豆包图片生成请求体
        • OpenAI-Chat 请求体-ToolCall
        • Vidu视频生成请求体
        • 即梦图生图请求
        • OpenAI-Chat 请求体-ResponseFormat
        • Openai 图像生成响应
        • OpenAI-Chat 请求体- FormatJsonSchema
        • OpenAI Chat 响应体
        • 千问图像编辑响应
        • Whispher 音频转录 响应- text
        • 豆包图片生成响应
        • 异步任务响应
        • OpenAI Embedding 响应
        • OpenAI Chat响应体-Choice
        • OpenAI Chat 响应- Usage
        • 任务信息
        • OpenAI Embedding 响应- Item
        • 千问图像编辑响应-Choice
        • 错误响应
        • 千问图像编辑响应-Message
        • Veo视频生成请求体
        • 千问图像编辑响应-Content
        • 图片生成成功事件
        • 千问图像编辑响应-Usage
        • 异步Task响应
        • 图片生成失败事件
        • 异步Task响应Data
        • 图像生成完成事件
        • 异步Task响应Result
        • 流式响应错误事件
      • LoomLoom(AssembleFlow批处理)
        • GetTemplateFormSchemaResponse 获取官方模板表单 schema 响应
        • TemplateFormColumnSchema 模板表格列定义
        • TemplateFormFieldSchema 模板表单字段定义
        • TemplateFieldAcceptedInputKind 字段允许的输入形态
        • TemplateSampleRow 模板样例行
        • HealthCheckResponse 健康检查响应
        • UploadInputAssetResponse 通用输入资产上传响应
        • ValidateTemplateRowsResponse 校验官方模板表格行响应
        • RowValidationError 行校验错误
        • rpcStatus
        • protobufAny
        • PrecheckTemplateRowsRequest 预估官方模板表格行请求
        • TemplateDisplayRow 模板表格中的一行输入
        • manualSubmitTemplateFileResponse
        • ListTemplatesResponse 列出模板响应
        • TemplateSummary 模板摘要
        • UploadInputAssetRequest 通用输入资产上传请求 第一版使用 unary 上传,单文件大小上限为 10 MiB。
        • manualValidateTemplateFileResponse
        • manualRowValidationError
        • ListRunArtifactsResponse 产物查询响应
        • ArtifactEntry 单个产物条目
        • ValidateTemplateRowsRequest 校验官方模板表格行请求
        • SubmitTemplateRowsRequest 提交官方模板表格行请求
        • SubmitTemplateRowsResponse 提交官方模板表格行响应
        • PrecheckTemplateRowsResponse 预估官方模板表格行响应
        • TemplateBalanceCheck 模板余额检查
        • GetWorkflowRunResponse 运行状态及执行摘要。 summary 字段(total_tasks 等)在终态后由 workflow 回写;运行中时为 0。
        • ListRunTasksResponse 任务列表响应
        • RunTaskItem 单条任务摘要
      • Runway音效生成请求体
      • Wan图生视频请求体
      • 异步Task响应
      • Gemini Chat 请求体
      • 腾讯3D生成请求体
      • 3D生成请求体
      • MediaURL
      • Claude 请求体
      • Runway TextToSpeech 请求体
      • 3D专业版请求体
      • Wan异步Task响应
      • 异步Task响应Data
      • Gemini Chat 请求体-Content
      • 多视角图片
      • 3D内容项
      • DraftTaskRef
      • Claude 请求体-Message
      • 3D极速版请求体
      • Wan异步Task响应Data
      • Gemini Chat 请求体-Part
      • 异步Task响应
      • Tool
      • Claude 响应 - messages
      • 纹理生成请求体
      • Gemini Chat 请求体-InlineData
      • 异步Task响应Data
      • ContentItem
      • Claude 响应 - MessageSource
      • 智能拓扑请求体
      • Gemini Chat 请求体-FileData
      • 异步Task响应Result
      • OfficialSeedanceRequest
      • Claude 请求体-Tool
      • UV展开请求体
      • Gemini Chat 请求体-FunctionCall
      • LegacyImageListItem
      • Claude 请求体-Thinking
      • 组件生成请求体
      • Gemini Chat 请求体-FunctionResponse
      • LegacyMediaListItem
      • Claude 响应
      • 多视角图片
      • Gemini Chat 请求体-PartExecutableCode
      • LegacySeedanceRequest
      • Claude 响应-Usage
      • File3D对象
      • Gemini Chat 请求体-PartCodeExecutionResult
      • CreateTaskResponse
      • ClaudeError
      • Image对象
      • Gemini Chat 请求体-ChatGenerationConfig
      • TaskUsage
      • InputFile3D对象
      • Gemini Chat 请求体-ThinkingConfig
      • TaskQueryResponse
      • 异步Task响应
      • Gemini Chat 请求体-ChatSafetySettings
      • 异步Task响应Data
      • Gemini Chat 请求体-ChatTool
      • 异步Task响应Result
      • Gemini Chat 请求体-Config
      • Gemini Chat 请求体-FunctionCallingConfig
      • Gemini Chat 响应
      • Gemini Chat 响应-Candidate
      • Gemini Chat 响应-SafetyRating
      • Gemini Chat 响应-PromptFeedback
      • Gemini Chat 响应-UsageMetadata
      • GeminiError
  • LoomLoom
    • LoomLoom内测接口
      • UploadInputAsset 上传通用原始输入资产(文本/图片等) 第一版使用 unary RPC,单文件大小上限 10 MiB。
      • GetWorkflowRun 查询工作流运行
      • ListRunArtifacts 按 run/task/step 查询产物列表
      • ListRunTasks 按 run 查询任务列表
      • HealthCheck 健康检查
      • ListTemplates 列出所有可用的内置模板
      • GetTemplateFormSchema 获取官方模板表单 schema
      • PrecheckTemplateRows 预估官方模板表格行成本
      • SubmitTemplateRows 提交官方模板表格行
      • ValidateTemplateRows 校验官方模板表格行
      • DownloadTemplateExcel 下载模板 Excel 文件
      • ValidateTemplateFile 校验上传的模板 Excel 文件
      • SubmitTemplateFile 提交模板 Excel 文件(校验+编译+执行)
  1. 使用指南

胜算云Tokens Plan 套餐细则

Token Plan 是胜算云推出的 AI 模型调用包月订阅服务。用户按月付费,即可在额度内不限次数调用多种主流大模型,告别按量计费焦虑,适合高频AI模型切换场景的开发者和工具用户。
本文档将帮助您全面了解 Token Plan 的套餐内容、计费规则、支持模型、接入工具及活动规则。

1. 套餐概览#

Token Plan 提供 3 种订阅套餐,满足从轻度尝鲜到高强度开发的不同场景需求。

1.1 套餐对比#

对比项LitePro(推荐)Enterprise((后续上线,可联系Daming预约))
月付价99 模力699 模力2,999 模力
年付价(暂未开放)999 模力6,999 模力29,999模力
月额度(Credits)15 万120 万200 万
周限额6.75 万54 万77.5 万
RPM(每分钟请求数)6001,80012,000
API Key 数量2 个5 个不限
并发数25不限
模力说明:1 模力 = 1 元人民币。您可使用平台模力余额支付,余额不足部分可通过微信 / 支付宝补充。

1.2 套餐选择建议#

Lite:适合轻度使用、尝鲜体验的个人开发者,日均调用量较低的场景。
Pro(推荐):适合中高频开发者,日常使用 AI Coding 工具或运行智能体的主力套餐。
Enterprise:适合重度使用、团队级或企业级高并发调用场景。

2. 支持模型#

Token Plan 支持调用 50+ 款主流大模型,覆盖国内外顶级模型厂商,三档套餐均可使用全部模型。可用在cline、Claude code、Codex、openclaw、opencode等工具,需要选择openai兼容格式,按以下base url和模型ID填入使用。

2.1 模型列表#

Token plan base url#

https://router.shengsuanyun.com/api/cp/v1
厂商前缀原始模型名称适配后的标准格式
anthropicClaude Haiku 4.5anthropic/claude-haiku-4.5
anthropicClaude Haiku 4.5 Thinkinganthropic/claude-haiku-4.5:thinking
anthropicClaude Opus 4.5anthropic/claude-opus-4.5
anthropicClaude Opus 4.6anthropic/claude-opus-4.6
anthropicClaude Sonnet 4anthropic/claude-sonnet-4
anthropicClaude Sonnet 4 ( Thinking )anthropic/claude-sonnet-4:thinking
anthropicClaude Sonnet 4.5anthropic/claude-sonnet-4.5
anthropicClaude Sonnet 4.5 Thinkinganthropic/claude-sonnet-4.5:thinking
anthropicClaude Sonnet 4.6anthropic/claude-sonnet-4.6
anthropicClaude-3.7-sonnetanthropic/claude-3.7-sonnet
bigmodelGLM-4.5bigmodel/glm-4.5
bigmodelGLM-4.6bigmodel/glm-4.6
bigmodelGLM-4.7bigmodel/glm-4.7
bigmodelGLM-5bigmodel/glm-5
bytedanceDoubao-Seed-1.8bytedance/doubao-seed-1.8
deepseekDeepSeek V3.1deepseek/deepseek-v3.1
deepseekDeepseek V3.2deepseek/deepseek-v3.2
deepseekDeepSeek V3.2 Thinkingdeepseek/deepseek-v3.2-think
deepseekDeepSeek-R1-0528deepseek/deepseek-r1-0528
deepseekDeepSeek-V3:latestdeepseek/deepseek-v3
googleGemini 2.5 Flashgoogle/gemini-2.5-flash
googleGemini 2.5 Progoogle/gemini-2.5-pro
googleGemini 3 Flash Previewgoogle/gemini-3-flash
googleGemini 3.1 Flash Image Previewgoogle/gemini-3.1-flash-image-preview
googleGemini 3.1 Flash Lite Previewgoogle/gemini-3.1-flash-lite-preview
googleGemini 3.1 Pro Previewgoogle/gemini-3.1-pro-preview
kuaishouKAT-Coder-Air-V1streamlake/kat-coder-air-v1
kuaishouKAT-Coder-Exp-72B-1010streamlake/kat-coder-exp-72b-1010
minimaxMiniMax M2minimax/minimax-m2
minimaxMiniMax M2.1minimax/minimax-m2.1
minimaxMiniMax M2.1 lightningminimax/minimax-m2.1-lightning
minimaxMiniMax M2.5minimax/minimax-m2.5
moonshotKimi K2.5moonshot/kimi-k2.5
openaiGPT-4.1-nanoopenai/gpt-4.1-nano
openaiGPT-5openai/gpt-5
openaiGPT-5-Nanoopenai/gpt-5-nano
openaiGPT-5.1openai/gpt-5.1
openaiGPT-5.2openai/gpt-5.2
qwenQwen-Plusali/qwen-plus-latest
qwenQwen3-235B-A22B-Instruct-2507ali/qwen3-235b-a22b-instruct-2507
qwenQwen3-Coder-480B-A35B-Instructali/qwen3-coder-480b-a35b-instruct
qwenQwen3-Coder-Plusali/qwen3-coder-plus
qwenQwen3-Maxali/qwen3-max
qwenQwen3-Max-2026-01-23ali/qwen3-max-2026-01-23
qwenQwen3-Max-Previewali/qwen3-max-preview
qwenQwen3.5-397B-A17Bali/qwen3.5-397b-a17b
qwenQwen3.5-Plusali/qwen3.5-plus
x-aiGrok 4 Fastx-ai/grok-4-fast
什么是「消耗速率」?
Token Plan 采用 Credits 作为统一计量单位,不同模型消耗 Credits 的速率不同。模型倍率决定Credits消耗的放大系数,倍率越高消耗越大。平台将模型分为多档倍率等级,经济型模型倍率较低,适合大批量低成本任务;标准型模型倍率适中,适合日常使用;高端模型倍率较高,提供更强的推理和创作能力。选择模型时需平衡任务需求与成本预算,高倍率模型能力更强但消耗更多Credits,建议根据实际场景灵活搭配使用。

3. 计费规则#

3.1 计费单位#

Credits:Token Plan 的统一用量计量单位。调用模型时,系统根据该模型的消耗速率(倍率)扣除对应数量的 Credits。
模力:Token Plan 的计价货币单位(1 模力 = 1 元人民币),用于套餐购买和续费。

3.2 套餐有效#

套餐按 订阅月 计算,从购买当天起至下个月同一天 23:59:59。
如果目标月没有对应日期,则取当月最后一天。
举例:1 月 4 日购买 → 2 月 4 日 23:59:59 到期;1 月 31 日购买 → 2 月 28 日 23:59:59 到期(非闰年)。

3.3 三层限额机制#

Token Plan 通过三层限额控制用量节奏,保障服务稳定性:
限额类型说明恢复方式
5 小时滑动窗口限额任意连续 5 小时内的用量不能超过上限随时间自动恢复(早期用量"滑出"窗口后释放)
周限额每周总用量不能超过上限每周一 00:00 自动重置
月限额整个订阅月的 Credits 总上限新的订阅月开始时重置
额度耗尽不额外扣费:当任一层级额度用完后,系统会直接拒绝请求(返回 HTTP 429 错误码),不会额外扣除您的模力余额。您可以等待对应周期自动恢复,或升级到更高套餐扩容额度池。

3.4 续费规则#

未到期续费:新周期从当前到期时间往后顺延,不浪费剩余时间。
已到期续费:新周期从购买时刻重新开始计算。
支持 月付 和 年付 两种计费周期,年付享受更大折扣。

3.6 退款#

首版支持 人工退款,请联系客服协商处理。退款金额会按比例扣除已使用 Credits 对应的费用。

4. 接入工具#

Token Plan 兼容 OpenAI API 格式,支持所有主流 AI 编程工具和智能体平台。购买即开通,无需额外创建接入点。

4.1 支持的智能体平台示例(接口合适都可接入)#

工具名称说明
OpenClaw胜算云自研的开源智能体平台,Token Plan 的最佳搭配。在 OpenClaw 中使用 Token Plan 的 API Key,即可享受包月额度调用各类大模型。
Coze(扣子)字节跳动推出的 AI 应用开发平台,支持通过自定义 API 接入 Token Plan。
Dify开源的大语言模型应用开发平台,在模型供应商设置中添加 Token Plan 的 API Base URL 和 Key 即可。
GPTsOpenAI 自定义 GPTs,支持通过 Actions 接入 Token Plan 提供的模型服务。

4.2 支持的 AI Coding 工具示例(接口合适都可接入)#

工具名称说明
CursorAI 代码编辑器,在 Settings → Models 中配置 Token Plan 的 API Base URL 和 API Key,选择对应模型即可使用。
ClineVS Code 插件,支持 OpenAI 兼容的 API 接入,在设置中配置 Token Plan 信息即可。
Claude CodeAnthropic 官方 CLI 工具,通过环境变量配置 Token Plan 的 API 端点和密钥。
Roo CodeAI 编程助手,支持 OpenAI 格式 API,直接配置 Token Plan 信息即可接入。
Kilo CodeAI 编程工具,在工具设置中添加 Token Plan 的 API 配置。
Codex CLIOpenAI 命令行编程工具,通过环境变量设置 API Base URL 和 Key 使用 Token Plan。

4.3 快速接入步骤#

1.
购买套餐:在 Token Plan 产品页选择合适的套餐并完成支付。
2.
获取 API Key:进入用户控制台,点击「新建密钥」,填写 Key 名称,创建后 立即复制保存(明文仅显示一次)。
3.
配置工具:在您使用的 AI 工具中,将 API Base URL 设置为胜算云提供的接入地址,将 API Key 粘贴到对应位置。
4.
选择模型:在工具中选择 Token Plan 支持的模型名称(如 deepseek-v3.2、claude-sonnet-4 等),即可开始调用。
API Key 管理须知
API Key 明文 只在创建时显示一次,请务必及时复制保存。
同一账号下的多个 Key 共享同一额度池,不单独计量。
您可以为单个 Key 设置 RPM(每分钟请求数)和 TPM(每分钟 Token 数)上限,但不支持 Key 级额度限制。

5. 活动规则#

5.1 限时折扣#

所有套餐均提供 限时折扣价,月付和年付均享优惠(详见套餐对比表中的划线价)。
年付更省:敬请期待,年付即将上线

5.2 购买规则#

同一账号同一时间只能有 一个生效中的套餐。
当月不支持重复购买同等级套餐,如需更多额度请升级到更高档位。
支付方式:模力余额 / 微信扫码 / 支付宝扫码,支持模力余额优先抵扣。
支付成功后套餐 立即生效,无需等待审核。

5.3 计费周期说明#

周期说明
月付按月支付,有效期为一个订阅月(购买日 → 下月同日 23:59:59)。
年付一次性支付 12 个月费用,享受年付折扣价。有效期 12 个订阅月。

6. 服务协议#

6.1 服务范围#

Token Plan 为胜算云提供的 AI 模型调用包月订阅服务,用户在额度范围内可通过 API 调用平台支持的大语言模型。
本服务仅提供模型推理接口,不包含模型训练、微调等服务。

6.2 额度与计费#

套餐以 Credits 计量模型调用消耗,不同模型的消耗倍率不同。
额度用尽后系统自动停止服务,不会产生额外费用,不会扣除账户模力余额。
未使用完的额度 不支持结转至下一周期,到期自动清零。

6.3 使用规范#

用户应合理使用套餐额度,不得转售、共享 API Key 给第三方。
禁止利用本服务生成违法违规内容。
平台有权对异常使用行为(如疑似转售、恶意高频调用等)采取暂停或封禁措施。

6.4 退款政策#

首版仅支持七天内因平台问题原因退款。
退款金额 = 支付金额 − 已使用额度对应的费用。
全额退款后套餐立即失效;部分退款不影响当前订阅状态。

6.5 免责声明#

因模型厂商上游故障导致的服务中断,胜算云将尽力恢复但不承担赔偿责任。
平台保留根据市场情况调整套餐价格、模型列表和额度规则的权利,调整前将提前通知用户。

7. 常见问题(FAQ)#

Q1: Credits是什么?如何衡量消耗?
A: Credits是Token Plan的统一计价单位,一套额度可通用于所有支持的模型。消耗计算公式为:Credits消耗 = API返回Token数 × 模型倍率。不同模型倍率不同,高能力模型倍率较高,经济型模型倍率较低。相同Token输出量下,选择低倍率模型可大幅节省Credits消耗,用户可根据使用需求灵活选择。

Q2: 额度用完了怎么办?
A: 额度耗尽时API将返回QUOTA_EXCEEDED错误,拒绝服务。用户可选择五种应对方案:等待下一个计费周期自动重置(适合非紧急任务);升级到更高套餐立即获得更多额度(立即生效);购买临时额度补充包;切换到低倍率经济型模型降低消耗速度;或提前续费延长订阅周期。建议设置80%额度告警,提前规划用量。

Q3: Tokens Plan 提供哪些套餐类型?
A: Tokens Plan提供三档套餐:Lite(月度¥99/年度¥999)适合个人轻量使用;Pro(月度¥699/年度¥6,999)适合专业工作场景;Enterprise(月度¥2,999/年度¥29,999)适合企业级需求。

Q4: 支持哪些工具和平台?
A: 支持多种接入方式:兼容OpenAI(/v1/chat/completions、/v1/responses)、Anthropic(/v1/messages)、Gemini(/v1beta/models/*) 格式接口,只需在工具中选择供应商或填入API Key和Base URL即可使用,一套额度通用于Claude code、cline、codex、opencode、openclaw等主流平台。

Q5: 各套餐的额度配置机制是什么?
A: 套餐采用多时间维度额度控制:月额度(总量控制)、周额度(约月额度45%)、日额度(约月额度40%)、5小时额度(约月额度20%),以及TPM(每分钟Token数)和RPM(每分钟请求数)速率限制。这种设计防止单时间窗口过度消耗,确保算力池稳定性。Lite套餐TPM为15,000、RPM为600;Pro套餐TPM为75,000、RPM为1,800;Enterprise套餐TPM为225,000、RPM高达12,000。

Q6: 模型倍率机制如何影响实际消耗?
A: 模型倍率决定Credits消耗的放大系数,倍率越高消耗越大。平台将模型分为多档倍率等级,经济型模型倍率较低,适合大批量低成本任务;标准型模型倍率适中,适合日常使用;高端模型倍率较高,提供更强的推理和创作能力。选择模型时需平衡任务需求与成本预算,高倍率模型能力更强但消耗更多Credits,建议根据实际场景灵活搭配使用。

Q7: 不同倍率模型的使用场景建议?
A: 代码生成和批量任务推荐经济型低倍率模型,成本最低;日常对话和轻量问答推荐性价比型模型;专业内容创作推荐标准型模型;复杂推理任务推荐增强型模型;高质量代码重构推荐高端模型;创意写作推荐旗舰型模型;战略决策分析推荐顶级模型。建议日常70%使用低倍率模型处理基础任务,30%使用高倍率模型处理复杂需求,实现成本与质量的最佳平衡。

Q9: Pro套餐与Enterprise套餐的核心差异?
A: 两套餐核心差异在于并发能力:Enterprise的RPM高达12,000次/分钟,是Pro的1,800次的6.7倍;月额度150万是Pro 50万的3倍;TPM 225,000是Pro 75,000的3倍。Pro适合5人以下技术团队日常开发;Enterprise适合10人以上团队或有对外API服务需求的企业,高并发场景下Enterprise的RPM优势明显,可支持50+并发用户同时调用。

8. 错误码参考#

当 API 请求被拒绝时,响应会包含以下错误码,帮助您快速定位问题:
HTTP错误码说明与建议
401invalid_api_keyAPI Key 无效或已被删除,请检查 Key 是否正确。
403model_not_allowed当前套餐不支持该模型,请确认模型名称或升级套餐。
403subscription_expired套餐已过期,请续费后继续使用。
429monthly_limit_reached月额度已到达上限,请等待下周期刷新或升级套餐。
429weekly_limit_reached本周用量已到达上限,将于下周一 00:00 重置。
4295h_limit_reached近 5 小时用量已到达上限,请稍后重试,额度将随时间自动恢复。
429rpm_limit_reached每分钟请求数超限,请降低请求频率。
429tpm_limit_reached每分钟 Token 数超限,请减少单次请求长度或降低频率。
429concurrency_limit_reached并发请求数超限,请稍后重试。
500internal_error服务端内部出错,请稍后重试。如持续出现请联系客服。

如有任何问题,请添加客服微信或通过平台「联系客服」入口获取帮助。
本Token plan套餐与销售规则最终解释权归胜算云团队所有
修改于 2026-04-29 06:43:43
上一页
AI群聊快速入门指南
下一页
错误处理
Built with