模型、额度与费用说明
不同模型的价格、上下文长度、响应速度和限流规则可能不同。使用前建议先确认账户页面展示的模型列表、余额和额度规则。
建议关注
| 项目 | 说明 |
|---|---|
| 模型名称 | 客户端配置时使用账户页面展示的 model id |
| 适用场景 | 编程、长文、总结、对话、轻量任务等 |
| 上下文长度 | 长任务会消耗更多上下文和费用 |
| 流式输出 | 部分客户端依赖流式输出体验 |
| 额度与余额 | 以账户页面展示为准 |
| 限流规则 | 高频请求建议设置退避重试 |
费用提醒
长对话、工具调用、文件读取和上下文压缩都可能增加消耗。新配置建议先用短消息测试,确认稳定后再执行长任务。
稳定性提醒
不要把任何第三方模型服务理解成“永久稳定”或“无限额度”。生产环境建议准备失败重试、限流、超时和降级方案。