AI API 中转站使用说明:Claude Code / Codex / OpenAI 兼容客户端配置、购买前须知与错误排查。

429 Rate Limit 与余额排查

AI API 中转站 429 rate limit、余额不足、并发过高、RPM/TPM、上游限流和重试策略排查说明。

429 Rate Limit 与余额排查

429 rate limit 不一定只是“服务不可用”。它可能来自客户端并发、Key 额度、套餐权限、余额不足、上游限流或线路维护。

快速检查

  1. 查看账户页面余额和今日消耗。
  2. 降低并发,把自动化任务改为串行或小批量。
  3. 检查 RPM、TPM、上下文长度和流式输出是否触发限制。
  4. 短 prompt 复测,确认不是单次请求过大。
  5. 若多个客户端共用一个 Key,先拆分 Key 再观察。

重试建议

  • 不要无限重试。
  • 对 429 设置指数退避和最大重试次数。
  • 生产环境准备备用模型或降级策略。

相关页面