429 Rate Limit 与余额排查
429 rate limit 不一定只是“服务不可用”。它可能来自客户端并发、Key 额度、套餐权限、余额不足、上游限流或线路维护。
快速检查
- 查看账户页面余额和今日消耗。
- 降低并发,把自动化任务改为串行或小批量。
- 检查 RPM、TPM、上下文长度和流式输出是否触发限制。
- 短 prompt 复测,确认不是单次请求过大。
- 若多个客户端共用一个 Key,先拆分 Key 再观察。
重试建议
- 不要无限重试。
- 对 429 设置指数退避和最大重试次数。
- 生产环境准备备用模型或降级策略。