レート制限(Rate Limit)とは?
読み方: レートせいげん
定義
Anthropic API や Claude サブスクリプションが課す秒間 / 分間 / 日次のリクエスト・トークン上限。超過すると 429 エラーが返る。
詳しい解説
レート制限は Anthropic API および Claude Code サブスクリプションが課すリクエスト数・トークン数の上限です。API には RPM(Requests Per Minute)、ITPM(Input Tokens Per Minute)、OTPM(Output Tokens Per Minute)の 3 軸があり、契約ティア(Tier 1〜4 / Custom)に応じて段階的に引き上げられます。レート上限に達すると HTTP 429(Too Many Requests)が返り、レスポンスヘッダーに retry-after で再試行までの待機秒数が含まれます。Claude Code は内部で指数バックオフを行うため、軽微な超過は自動で吸収されます。Claude Pro / Max のサブスクリプションでも別途レート制限が存在し、Max プランは Pro よりも上限が大幅に緩和されていますが、無制限ではない点に注意が必要です。連続して大規模なリファクタリングを回す場合、レート上限に達してセッションが一時停止することがあります。対策としては、(1) 重いタスクをサブエージェントに分散して並列実行する代わりに直列で回す、(2) Haiku などの軽量モデルに切り替える、(3) /compact で会話を圧縮しトークン消費を抑える、(4) API キーモードで Tier を引き上げる、といった方法があります。プロダクション利用では Anthropic Console から Tier 引き上げ申請を行い、想定ピーク時間帯のキャパシティを事前確保するのが安全です。