BlueAI株式会社BlueAI
応用

プロンプトキャッシュ(Prompt Caching)とは?

読み方: プロンプトキャッシュ

定義

Anthropic API のキャッシュ機能。長いシステムプロンプトや CLAUDE.md を再利用してトークンコストとレイテンシを大幅削減する。

詳しい解説

プロンプトキャッシュは Anthropic API が提供する機能で、長いシステムプロンプトやドキュメント・コードベース要約などを 5 分間キャッシュし、同じ内容を再送信する際に大幅なコスト・レイテンシ削減を実現します。キャッシュヒット時の入力トークン単価は通常の約 10 分の 1 になり、キャッシュへの書き込み時の単価は約 1.25 倍ですが、2 回以上再利用される前提なら確実に元が取れます。Claude Code は CLAUDE.md・読み込んだファイル・会話履歴の前半部分などをキャッシュ対象としてマークし、同じセッションや短時間内の連続実行で自動的にキャッシュを活用します。/cost コマンドでキャッシュヒット率を確認でき、ヒット率が高いほど 1 セッションあたりのコストが下がります。プロンプトキャッシュを最大化するコツは、(1) CLAUDE.md を充実させて変化しない情報をキャッシュに乗せる、(2) /compact を活用してキャッシュ可能な要約を生成する、(3) 連続して同じプロジェクトで作業する、(4) セッション間隔を 5 分以内に保つ(TTL 制限)、です。長時間放置するとキャッシュが期限切れになり、次回のリクエストで再書き込みが発生するため、コスト面では「短時間に集中して使う」運用が有利です。チーム開発で同じプロジェクトを複数人が触る場合、キャッシュはユーザー単位で独立しているため、各メンバーが個別にキャッシュを蓄積する形になります。

Claude Code を体系的に学びませんか?

全10章・30レッスン無料公開中

第1章から始める