カリキュラム/第5章: プロンプト術/5-3 Best of N プロンプト術｜Claude Code に 3 案出させる

5-3 Best of N プロンプト術｜Claude Code に 3 案出させる

無料

同じタスクを Claude Code に 3 通り提案させて比べる Best of N 手法。LP コピー・UI・関数設計の実例、比較の観点、失敗パターン、コピペで使えるテンプレートまで体系化し、出力品質を底上げします。

第5章: プロンプト術30分

監修: 酒井歩乃加

フリーランス編集者・ライター / 元マイベスト編集ディレクター

監修: 平原尚樹

株式会社BlueAI 代表取締役CEO / ソフトウェアエンジニア

このレッスンで身につくこと

このレッスンは第 5 章「プロンプト術」の締めくくりです。5-1 で CLAUDE.md という常設の前提、5-2 で 1 発のプロンプトを磨くコツを学びました。ここで扱うのは、1 発勝負ではなく統計勝負に持ち込むもう一段上の発想です。

Best of N とは、同じ課題を N 通りの方向性で並列に依頼し、出てきた候補を比較して 1 つを選ぶ手法。N はだいたい 3、多くても 5。1 つの「正解っぽい答え」を出させるのではなく、3 つの方向性のうちのベストを選ぶことで、ヒット率を統計的に底上げします。

ポイント

このレッスンのゴール

Best of N が 1 発勝負ではなく統計勝負である意味を、自分の言葉で説明できる
いつ使うか / いつ使わないかの境界線を 1 分以内に判断できる
バリエーション軸（視点 / 制約 / フォーマット）で似ない 3 案を引き出せる
結果の比較に客観基準とチェックリストを当てられる
3 通り走らせるコスト試算ができ、過剰投資を避けられる
失敗パターン 5 つを覚え、再発を防ぐプロンプトテンプレートを持ち帰れる

所要時間 — 約 30 分（手を動かしながらなら 45 分） 難易度 — ★★☆☆☆（5-1 / 5-2 を読み終えていれば OK）

Best of N の発想 — 1 発勝負ではなく統計勝負

AI コーディングでも、ほとんどの人は無意識に 1 発勝負をしています。「ログイン画面を作って」と投げて、返ってきた 1 案に「うーん、惜しい」と感じ、追加プロンプトで直す。ループ 3〜5 回で 30 分がよくあるパターンです。

Best of N の発想は逆向きです。「最初から 3 通り出して」と頼んで、3 案を並べてから「B が一番近い、少しだけ修正して」と進めます。1 案 → 修正 → 1 案 → 修正の直列ループを、3 案を並列に作る + 1 回の選択にショートカットするわけです。

気づき

1 案目が当たる確率を上げるのがプロンプト 5-2 の話、N 案出して当たる確率を上げるのが Best of N の話です。

両者は対立しません。磨いたプロンプト × Best of N の組み合わせが、最も少ない試行回数でベストに到達します。雑なプロンプトで 5 案出しても、5 案とも雑なまま並ぶだけです。

なぜ 3 案を並べると速いのか

「3 案作ってから 1 つ選ぶ」ほうが「1 案を 3 回直す」より速い理由は 3 つあります。方向性のすり合わせが先に終わる（3 案並べた瞬間に意思決定が 30 秒で完了）、自分の好みが言語化される（「B が好き」の理由を考えると評価軸が顕在化）、コンテキスト消費が少ない（中間の往復が圧縮されて、第 9 章の ==/compact== 前にトークンを節約できる）。

直列ループ  依頼 → 案 1 → 直して → 案 2 → 直して → 案 3   合計 6 ターン
Best of N   依頼（3 案で）→ A・B・C → B を選んで少し直す   合計 3 ターン

半分の往復で同じ結論にたどり着きます。慣れてくると、Best of N をデフォルトの作業スタイルにする人も多くなります。

いつ使うか / いつ使わないか

Best of N は便利ですが、万能ではありません。解が 1 つに定まらない仕事すべてに有効です — デザイン・UI、API / DB 設計、アルゴリズム選択、文章生成（メール / PR タイトル / リリースノート）、リファクタ方針、アーキテクチャ、テスト戦略。共通するのは、「正解」がプロジェクトのフェーズや好みや制約で変わることです。

逆に、正解が 1 つに決まっている作業では Best of N はむしろ無駄です — バグ修正、フォーマット変換、単純なリネーム、仕様が明確な実装、CI / lint 設定。3 案出させても似たような実装が並ぶだけで、トークン代と時間の無駄になります。

ポイント

判断のショートカットは「他のエンジニア 5 人に同じ問題を渡したら、5 人とも同じ答えを書くか」という問いです。同じになるなら 1 発勝負、分かれるなら Best of N。

見落としやすい場面

意外と効くのに忘れがちなのは、プロンプト自体の設計（CLAUDE.md の章立てを 3 案、メタな仕事ほど効く）、コミットメッセージ / リリースノート（小さい仕事ほどコストが安く ROI が高い）、エラーメッセージの文言（「謝罪・案内・行動促し」の 3 トーンで UX が変わる）の 3 つ。

3 通り依頼の実例

ここから実際に使えるプロンプトを 3 つの領域で見ていきます。コピペして自分のプロジェクトに当てはめれば、今日から Best of N が回せます。

実例 1 — API 設計

新しい機能の API を設計するとき、REST / RPC / 状態遷移を URL に明示など方向性で答えが変わります。3 案を並べる典型例です。

> 「ユーザーの予約状態を管理する API」を、3 つの設計案で出して。

案 A — REST らしく、リソース指向（GET/POST/PATCH/DELETE /reservations）
案 B — RPC らしく、アクション指向（POST /reservations.create / .cancel）
案 C — 状態遷移を URL に明示（POST /reservations/:id/confirm）

各案について比較表で報告。
- 利点 / 欠点
- フロントエンドからの呼び分けやすさ
- 既存の openapi.yaml との一貫性
- マイクロサービス化したときの拡張余地

案 A / B / C の方向性をプロンプト側で先に決めておくのがコツです。「3 案出して」と丸投げすると、Claude Code は微差の 3 案を返してきます。軸を 3 つ用意することで、本当に違う 3 案になります。

実例 2 — 文章生成（リリースノート）

文章はとくにトーンと粒度で印象が変わる領域。リリースノート 1 本でも 3 案出してみる価値があります。

> 以下の Pull Request の内容から、ユーザー向けリリースノートを 3 案書いて。

PR 内容: ダッシュボードの読み込み速度を 4 秒 → 1 秒に短縮（キャッシュ層追加）

案 A — 技術的な詳細を含む（開発者ブログ向け、200 文字）
案 B — シンプルで一般ユーザー向け（変更内容のみ、80 文字）
案 C — マーケティング寄り（メリットを強調、120 文字）

それぞれ「想定読者」と「狙う印象」も 1 行で添えて。

案 A / B / C で読者を明確に分けるのがポイントです。同じ PR でも「開発者向け」「一般ユーザー向け」「マーケティング寄り」で良い文面はまったく違います。3 案並べて初めて、「うちのリリースノートのトーンは案 B 寄りだな」と気づけます。

Good

文章生成の Best of N は、トーンの差を「軸」として明示すると効きます。「丁寧 / カジュアル / ビジネスライク」「短く / 標準 / 詳細」「読者は経営層 / 開発者 / エンドユーザー」のように、軸を 2 つの形容詞で対比させると、Claude Code が確実にバラした 3 案を返してくれます。

実例 3 — リファクタ方針

「このコードをリファクタして」は、5-2 の失敗パターン「全部やって族」の典型例です。Best of N で 3 つの方針を先に出させる流れに変えると、安全に進められます。

> app/routes/dashboard.tsx をリファクタしたい。
> まず実装には入らず、3 つの方針を比較表で提示して。

案 A — 関心の分離を優先（データ・ロジック・表示を 3 ファイルに分割）
案 B — 1 ファイル内の整理を優先（同ファイル内で関数分割、diff 最小化）
案 C — Server Component への移行（クライアントロジックを Server Action に）

比較項目: 変更行数 / テスト影響 / リスク / 期待効果
私が 1 つ選んだら実装に進む。

「私が選ぶまで実装しない」の一文が、Best of N をリファクタで使うときのお守りです。これがないと、Claude Code は親切心で 3 案を全部実装し始めかねません。

プロンプトのバリエーション軸

3 案を出させるとき、軸が下手だと 3 案が似てしまいます。せっかく Best of N を回しても、微差の 3 案からは何も学べません。ここでは、現場で効きやすいバリエーション軸 3 種を紹介します。

軸 1 — 視点軸

同じ問題を「誰が見るか」で揺らす軸です。同じ機能でも、エンドユーザー視点と運用者視点では設計が変わります。

案 A — エンドユーザーが使いやすいことを最優先
案 B — 運用担当者がメンテしやすいことを最優先
案 C — 開発者が拡張しやすいことを最優先

役割を明示的に振ることで、3 案が確実にバラけます。5-2 で扱ったロールプレイ指示の応用形でもあります。「あなたは UX デザイナーとして」「あなたは SRE として」「あなたは開発リードとして」と振ることで、Claude Code がそれぞれの観点のチェックリストを内部で立てて返してくれます。

軸 2 — 制約軸

制約条件をずらす軸です。同じ機能でも、ライブラリの有無、行数制限、依存関係の許容度が違うと出てくるコードはまるで別物です。

案 A — 外部ライブラリ自由（react-hook-form + zod + radix-ui）
案 B — 既存依存のみで実装（追加 npm install なし）
案 C — Vanilla（フレームワーク・ライブラリの最小集合のみ）

制約軸の Best of N は、技術選定の前段階でとくに有効です。「ライブラリを足す価値があるか」を、実際のコード量で比較できるので、判断が一気に楽になります。

軸 3 — フォーマット軸

出力の見せ方を変える軸です。同じ情報でも、表 / 図 / 散文 / JSON で受け手の理解度が変わります。

案 A — Markdown 表（比較項目を列で並べる）
案 B — Mermaid 図（フローを視覚化）
案 C — JSON（自動処理しやすい構造化データ）

それぞれの「強み・弱み」と「向いている用途」を最後に 3 行でまとめて。

フォーマット軸は、ドキュメント作成や設計レビューでとくに価値が出ます。後で別ツール（Notion、Figma、社内 Wiki）に貼り直すなら、最初から貼り先に合う形を Best of N で見つけておくと、二度手間が消えます。

気づき

バリエーション軸の選び方が、Best of N の効果の 8 割を決めます。

3 案を出す前に、「この問題は、何の軸で揺らすと意思決定が前に進むか」を 30 秒考える癖をつけてください。視点 / 制約 / フォーマットの 3 種を頭に入れておけば、ほぼ全ての場面で軸の張り方は見つかります。

結果の比較方法 — 客観基準とチェックリスト

3 案を出させたあと、どう選ぶか。「なんとなく B が好き」だけで決めると、後で説明できない選択になります。チーム合意も難しくなります。

比較の鉄則 — 軸を 3 つに絞る

3 案を比較するとき、評価軸も 3 つに絞るのが鉄則です。10 個並べると判断不能になるので、プロジェクトの優先度からトップ 3 を選びます。

> 案 A / B / C を以下の 3 軸で評価し、表で示して。
軸 1 — 実装コスト（人月換算）
軸 2 — メンテナンスコスト（半年後の改修しやすさ）
軸 3 — リスク（壊れる可能性、依存の安定性）
最後にプロジェクト状況（中小向け、開発者 2 名）を踏まえて
おすすめを 1 つ選び理由を 3 行で。

Claude Code に推薦理由まで書かせるのが地味に効きます。3 案 + 比較表 + 推薦理由 + 自分の最終判断、というフローで判断の透明性が一気に上がります。

よくある評価軸

評価軸の候補は「実装コスト」「メンテコスト」「パフォーマンス」「可読性」「拡張性」「学習コスト」「依存リスク」「ユーザー体験」の 8 つを覚えておけば十分。「実装コスト + メンテコスト + 依存リスク」は社内ツールで効く 3 点セット、「ユーザー体験 + パフォーマンス + 可読性」はプロダクト機能で効く 3 点セット。フェーズに合わせて使い分けます。

客観基準を「数値」で持つ

比較を主観の言い合いにしないコツは、数値化できる軸を 1 つでも混ぜることです。実装コストは行数、パフォーマンスは初回ロード秒数、可読性は関数最大行数、依存リスクは追加 npm パッケージ数で数値化。1 つでも数値があると、「B が好き」が「B のほうが行数が 30% 少ない」に変わります。説明可能な判断は、チーム共有でも半年後の振り返りでも武器になります。

ポイント

比較表をそのままコミットして PR の説明に貼ると、設計決定の記録として最高の資産になります。半年後の自分（または後任）が「なぜこの設計にしたか」を一発で思い出せます。

コスト試算 — 3 通り走らせるとどれくらい

「Best of N って、3 倍のトークン使うんでしょ？」とよく聞かれます。実態を数値で見ておきます。

トークン消費の実感

3 案出させるときの実消費は単純な 3 倍ではないことが多いです。入力プロンプトは 1 回分しか課金されず、出力だけが N 倍されるため、合計は 1.5〜2 倍程度に収まります（入力 2,000 + 出力 1,500 → 入力 2,100 + 出力 4,000 で計 1.7 倍が典型）。Sonnet で 1 セッションあたり数円〜十数円の差。「30 分の意思決定を短縮できる」と考えれば ROI は圧倒的にプラスです。

頻度が高い場面（1 日 100 回投げる中重度ユーザー、大規模リファクタを丸ごと Best of N で進める場面）では、月数千〜数万円の差が出てきます。第 9 章で扱う ==/cost== コマンドで、Best of N を回したセッションのトークン消費を週 1 で確認しておくと、過剰投資の癖が早めに見つかります。

安く Best of N するコツ

コストを抑えるテクニックを 3 つ。軸だけ先に出させる（「3 案の方向性だけ 3 行ずつ」で軽く方針出し、選んでから 1 案だけフル実装）、Haiku で N 案 → Sonnet で詳細の 2 段構え、キャッシュを効かせる（入力トークンが 90% 引きになる）。

ポイント

「方向性だけ Best of N」は、コスパが圧倒的に高い使い方です。「3 案を 3 行ずつで概要だけ」と頼んで、選んだ 1 案だけ詳細実装。これだけで Best of N のコストは元の 1.2 倍程度に抑えられます。

失敗パターン

実務でやりがちな Best of N の失敗 5 つを整理します。出会ったら自分のプロンプトを 1 行ずつ見直してください。

Bad

失敗 5 つ

似通った 3 案 — 「3 案出して」と丸投げで微差の 3 案が並ぶ。A/B/C どれを選んでも結果が同じ
評価軸を決めずに比較開始 — 「全部それぞれ良さがあります」の役に立たない回答に
採用判断が曖昧 — 「結局 B にした」だけメモして次へ。半年後に理由を思い出せない
案が多すぎる — 5 案以上で薄っぺらく散り、結局直感で 1 つ選ぶ羽目に
「正解が 1 つ」の場面で使う — バグ修正・変換・リネームでトークン浪費

対処は次のとおりです。

失敗	即効処方
似通った 3 案	軸を明示的に振り分け（視点 / 制約 / フォーマット）
評価軸なし	プロンプト内で評価軸 3 つを指定し、3 案出力と比較を 1 プロンプトに
採用判断曖昧	選択理由を 3 行で残す（コミットメッセージ・PR・docs/decisions/）
案が多すぎ	3 案上限。多くても 5 案。少数精鋭が黄金比
場面違い	「5 人に頼んで答えが揃うか」で判定。揃うなら 1 発勝負

プロンプトテンプレート

すぐ使える形にまとめます。コピペして自分のプロジェクトに当てはめてください。

テンプレ 1 — 設計検討（API / アーキテクチャ向け）

[対象] を 3 つの設計案で出して。

案 A — [軸 1 の極]
案 B — [軸 2 の極]
案 C — [軸 3 の極]

各案で記述: 概要 3 行 / 主な API / データモデル影響 / 既存との整合性
比較軸: 実装コスト / メンテコスト / リスク
推薦: プロジェクト状況（[フェーズ / チーム規模]）を踏まえて 1 案 + 理由 3 行
重要: 私が選ぶまで実装しない

テンプレ 2 — 文章生成（リリースノート / メール文面向け）

[文章の用途] を 3 案書いて。

元情報: 変更点 / 読者 / 媒体
案 A — [トーン 1 と想定読者]
案 B — [トーン 2 と想定読者]
案 C — [トーン 3 と想定読者]
制約: 文字数上限、含めるキーワード、含めないもの
出力: 案ごとに「想定読者 / 狙う印象 / 本文」の 3 セクション

テンプレ 3 — リファクタ方針（コード変更向け）

[対象] のリファクタ方針を 3 つ提案。今回は実装しない。

案 A — 大胆な変更（関心の分離、ファイル分割）
案 B — 変更最小化（同ファイル内の整理）
案 C — 中庸

各案で記述: 概要 2 行 / 変更行数目安 / 触るファイル / テスト影響 / リスク
比較: 変更コスト / 期待効果 / リスク
進め方: 私が 1 つ選んだら、小さい diff 単位で実装に進む

ポイント

テンプレを「育てる」発想

3 つのテンプレは出発点です。プロジェクトの種類に合わせて、自分の標準形を作っていきましょう。「うちの場合はこの軸が必須」「比較表にはこの列が必要」のようなプロジェクト固有のチェックリストを、テンプレに足していくと、半年後には自分専用のプロンプト辞書ができあがります。

CLAUDE.md と組み合わせる

Best of N は CLAUDE.md と組み合わせるとさらに強力になります。プロジェクトのデフォルト評価軸を CLAUDE.md に書いておくと、毎回のプロンプトに軸を書かなくても、Claude Code が自動で当ててくれます。

## 設計判断の評価軸（優先順位順）
1. メンテコスト — 開発者 2 名、半年後の改修しやすさ最優先
2. 実装コスト — 短期で動かす必要あり、最小追加を優先
3. 依存リスク — 重要システムへの依存は避ける

## 3 案検討のデフォルト軸
- A: シンプル優先（既存依存のみ、変更最小）
- B: 拡張性優先（ライブラリ追加可、将来を見越す）
- C: パフォーマンス優先（コードが増えても速さ重視）

これを書いておけば「3 案で出して」とだけ言うだけで軸が自動適用され、プロンプトが短くなり結果は安定します。

気づき

==CLAUDE.md = チームの評価軸の合意書、Best of N = それを毎回適用する儀式。毎回プロンプトに書いている軸を見つけたら、CLAUDE.md に昇格== させるサインです。

まとめ

このレッスンのポイントを 6 点で振り返ります。

Best of N は 1 発勝負ではなく統計勝負。3 案を並列に出させてベストを選ぶ
使うのは解が 1 つに定まらない仕事（設計・文章・リファクタ）。正解が 1 つの作業には使わない
バリエーション軸は「視点 / 制約 / フォーマット」の 3 種
評価軸は 3 つに絞る。1 つは数値化できる軸を入れる
コストは単純 3 倍ではなく 1.5〜2 倍。「方向性だけ Best of N」が最もコスパが高い
失敗 5 つ — 似通った 3 案 / 評価軸なし / 採用判断曖昧 / 案を出しすぎ / 場面違い

章末演習

章末演習 — 30 分で Best of N を 1 回実践しましょう。

今あなたが直面している意思決定を 1 つ思い出す（API 設計、UI、リファクタ、リリースノート、なんでも OK）
軸を「視点 / 制約 / フォーマット」のどれかから選び、3 つの極を 1 行ずつ書く
評価軸を 3 つ決める。少なくとも 1 つは数値化できる軸にする
テンプレ 1〜3 から該当するものを選び、テンプレに沿って Claude Code に投げる
出てきた 3 案 + 比較表を見て、選んだ理由を 3 行で残す
余裕があれば、選択理由をプロジェクトの CLAUDE.md に「設計判断の評価軸」として昇格させる

次のレッスン 6-1: はじめての Web アプリでは、ここまでの CLAUDE.md × プロンプト 5 大原則 × Best of N をフル動員して、実際に動く Web アプリをゼロから作っていきます。第 5 章で身につけた言語化と設計の力が、次の章でいよいよ目に見える成果物になります。