アドバイザー戦略:エージェントにインテリジェンスの強化を

知的能力とコストのバランスを最適化したい開発者の間で、「アドバイザー戦略」と呼ばれる手法が注目を集めています。Opusをアドバイザーとして、SonnetまたはHaikuを実行者として組み合わせることで、コストはSonnetレベルに抑えながら、エージェントにOpusに近い知的能力を持たせることができます。

本日、Claude Platformにアドバイザーツールを導入し、アドバイザー戦略をAPI呼び出しの1行で実現できるようにしました。

アドバイザー戦略でコスト効率の良いエージェントを構築

アドバイザー戦略では、SonnetまたはHaikuが実行者としてタスクを最初から最後まで実行し、ツールを呼び出し、結果を読み取り、解決策に向けて反復します。実行者が適切に解決できない決定に直面した場合、アドバイザーとしてOpusに相談します。Opusは共有コンテキストにアクセスし、計画、修正、または停止信号を返し、実行者が処理を再開します。アドバイザーはツールを呼び出したり、ユーザー向けの出力を生成したりせず、実行者へのガイダンスのみを提供します。

これは、より大きなオーケストレーターモデルが作業を分解し、より小さなワーカーモデルに委任する一般的なサブエージェントパターンとは逆のアプローチです。アドバイザー戦略では、より小さくコスト効率の良いモデルが、分解やワーカープール、オーケストレーションロジックなしで処理を主導し、必要に応じて上位モデルにエスカレーションします。最先端レベルの推論は実行者が必要とするときにのみ適用され、それ以外は実行者レベルのコストで実行されます。

当社の評価では、OpusをアドバイザーとしたSonnetは、Sonnet単体と比較してSWE-bench Multilingual1で2.7ポイント向上し、エージェントタスクあたりのコストを11.9%削減しました。

アドバイザーツール

アドバイザーツールとして、アドバイザー戦略をAPIに導入しています。これは、SonnetとHaikuが特定のタスクでガイダンスや支援が必要なときに呼び出すことを認識しているサーバーサイドツールです。

当社の評価では、Opusアドバイザー付きのSonnetは、BrowseComp2とTerminal-Bench 2.03ベンチマークでスコアが向上し、Sonnet単体よりもタスクあたりのコストが低くなりました。

アドバイザー戦略は、Haikuを実行者として使用することもできます。BrowseCompでは、Opusアドバイザー付きのHaikuは41.2%を記録し、単体の19.7%の倍以上となりました。Opusアドバイザー付きのHaikuは、スコアではSonnet単体より29%劣りますが、タスクあたりのコストは85%低くなります。アドバイザーはHaiku単体に比べてコストが追加されますが、合計価格はSonnetのコストの一部であり、知的能力とコストのバランスが必要な大量タスクに適しています。

Messages APIリクエストでadvisor_20260301を宣言すると、モデルの引き継ぎは単一の/v1/messagesリクエスト内で行われ、追加の往復やコンテキスト管理は不要です。実行者モデルがいつ呼び出すかを決定します。呼び出されると、選別されたコンテキストをアドバイザーモデルにルーティングし、計画を返し、実行者が同じリクエスト内で継続します。

response = client.messages.create(
    model="claude-sonnet-4-6",  # 実行者
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
            "max_uses": 3,
        },
        # ... 他のツール
    ],
    messages=[...]
)

# アドバイザートークンはusageブロックで
# 個別に報告されます。

料金。アドバイザートークンはアドバイザーモデルのレートで、実行者トークンは実行者モデルのレートで請求されます。アドバイザーは短い計画(通常400〜700テキストトークン)のみを生成し、実行者が低いレートで全出力を処理するため、全体的なコストはアドバイザーモデルをエンドツーエンドで実行するよりはるかに低くなります。

組み込みのコスト制御。max_usesを設定して、リクエストごとのアドバイザー呼び出しを制限できます。アドバイザートークンはusageブロックで個別に報告されるため、ティアごとの支出を追跡できます。

既存のツールと併用可能。アドバイザーツールはMessages APIリクエストの別のエントリに過ぎません。エージェントはWebを検索し、コードを実行し、同じループでOpusに相談できます。

お客様の声

「複雑なタスクではより良いアーキテクチャの決定を行い、単純なタスクではオーバーヘッドを追加しません。計画と軌跡は劇的に異なります。」
— Eric Simmons、Bolt CEO兼創業者

「エージェントのターン数、ツール呼び出し、全体的なスコアで明確な改善が見られました。自社で構築した計画ツールよりも優れています。」
— Kay Zhu、Genspark共同創業者兼CTO

「構造化されたドキュメント抽出タスクにおいて、アドバイザーツールはHaiku 4.5が複雑さに応じてOpus 4.6に相談して動的に知的能力をスケールすることを可能にし、最先端モデルの品質を5分の1のコストで実現します。」
— Anuraj Pandey、Eve Legal 機械学習エンジニア

始めに

アドバイザーツールは現在、Claude Platformでベータ版として利用可能です。始めるには:

  1. ベータ機能ヘッダーを追加:anthropic-beta: advisor-tool-2026-03-01
  2. Messages APIリクエストにadvisor_20260301を追加
  3. ユースケースに応じてシステムプロンプトを変更

既存の評価スイートをSonnet単体、Opusアドバイザー付きSonnet実行者、Opus単体に対して実行することをお勧めします。詳細はドキュメントをご覧ください。

脚注

  1. SWE-bench Multilingual: Sonnet 4.6単体はアダプティブ思考を使用しました。Sonnet 4.6 + アドバイザーは、思考をオフにしたコーディング用の推奨システムプロンプトを使用しました。両方の実行は、bashとファイル編集ツールでハイエフォートを使用しました。スコアは9言語にわたる300問の5回の試行の平均です。すべての実行でOpus 4.6がアドバイザーモデルとして使用されました。
  2. BrowseComp: すべての実行は、思考をオフにし、Web検索とWebフェッチツールを使用しました。Sonnet 4.6実行はミディアムエフォートを使用しました。Sonnet 4.6 + アドバイザーはコーディング用の推奨システムプロンプトを使用し、Haiku 4.5 + アドバイザーは使用しませんでした。プログラムによるツール呼び出しやコンテキスト圧縮はありません。スコアは、1,266問を各問題1回の試行に基づいています。すべての実行でOpus 4.6がアドバイザーモデルとして使用されました。
  3. Terminal-Bench 2.0: すべての実行は、思考をオフにし、bashとファイル編集ツールを使用しました。Sonnet 4.6実行はミディアムエフォートを使用しました。アドバイザー実行はいずれもコーディング用の推奨システムプロンプトを使用しませんでした。各タスクは、3倍のリソース割り当てと1倍のタイムアウトを持つ分離されたポッドで実行されました。スコアは、89タスクにわたる各タスク5回の試行の平均です。すべての実行でOpus 4.6がアドバイザーモデルとして使用されました。
関連記事

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.