Claude Sonnet 4.6 登場：100 万トークンのコンテキストウィンドウを解放、Opus 4.5 を凌駕する性能

Claude が突然アップデートされました。Sonnet 4.6 が正式に登場し、前世代の主力モデルを直接置き換えました。

今回、Anthropic は 100 万トークンのコンテキストウィンドウをベータ版に解放しました。

価格は変更なく、引き続き 100 万トークンあたり 3 ドル/15 ドルです。

しかし、コーディング能力においては前世代を大幅に凌駕しており、早期ユーザーの 59% が、2025 年 11 月にリリースされたフラッグシップモデル Opus 4.5 よりも使いやすいと評価しています。

これまで Opus クラスのモデルでしか処理できなかった重たいタスクを、Sonnet 4.6 はより安価で実行できるようになりました。

核心的なアップグレード点は非常に集中しています：コーディング、コンピュータ操作（Computer Use）、長文脈推論、およびエージェント計画です。

開発者からのフィードバックは直接的です：手抜きをせず、嘘をつかず、論理の再利用能力が大幅に向上しました。

Claude Code 環境でのテストでは、ユーザーの 70% が Sonnet 4.5 よりも新モデルを好んで使用しています。

フロントエンドコードと財務分析での表現が特に優れており、生成される視覚効果のレイアウトがより合理化され、デザイン感やアニメーション効果まで備えています。

コンピュータ操作能力（Computer Use）が今回の目玉機能です。

専用 API に依存せず、モデルは人間のように画面を見て、マウスを動かし、キーボードを叩きます。

OSWorld ベンチマークテストにおいて、Sonnet 4.6 は高スコアを記録しただけでなく、複雑なスプレッドシートのナビゲーションや多段階のウェブフォーム入力において、人間レベルの能力を発揮しました。

顶尖な人類専門家にはまだ及ばないものの、初期バージョンのぎこちなさと比較すると、その進化の速度は目に見えて明らかです。

セキュリティ面では、プロンプトインジェクション（Prompt Injection）攻撃に対する防御力が大幅に向上し、Opus 4.6 と同等の性能を示しています。

長いコンテキストウィンドウは、単に多くの情報を保持できるだけでなく、「考える」ことができるようになりました。

Vending-Bench Arena ビジネスシミュレーションテストでは、長期的な戦略を立てることを学びました。

最初の 10 ヶ月は生産能力拡大のために資金を投入し続け、最終段階で急速に収益モデルへ転換し、最終的に利益面で競合を圧倒しました。

これほど大きな時間跨度での計画能力は、新しいコンテキスト圧縮技術によるものです。

対話が上限に近づくと、モデルは自動的に古い情報を要約してパッケージ化し、新しい思考のためのスペースを確保します。

開発者プラットフォームでは、適応的思考と拡張思考が同時に解放されました。

API 側の検索ツールは、データをクリーニングするためのコードを自ら作成し、有用な情報だけをモデルに供給することを学び、トークンの節約と効率化を実現しました。

Excel プラグインも MCP プロトコルに対応しました。

S&P Global や FactSet といった専門的な金融データを、表計算ソフトから離れることなく直接呼び出せるようになり、Pro および Enterprise ユーザーはすぐに利用可能です。

現在、https://claude.ai、API、および主要なクラウドプラットフォームですべて実装済みです。

無料版ユーザーも今回、強制的に Sonnet 4.6 へアップグレードされ、ファイル作成およびコネクタ機能が解放されました。

いち早く試したい開発者は、API コード claude-sonnet-4-6 ですぐに実行可能です。