Claude が突然アップデートされました。Sonnet 4.6 が正式に登場し、前世代の主力モデルを直接置き換えました。
今回、Anthropic は 100 万トークンのコンテキストウィンドウをベータ版に解放しました。
価格は変更なく、引き続き 100 万トークンあたり 3 ドル/15 ドルです。
しかし、コーディング能力においては前世代を大幅に凌駕しており、早期ユーザーの 59% が、2025 年 11 月にリリースされたフラッグシップモデル Opus 4.5 よりも使いやすいと評価しています。
これまで Opus クラスのモデルでしか処理できなかった重たいタスクを、Sonnet 4.6 はより安価で実行できるようになりました。
核心的なアップグレード点は非常に集中しています:コーディング、コンピュータ操作(Computer Use)、長文脈推論、およびエージェント計画です。
開発者からのフィードバックは直接的です:手抜きをせず、嘘をつかず、論理の再利用能力が大幅に向上しました。
Claude Code 環境でのテストでは、ユーザーの 70% が Sonnet 4.5 よりも新モデルを好んで使用しています。
フロントエンドコードと財務分析での表現が特に優れており、生成される視覚効果のレイアウトがより合理化され、デザイン感やアニメーション効果まで備えています。
コンピュータ操作能力(Computer Use)が今回の目玉機能です。
専用 API に依存せず、モデルは人間のように画面を見て、マウスを動かし、キーボードを叩きます。
OSWorld ベンチマークテストにおいて、Sonnet 4.6 は高スコアを記録しただけでなく、複雑なスプレッドシートのナビゲーションや多段階のウェブフォーム入力において、人間レベルの能力を発揮しました。
顶尖な人類専門家にはまだ及ばないものの、初期バージョンのぎこちなさと比較すると、その進化の速度は目に見えて明らかです。
セキュリティ面では、プロンプトインジェクション(Prompt Injection)攻撃に対する防御力が大幅に向上し、Opus 4.6 と同等の性能を示しています。
長いコンテキストウィンドウは、単に多くの情報を保持できるだけでなく、「考える」ことができるようになりました。
Vending-Bench Arena ビジネスシミュレーションテストでは、長期的な戦略を立てることを学びました。
最初の 10 ヶ月は生産能力拡大のために資金を投入し続け、最終段階で急速に収益モデルへ転換し、最終的に利益面で競合を圧倒しました。
これほど大きな時間跨度での計画能力は、新しいコンテキスト圧縮技術によるものです。
対話が上限に近づくと、モデルは自動的に古い情報を要約してパッケージ化し、新しい思考のためのスペースを確保します。
開発者プラットフォームでは、適応的思考と拡張思考が同時に解放されました。
API 側の検索ツールは、データをクリーニングするためのコードを自ら作成し、有用な情報だけをモデルに供給することを学び、トークンの節約と効率化を実現しました。
Excel プラグインも MCP プロトコルに対応しました。
S&P Global や FactSet といった専門的な金融データを、表計算ソフトから離れることなく直接呼び出せるようになり、Pro および Enterprise ユーザーはすぐに利用可能です。
現在、https://claude.ai、API、および主要なクラウドプラットフォームですべて実装済みです。
無料版ユーザーも今回、強制的に Sonnet 4.6 へアップグレードされ、ファイル作成およびコネクタ機能が解放されました。
いち早く試したい開発者は、API コード claude-sonnet-4-6 ですぐに実行可能です。