Windowsの「夢のマシン」がついに登場、あなたのPCがAIエージェントの仕事場に

マイクロソフトとOpenAIの蜜月時代は、かつてAI業界全体における最も重要な同盟だった。

一方はモデルを握り、もう一方はクラウドサービス、オフィスソフト、開発者ツール、法人顧客を掌握し、両者は互いに補完し合い、マイクロソフトにAI時代の特別席の切符をほぼ手にさせた。しかし、どんなに同盟が緊密でも、マイクロソフトが最も重要なAIの未来像を他人に預け続けることは永遠にはできない。

特に両者の関係が疎遠になり始めた今はなおさらだ。

そのため、先ほど開催されたBuild 2026は特別な意味を持つ発表会となった。マイクロソフトはかつてなくAIでの痛快な勝利を必要としており、自らがAI時代の主役なのか、それとも依然としてOpenAIのクラウドサービスプロバイダーに過ぎないのかを、世間に証明しなければならなかった。

MAIモデル、Azure AI Foundry、量子コンピューティング、そしてローカルのAIエージェント能力に加え、ジェンスン・フアンと「The Lobster」の父が相次いで登壇したことで、マイクロソフトは開発、モデル、データ、計算能力、ガバナンスを網羅した完全なエコシステムを示した。その目標は明確だ：AIをOpenAI主導のモデル収益から、マイクロソフト主導のプラットフォームビジネスへと転換すること。

マイクロソフト自社開発モデルが発表され、MAIがAIサプライチェーンの最も重要なピースを埋める

昨年と比較して、マイクロソフトは今回、モデルをより重要な位置に据えた。マイクロソフトCEOのサティア・ナデラ氏は、Microsoft Foundryでは現在、OpenAI、Anthropic、そしてマイクロソフト自社開発のMAIモデルを含め、1万1000以上のモデルが利用可能だと述べた。

マイクロソフトの判断は、企業や開発者はすべてのタスクを一つのモデルだけに依存するわけではない、というものだ。異なるタスクには異なるモデルが対応し、レイテンシ、コスト、能力の境界によって制約を受ける。したがって、モデルカタログ、モデル選択、実行環境、そして企業ガバナンスが、新たなプラットフォーム競争の焦点となるだろう。

本日、マイクロソフトの自社開発モデルファミリーは、推論、コード、画像、音声、文字起こしなどの領域をカバーする7つの新モデルを一気に発表した。

MAI Thinking 1は、推論モデルだ。このモデルはスパースMoEアーキテクチャを採用し、350億のアクティブパラメータ、総パラメータ数は約1兆、256Kトークンのコンテキストをサポートし、約600ページの文書を収容できる。

マイクロソフトのAI責任者であるムスタファ・スレイマン氏は、このモデルはサードパーティモデルからの蒸留を行っておらず、トレーニングデータはクリーンでコンプライアンスに準拠したライセンスデータから来ており、事前学習ではAI生成コンテンツを排除していると強調した。現在、Microsoft Foundryでプライベートプレビューが提供されており、後にMAI Playgroundでパブリックベータ版が提供される予定だ。

コードモデル MAI Code 1 Flashは、日々の開発ワークフローを対象としている。マイクロソフトがエンドツーエンドでトレーニングし、クリーンでコンプライアンスに準拠したライセンスデータを使用しており、Visual Studio CodeのGitHub Copilot個人ユーザー向けに提供されており、モデルセレクターとデフォルトの自動セレクターから利用できる。

マイクロソフトによると、このモデルはGitHub Copilotハーネス向けにトレーニングと適合が行われており、エージェント駆動型コーディング（Agentic coding）と、アダプティブ思考をサポートしている。単純な要求には簡潔に対応し、複雑なタスクにはより多くの推論予算を投入する。

マイクロソフトはMAI Code 1 Flashを、直接Claude Haiku 4.5と比較した。

MAI Code 1 Flashは、SWE Bench Proで51.2%に達し、Claude Haiku 4.5の35.2%を上回った。IF Benchの正確な指示追従では28.9ポイントリードし、Advanced IFでは14.5ポイントリードした。これは、マイクロソフトのGitHub Copilotの一般的なコーディングシナリオ、特にコード修正、複数回の指示、そして実際の開発環境におけるエージェントタスクを支えることになる。

画像モデルと音声モデルもMAI体系に組み込まれた。

MAI Image 2.5とFlashバージョンは、テキストからの画像生成と画像編集をサポートし、すでにPowerPointに導入されており、OneDriveやFoundryにも拡張される予定だ。

MAI Transcribe 1.5は43言語をサポートし、マイクロソフトはその速度が競合の5倍に達すると述べており、GitHub、Teams、Copilot、Dynamics 365 Contact Centerに統合されている。

MAI Voice 2は15言語をサポートし、短いサンプルで音声の適応が可能であり、同時に悪用防止機能も内蔵している。低コスト版のMAI Voice 2 Flashも計画中だ。

また、マイクロソフトはMAIモデルを自社チップと結びつけた。MAI Thinking 1はMaia 200向けに最適化されており、エンドツーエンドでMAIモデルを実行すると、ワット当たりの性能が1.4倍向上する。

企業向けカスタマイズもMAIモデルの重要な方向性だ。将来的には、すべての企業がモデルを呼び出すだけでなく、自社のプロセスをモデルにトレーニングしていくことになるだろう。

そのために、マイクロソフトはMicrosoft Frontier Tuningも発表した。その中核は「強化学習環境」だ。企業は実際の作業軌跡、タスクのステップ、意思決定、ツールの呼び出し、評価基準をトレーニング環境に変換し、モデルに組織内部の働き方を学ばせることができる。

PCがエージェントの職場に、あなたのデスクトップがデータセンターになる

モデルに加えて、マイクロソフトはローカルコンピューティングパワーにも重点を移した。

Surface RTX Spark Dev Boxは、この分野で最も注目すべき製品だ。ナデラCEOは、開発者向けの「夢のマシン（ドリームマシン）」と呼んだ。このデバイスは、1ペタフロップスのAIコンピューティング能力、20のCPUコア、128GBのユニファイドメモリを提供し、今年秋に発売予定だ。

Surface RTX Spark Dev Boxは、Nvidia RTX Sparkプラットフォームをベースにしている。APPSOが数日前に報じたように、RTX SparkはPC向けの次世代SoCだ。CPU、GPU、AI機能を1つのチップに統合し、ユニファイドメモリアーキテクチャと統合DRTMをサポートする。

NVIDIAのCEO、ジェンスン・フアン氏はビデオ中継で、PCはパーソナルコンピューターからパーソナルAIへと進化していると述べた。彼は例を挙げて、ユーザーが外出中に自分のPCにメッセージを送り、ローカルのエージェントにツールの呼び出し、コードの修正、デザインの推進を依頼し、さらにユーザーと反復作業を続けることができると説明した。

PCはもはや人が操作する単なる道具ではなく、継続的にタスクを実行できるAIアシスタントにもなり始めている。

さらに、マイクロソフトはSurface RTX Spark Dev Boxに、開発用に最適化されたWindows 11 Proをプリインストールし、VS Code、WSL、PowerShell 7、GitHub Copilot、Coreutils for Windowsなどのツールを内蔵している。

デモでは、このデバイスはデフォルトでニュースフィード、ウィジェットのポップアップ、通知が表示されず、ダークモードが使用されていた。Windows Insiderバージョンでは垂直タスクバーも追加されており、開発ツールがさらにシステム化され、コマンドラインとコンテナの体験もLinuxに近づいている。

ハードウェア面では、アルマイト処理されたアルミニウム合金の3Dプリント一体型ボディを採用し、1000個の通気孔を備え、熱設計電力は100W、インターフェースはUSB-C、USB-A、HDMI、イーサネット、ヘッドフォンジャックを含む。

WindowsはAI時代に大きく貢献するだろう。ローカルAIは、PCをエージェントワークフローの一部にする。開発者はローカルでデバッグ、モデルの実行、ツールの呼び出し、ログの確認、コンテナの起動、サブエージェントの実行を行い、より大規模なタスクをクラウドに任せることができる。

エージェントには新しい入口が必要、マイクロソフトが次世代AI端末を模索

Surface RTX Spark Dev Boxが開発者向けであるのに対し、Project Solaraは、マイクロソフトによるエージェントデバイスの形態への早期の試みのように見える。次のコンピューターは単一のデバイスではなく、連携して動作するデバイスの集合体になる。

マイクロソフトは2種類のリファレンスデバイスを展示した。

1つ目は、MediaTekチップをベースにした、デスクトップに固定するワークターミナルだ。

ユーザーが近づくと、システムが安全に本人確認を行い、ユーザーを自身のエージェント作業環境に入れ、Work IQベースのMicrosoft 365 Copilotにアクセスできる。

当日の重要な予定を表示したり、タップや音声でエージェントにタスクを処理させたり、Windows PCのコンパニオンとして、あるいはWindows 365経由でCloud PCにアクセスしたりできる。これは、企業のオフィスデスクにあるエージェント制御ターミナルに近い。本人確認、タスクリマインダー、音声インタラクション、Copilotの呼び出し、Cloud PCアクセスを担当する。

2つ目は、Qualcommのウェアラブルチップを使用した、モバイルワークシーン向けのデジタル社員証だ。

デモでは、ユーザーが指紋認証でロック解除した後、CopilotにSNS投稿用の現場素材の収集を依頼した。社員証は映像を撮影し、エージェントがショットを選び、映像をクリーンアップし、本人とチームにレビュー用に送信した。発表会では医療シーンも示された：看護師がこれを使用してハンズフリーで音声記録を取り、話者を区別し、バイタルサインを検証し、薬剤をスキャンしてケアプロセスを確認する、といった具合だ。

これら2種類のデバイスは、あくまでリファレンス形態である。

スマートフォンとPCは依然として重要だが、一部の作業シナリオでは、人、空間、センサーにより近いハードウェアが必要となる。将来のエージェント時代において、企業はエージェントを交換し、外観、画面、センサー、入力方式を調整して、同一のハードウェアとソフトウェア基盤の上で異なる業種に適応させることができる。

「The Lobster」の父が登壇、マイクロソフトが個人エージェントに企業のガードレールを追加

Surface RTX Spark Dev Boxはローカルコンピューティングについて、Project Solaraは新しいデバイス形態について語ったが、OpenClaw on Windowsは個人エージェントがどのように安全に企業へ参入するかに焦点を移した。

マイクロソフトは、OpenClaw向けのWindowsスイートを披露した。これは、ユーザーが自身のOpenClawをセットアップしたり、WindowsやWSL内で既にホストされているOpenClawに接続したりするのに役立つ。

アプリ内では、ゲートウェイ、OpenClawに参加している他のマシン、セッション、使用状況を確認でき、チャット、キャンバス、メインコンソールにも素早く移動できる。

セキュリティデモはファイル権限を中心に展開された。

OpenClaw Windows Companionアプリでは、ユーザーはエージェントがアクセスできるフォルダと、それらのフォルダが読み取り専用か、書き込み可能か、非表示かを制御できる。また、クリップボードアクセスやネットワーク権限などの詳細なオプションも設定できる。

マイクロソフトはその場で、OpenClawにデスクトップ上の全ファイルの削除を要求し、OpenClaw自身のセキュリティレイヤーを一時的に無効にして、MXCのシステムレベル制限のみを残した。デスクトップフォルダは読み取り専用に設定されていたため、OpenClawは削除とディレクトリの確認を何度も試みたものの、最終的にファイルを削除できず、デスクトップ上の94枚のJPGファイルは保持された。

「The Lobster」の父、ピーター・シュタインベルガー氏も、ここ数カ月、OpenClawがMicrosoft、GitHub、OpenAI、Nvidiaなどのチームと協力し、可観測性と自動権限モードを追加し、アクセス制御を再設計したことを明らかにした。現在、権限はもはや「全て許可」か「全て禁止」だけでなく、ユーザーはどのフォルダを読み取り専用、書き込み可能、またはエージェントから非表示にするかを指定できる。

また、彼はOpenClawが企業内部で実行可能であり、ハーネス自体がすでにプラグイン化されていると発表した。企業は信頼するCopilotやCodex、その他のシステムを接続し、既存のルールをOpenClawに持ち込むことができる。さらに、持続的メモリ、ハートビート、SlackやTeams内でOpenClawを使用する能力も得られる。

AI後半戦、マイクロソフトは企業プラットフォームの入口を狙う

前述のハードウェアとWindowsのアップデートに加えて、マイクロソフトはさらに多くの製品を発表した。

開発ツール面では、マイクロソフトは新しいGitHub Copilotアプリを発表した。これは、エージェントコーディングセッションマネージャーに近い。開発者は複数のIssueセッションを同時に起動し、Git worktreeで分離して、複数のエージェントを並行して作業させることができる。

Agent Mergeは、PRのCIチェック、コードレビュー、マージコンフリクトの追跡を担当する。マイクロソフトはRavenも発表した。これはエージェントファーストのSDKで、Backend as a Serviceに接続し、認証、ストレージ、データベーススキーマなどのバックエンド問題を処理する。

コンテキスト能力はWeb IQが担う。

エージェントが企業プロセスに参入するには、ネットワークの新情報、企業のビジネスオブジェクト、リアルタイムの運用状況、人的関係、組織プロセスに接続する必要がある。Web IQは外部のネット情報を担当し、ウェブページ、ニュース、画像、動画をサポートする。モデルに依存せず、MCPネイティブで、あらゆるエージェントランタイムに接続でき、エージェントの回答をより新しく、検証可能なコンテンツに基づかせる。

Copilotも、より複雑なワークの入口へとアップグレードしている。

ナデラ氏は、今年の夏にチャット、コワーク、コードを一つのCopilotに統合し、Autopilotsをリリースすると発表した。最初のAutopilotはScoutと名付けられ、Copilot Frontierユーザー向けに提供され、TeamsのグループチャットやOutlookのスレッド内で動作する。

企業ガバナンスレベルでは、マイクロソフトはAgent 365を発表した。これはエージェントにID、権限、アクセス制御、コンプライアンス管理を提供し、Entra、Defender、Purviewに接続する。Agent 365は、Azure、AWS、GCP、またはその他の環境でホストされているエージェントを管理でき、異なるフレームワークで構築されたエージェントもサポートする。

科学研究の方向性としては、Microsoft Discoveryだ。ナデラ氏はこれを、科学的発見のためのエージェントプラットフォームと定義し、論文研究、候補案生成、シミュレーション計算、実験デザイン、自動化ラボを連続したプロセスにつなげることを目指している。

発表会の最後に、マイクロソフトは次世代量子チップMajorana 2も正式に発表した。その量子ビットの平均寿命は20秒に達し、最大で1分近くになり、Majorana 1の約1000倍に向上した。操作時間は1マイクロ秒、サイズは依然として0.01mmスケールで、完全デジタル制御を採用している。

これで、このパズルのように巨大で野心に満ちた発表会はついに完結した。AIの第一段階では、業界の物語を主導したのはモデル企業だった。第二段階で、産業の実装を主導する可能性が高いのはプラットフォーム企業だ。

誰がモデルを選択し、誰がタスクを割り当て、誰がエージェントを管理し、誰が権限と監査を定義するか、これらの問いへの回答を握る者が、企業AIの中核的な入口に最も近づく。モデルが次第に標準機能となるにつれ、価値の帰属を最終的に決めるのは、これらのモデルの実行を支えるシステムになるだろう。

かつてAI時代の特別席の切符は、同盟者であるOpenAIの力を大いに借りて手に入れたものだった。しかし、今やマイクロソフトは自らコックピットに座り、この飛行機の針路を自ら引き継ごうとしている。

Windowsの「夢のマシン」がついに登場、あなたのPCがAIエージェントの仕事場に

関連記事

分享網址