剛剛,Windows「夢幻神機」降臨,把你的 PC 變成 AI 代理工作站

微軟和 OpenAI 的蜜月期,曾是整個 AI 產業最重要的聯盟。

一方握有模型,另一方掌握雲端服務、辦公軟體、開發者工具和企業客戶,雙方相輔相成,幾乎讓微軟在 AI 時代提前拿到了頭等艙門票。但即便聯盟再緊密,微軟也不能永遠把最關鍵的 AI 想像力寄託在別人身上。

特別是在雙方關係開始脫鉤之後。

微軟與 OpenAI 關係示意圖

剛剛登場的 Build 2026 也因此變成一場特別的發表會。微軟比以往任何時候都更需要一場酣暢淋漓的 AI 勝利,向外界證明自己究竟是 AI 時代的主角,還是依舊只是 OpenAI 的雲端服務商?

從 MAI 模型、Azure AI Foundry、到量子運算以及本地智慧代理能力,再加上黃仁勳和龍蝦之父的相繼站台,微軟展示了一整套覆蓋開發、模型、數據、算力和治理的完整生態系,其目標也很清晰:將 AI 從 OpenAI 主導的模型紅利,轉變為微軟主導的平台生意。

微軟自研模型發表,MAI 補上 AI 供應鏈最關鍵一環

比起去年,微軟這次把模型放在了更重要的位置。微軟執行長納德拉稱,Microsoft Foundry 目前已有超過 11,000 個模型,覆蓋 OpenAI、Anthropic 和微軟自研 MAI 模型。

微軟的判斷是,企業和開發者不會只依賴一個模型完成所有任務。不同任務會對應不同模型,也會受到延遲、成本和能力邊界的約束。因此,模型目錄、模型選擇、運行環境和企業治理,會一起構成新的平台競爭點。

今天,微軟自研模型家族正式一口氣推出了七款新模型,涵蓋推理、程式碼、圖像、語音和轉錄等方向。

微軟 MAI 自研模型家族

MAI Thinking 1 是其中的推理模型。它採用稀疏 MoE 架構,35B 活躍參數,總參數規模約 1T,支援 256K token 上下文,足以容納大約 600 頁文件。

微軟 AI 負責人穆斯塔法·蘇萊曼強調,這個模型沒有使用第三方模型蒸餾,訓練數據來自乾淨且合規授權的數據,並在預訓練中排除了 AI 生成內容。它已在 Microsoft Foundry 私有預覽,之後會進入 MAI Playground 公測。

MAI Thinking 1 架構圖

程式碼模型 MAI Code 1 Flash 面向日常開發工作流程。它由微軟端到端訓練,使用乾淨且合規授權的數據,正在向 Visual Studio Code 中的 GitHub Copilot 個人用戶推出,入口包括模型選擇器和預設自動選擇器。

MAI Code 1 Flash 在 VS Code 中運行

微軟稱,這個模型針對 GitHub Copilot harness 做了訓練和適配,支援代理式編碼,也支援自適應思考。簡單請求保持簡潔,複雜任務會投入更多推理預算。

微軟把 MAI Code 1 Flash 直接拿來和 Claude Haiku 4.5 比較。

MAI Code 1 Flash 在 SWE Bench Pro 上達到 51.2%,高於 Claude Haiku 4.5 的 35.2%;在 IF Bench 精確指令跟隨上領先 28.9 分,在 Advanced IF 上領先 14.5 分。它將支撐微軟 GitHub Copilot 的常見編碼場景,尤其是程式碼修改、多輪指令和真實開發環境裡的 Agent 任務。

圖像和語音模型也被納入 MAI 體系。

MAI Image 2.5 和 Flash 版本支援文本生成圖像和圖像編輯,已經進入 PowerPoint,並會擴展到 OneDrive 和 Foundry。

MAI Image 模型展示

MAI Transcribe 1.5 支援 43 種語言,微軟稱其速度達到競品 5 倍,正在整合到 GitHub、Teams、Copilot 和 Dynamics 365 Contact Center。

MAI Transcribe 1.5 語音轉錄示意圖

MAI Voice 2 支援 15 種語言,可透過短樣本適配聲音,同時內建防濫用保護;低成本版本 MAI Voice 2 Flash 也在計劃中。

MAI Voice 2 語音合成展示

微軟還把 MAI 模型和自己的晶片聯繫起來。MAI Thinking 1 已針對 Maia 200 優化,端到端運行 MAI 模型時,還能獲得 1.4 倍每瓦效能提升。

MAI 模型在 Maia 200 晶片上的優化

企業定製也是 MAI 模型的重要方向。未來所有企業不僅會調用模型,也會把自己的流程訓練進模型。

為此,微軟還發表了 Microsoft Frontier Tuning,核心是強化學習環境。企業可以把真實工作軌跡、任務步驟、決策、工具調用和評價標準變成訓練環境,讓模型學習組織內部的工作方式。

PC 變成 Agent 工作站,你的桌面就是數據中心

除了模型,微軟也把重點轉向本地算力。

微軟發表會現場圖

Surface RTX Spark Dev Box 是這部分最值得一提的產品。納德拉把它稱為面向開發者的「dream machine(夢幻神機)」。這台設備提供 1 petaflop AI 算力、20 個 CPU 核心和 128GB 統一記憶體,計劃在今年秋季推出。

Surface RTX Spark Dev Box 產品圖

Surface RTX Spark Dev Box 基於 Nvidia RTX Spark 平台。正如 APPSO 前幾天所報導的,RTX Spark 是面向 PC 的下一代 SoC,把 CPU、GPU 和 AI 能力整合到一顆晶片中,並支援統一記憶體架構和整合 DRTM。

輝達執行長黃仁勳在視訊連線中表示,PC 正在從個人電腦走向個人 AI。他舉例稱:用戶外出時,可以給自己的 PC 發訊息,讓本地 Agent 調用工具、修改程式碼、推進設計,再和用戶繼續迭代。

黃仁勳視訊連線畫面

PC 不再只是一個被人操作的工具,也開始變成可以持續執行任務的 AI 助手。

此外,微軟還為 Surface RTX Spark Dev Box 預裝開發優化的 Windows 11 Pro,內建 VS Code、WSL、PowerShell 7、GitHub Copilot、Coreutils for Windows 等工具。

預裝的開發工具截圖

現場展示中,這台設備預設沒有新聞流、組件彈窗和通知,使用深色模式;Windows Insider 版本還加入了縱向工作列,不僅開發工具被進一步系統化,命令列和容器體驗也更接近 Linux。

Windows 縱向工作列展示

硬體方面,它採用陽極氧化鋁 3D 列印一體機身,擁有 1000 個通風孔,熱設計功耗 100W,介面包括 USB-C、USB-A、HDMI、乙太網路和耳機插孔。

Windows 將在 AI 時代大有作為。本地 AI 要讓 PC 成為 Agent 工作流程的一部分:開發者可以在本地除錯、運行模型、調用工具、看日誌、開容器、跑子 Agent,再把更大規模任務交給雲端。

Agent 需要新入口,微軟探路下一代 AI 終端

相比 Surface RTX Spark Dev Box 面向開發者,Project Solara 更像是微軟對 Agent 設備型態的提前試探。下一台電腦不會只是一台設備,而是一組協同工作的設備。

微軟展示了兩類參考設備。

第一類是固定在桌面上的工作終端,基於聯發科晶片。

Project Solara 桌面工作終端

用戶走近後,系統會安全識別身分,並讓用戶進入自己的 Agent 工作環境,存取基於 Work IQ 的 Microsoft 365 Copilot。

它可以顯示當天重要事項,也支援點按或語音交給 Agent 處理任務,還能作為 Windows PC 伴侶,或透過 Windows 365 接入 Cloud PC。它更像企業辦公桌上的 Agent 控制終端,負責身份識別、任務提醒、語音互動、Copilot 調用和 Cloud PC 接入。

Project Solara 工作終端操作畫面

第二類是可佩戴數位工牌,使用 Qualcomm 可穿戴晶片,面向移動工作場景。

Project Solara 數位工牌

展示中,用戶透過指紋解鎖後,要求 Copilot 為社群媒體貼文收集現場素材。工牌負責拍攝畫面,Agent 負責挑選鏡頭、清理畫面,並發送給本人和團隊審查。發表會還展示了醫療場景:護理師可用它進行免持語音記錄、區分說話者、核驗生命跡象、掃描藥物並驗證照護流程。

數位工牌在醫療場景的應用

這兩類設備只是參考型態。

手機和 PC 仍然重要,但一些工作場景需要更靠近人、空間和感測器的硬體。面對未來的 Agent 時代,企業可以更換 Agent,調整外觀、螢幕、感測器和輸入方式,在同一硬體和軟體基礎上適配不同垂直行業。

龍蝦之父站台,微軟給個人 Agent 加上企業護欄

Surface RTX Spark Dev Box 講的是本地算力,Project Solara 講的是新設備型態,OpenClaw on Windows 則把焦點轉到個人 Agent 如何安全進入企業。

OpenClaw on Windows 展示

微軟展示了適用於 OpenClaw 的 Windows 套件,可以幫助用戶設定自己的 OpenClaw,或連線已經託管在 Windows 和 WSL 中的 OpenClaw。

OpenClaw Windows 套件介面

應用程式裡可以查看 gateway、參與 OpenClaw 的其他機器、連線使用狀態,也能快速進入聊天、畫布和主控台。

安全展示圍繞檔案權限展開。

OpenClaw Windows Companion app 允許用戶控制 Agent 能存取哪些資料夾,以及這些資料夾是唯讀、可寫還是隱藏。它也可以配置剪貼簿存取、聯網權限等細粒度選項。

微軟在現場要求 OpenClaw 刪除桌面上的所有檔案,並臨時關閉 OpenClaw 自身的安全層,只保留 MXC 的系統級限制。由於桌面資料夾被設定為唯讀,OpenClaw 多次嘗試刪除和檢查目錄,最後仍無法刪除檔案,桌面上的 94 張 JPG 得以保留。

檔案權限安全展示畫面

龍蝦之父 Peter Steinberger 也透露,過去幾個月 OpenClaw 與 Microsoft、GitHub、OpenAI、Nvidia 等團隊合作,增加了可觀測性、自動權限模式,並重新設計存取控制。現在權限不再只有全部允許或全部禁止,用戶可以指定哪些資料夾唯讀、哪些可寫、哪些對 Agent 隱藏。

Peter Steinberger 發表 OpenClaw 新功能

他還宣布,OpenClaw 可以在公司內部運作,harness 本身已經插件化。企業可以接入自己信任的 Copilot、Codex 或其他系統,把既有規則帶進 OpenClaw,再獲得持續記憶、heartbeat,以及在 Slack 或 Teams 中使用 OpenClaw 的能力。

AI 下半場,微軟盯上企業平台入口

除前述硬體和 Windows 更新外,微軟還發表了更多產品。

開發工具方面,微軟發表新的 GitHub Copilot app。它更像一個 Agent 編碼連線管理器,開發者可以同時啟動多個 issue 連線,並用 Git worktree 隔離,讓多個 Agent 並行工作。

GitHub Copilot App 介面

Agent Merge 則負責追蹤 PR 的 CI 檢查、程式碼審查和合併衝突。微軟還發表 Raven,這是一個 Agent first SDK,用於連接 backend as a service,處理身分、儲存和資料庫 schema 等後端問題。

上下文能力由 Web IQ 承擔。

Agent 要進入企業流程,需要連接網路新資訊、企業業務物件、即時營運狀態、人員關係和組織流程。Web IQ 負責外部網路資訊,支援網頁、新聞、圖片和影片,模型無關、MCP native,可接入任意 Agent runtime,讓 Agent 的回答建立在更新、可驗證的內容上。

Web IQ 功能示意圖

Copilot 也在升級為更複雜的工作入口。

納德拉稱,今年夏天會把 chat、cowork 和 code 放入同一個 Copilot,並發表 Autopilots。首個 Autopilot 名為 Scout,面向 Copilot Frontier 用戶開放,可在 Teams 群組聊天和 Outlook 執行緒中工作。

Copilot Autopilots 功能展示

企業治理層面,微軟發表 Agent 365。它為 Agent 提供身分、權限、存取控制和合規管理,並接入 Entra、Defender 和 Purview。Agent 365 可管理託管在 Azure、AWS、GCP 或其他環境中的 Agent,也支援不同框架建構的 Agent。

科研方向則是 Microsoft Discovery。納德拉把它定義為面向科學發現的 Agent 平台,希望把論文研究、候選方案生成、模擬計算、實驗設計和自動化實驗室連接成連續流程。

發表會最後,微軟還正式發表了新一代量子晶片 Majorana 2,其量子位元平均壽命可達 20 秒,最高接近 1 分鐘,比 Majorana 1 高約 1000 倍;操作時間為 1 微秒,尺寸仍為 0.01 毫米量級,並採用全數位控制。

Majorana 2 量子晶片

至此,這場拼圖龐大且野心勃勃的發表會終於完整。AI 的第一階段,主導產業敘事的是模型公司;第二階段,主導產業落地的可能是平台公司。

誰來選擇模型,誰來分配任務,誰來管理 Agent,誰來定義權限和審計,誰就更接近企業 AI 的核心入口。當模型逐漸成為標準能力之後,真正決定價值歸屬的,將是承載這些模型運行的系統。

如果說當年那張 AI 時代的頭等艙門票,很大程度上是藉助盟友 OpenAI 的力量搶下的;那麼現在,微軟已經坐進了駕駛艙,並打算親自接管這架飛機的航向。

相關文章推薦

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.