微軟和 OpenAI 的蜜月期,曾是整個 AI 產業最重要的聯盟。
一方握有模型,另一方掌握雲端服務、辦公軟體、開發者工具和企業客戶,雙方相輔相成,幾乎讓微軟在 AI 時代提前拿到了頭等艙門票。但即便聯盟再緊密,微軟也不能永遠把最關鍵的 AI 想像力寄託在別人身上。
特別是在雙方關係開始脫鉤之後。
剛剛登場的 Build 2026 也因此變成一場特別的發表會。微軟比以往任何時候都更需要一場酣暢淋漓的 AI 勝利,向外界證明自己究竟是 AI 時代的主角,還是依舊只是 OpenAI 的雲端服務商?
從 MAI 模型、Azure AI Foundry、到量子運算以及本地智慧代理能力,再加上黃仁勳和龍蝦之父的相繼站台,微軟展示了一整套覆蓋開發、模型、數據、算力和治理的完整生態系,其目標也很清晰:將 AI 從 OpenAI 主導的模型紅利,轉變為微軟主導的平台生意。
微軟自研模型發表,MAI 補上 AI 供應鏈最關鍵一環
比起去年,微軟這次把模型放在了更重要的位置。微軟執行長納德拉稱,Microsoft Foundry 目前已有超過 11,000 個模型,覆蓋 OpenAI、Anthropic 和微軟自研 MAI 模型。
微軟的判斷是,企業和開發者不會只依賴一個模型完成所有任務。不同任務會對應不同模型,也會受到延遲、成本和能力邊界的約束。因此,模型目錄、模型選擇、運行環境和企業治理,會一起構成新的平台競爭點。
今天,微軟自研模型家族正式一口氣推出了七款新模型,涵蓋推理、程式碼、圖像、語音和轉錄等方向。
MAI Thinking 1 是其中的推理模型。它採用稀疏 MoE 架構,35B 活躍參數,總參數規模約 1T,支援 256K token 上下文,足以容納大約 600 頁文件。
微軟 AI 負責人穆斯塔法·蘇萊曼強調,這個模型沒有使用第三方模型蒸餾,訓練數據來自乾淨且合規授權的數據,並在預訓練中排除了 AI 生成內容。它已在 Microsoft Foundry 私有預覽,之後會進入 MAI Playground 公測。
程式碼模型 MAI Code 1 Flash 面向日常開發工作流程。它由微軟端到端訓練,使用乾淨且合規授權的數據,正在向 Visual Studio Code 中的 GitHub Copilot 個人用戶推出,入口包括模型選擇器和預設自動選擇器。
微軟稱,這個模型針對 GitHub Copilot harness 做了訓練和適配,支援代理式編碼,也支援自適應思考。簡單請求保持簡潔,複雜任務會投入更多推理預算。
微軟把 MAI Code 1 Flash 直接拿來和 Claude Haiku 4.5 比較。
MAI Code 1 Flash 在 SWE Bench Pro 上達到 51.2%,高於 Claude Haiku 4.5 的 35.2%;在 IF Bench 精確指令跟隨上領先 28.9 分,在 Advanced IF 上領先 14.5 分。它將支撐微軟 GitHub Copilot 的常見編碼場景,尤其是程式碼修改、多輪指令和真實開發環境裡的 Agent 任務。
圖像和語音模型也被納入 MAI 體系。
MAI Image 2.5 和 Flash 版本支援文本生成圖像和圖像編輯,已經進入 PowerPoint,並會擴展到 OneDrive 和 Foundry。
MAI Transcribe 1.5 支援 43 種語言,微軟稱其速度達到競品 5 倍,正在整合到 GitHub、Teams、Copilot 和 Dynamics 365 Contact Center。
MAI Voice 2 支援 15 種語言,可透過短樣本適配聲音,同時內建防濫用保護;低成本版本 MAI Voice 2 Flash 也在計劃中。
微軟還把 MAI 模型和自己的晶片聯繫起來。MAI Thinking 1 已針對 Maia 200 優化,端到端運行 MAI 模型時,還能獲得 1.4 倍每瓦效能提升。
企業定製也是 MAI 模型的重要方向。未來所有企業不僅會調用模型,也會把自己的流程訓練進模型。
為此,微軟還發表了 Microsoft Frontier Tuning,核心是強化學習環境。企業可以把真實工作軌跡、任務步驟、決策、工具調用和評價標準變成訓練環境,讓模型學習組織內部的工作方式。
PC 變成 Agent 工作站,你的桌面就是數據中心
除了模型,微軟也把重點轉向本地算力。
Surface RTX Spark Dev Box 是這部分最值得一提的產品。納德拉把它稱為面向開發者的「dream machine(夢幻神機)」。這台設備提供 1 petaflop AI 算力、20 個 CPU 核心和 128GB 統一記憶體,計劃在今年秋季推出。
Surface RTX Spark Dev Box 基於 Nvidia RTX Spark 平台。正如 APPSO 前幾天所報導的,RTX Spark 是面向 PC 的下一代 SoC,把 CPU、GPU 和 AI 能力整合到一顆晶片中,並支援統一記憶體架構和整合 DRTM。
輝達執行長黃仁勳在視訊連線中表示,PC 正在從個人電腦走向個人 AI。他舉例稱:用戶外出時,可以給自己的 PC 發訊息,讓本地 Agent 調用工具、修改程式碼、推進設計,再和用戶繼續迭代。
PC 不再只是一個被人操作的工具,也開始變成可以持續執行任務的 AI 助手。
此外,微軟還為 Surface RTX Spark Dev Box 預裝開發優化的 Windows 11 Pro,內建 VS Code、WSL、PowerShell 7、GitHub Copilot、Coreutils for Windows 等工具。
現場展示中,這台設備預設沒有新聞流、組件彈窗和通知,使用深色模式;Windows Insider 版本還加入了縱向工作列,不僅開發工具被進一步系統化,命令列和容器體驗也更接近 Linux。
硬體方面,它採用陽極氧化鋁 3D 列印一體機身,擁有 1000 個通風孔,熱設計功耗 100W,介面包括 USB-C、USB-A、HDMI、乙太網路和耳機插孔。
Windows 將在 AI 時代大有作為。本地 AI 要讓 PC 成為 Agent 工作流程的一部分:開發者可以在本地除錯、運行模型、調用工具、看日誌、開容器、跑子 Agent,再把更大規模任務交給雲端。
Agent 需要新入口,微軟探路下一代 AI 終端
相比 Surface RTX Spark Dev Box 面向開發者,Project Solara 更像是微軟對 Agent 設備型態的提前試探。下一台電腦不會只是一台設備,而是一組協同工作的設備。
微軟展示了兩類參考設備。
第一類是固定在桌面上的工作終端,基於聯發科晶片。
用戶走近後,系統會安全識別身分,並讓用戶進入自己的 Agent 工作環境,存取基於 Work IQ 的 Microsoft 365 Copilot。
它可以顯示當天重要事項,也支援點按或語音交給 Agent 處理任務,還能作為 Windows PC 伴侶,或透過 Windows 365 接入 Cloud PC。它更像企業辦公桌上的 Agent 控制終端,負責身份識別、任務提醒、語音互動、Copilot 調用和 Cloud PC 接入。
第二類是可佩戴數位工牌,使用 Qualcomm 可穿戴晶片,面向移動工作場景。
展示中,用戶透過指紋解鎖後,要求 Copilot 為社群媒體貼文收集現場素材。工牌負責拍攝畫面,Agent 負責挑選鏡頭、清理畫面,並發送給本人和團隊審查。發表會還展示了醫療場景:護理師可用它進行免持語音記錄、區分說話者、核驗生命跡象、掃描藥物並驗證照護流程。
這兩類設備只是參考型態。
手機和 PC 仍然重要,但一些工作場景需要更靠近人、空間和感測器的硬體。面對未來的 Agent 時代,企業可以更換 Agent,調整外觀、螢幕、感測器和輸入方式,在同一硬體和軟體基礎上適配不同垂直行業。
龍蝦之父站台,微軟給個人 Agent 加上企業護欄
Surface RTX Spark Dev Box 講的是本地算力,Project Solara 講的是新設備型態,OpenClaw on Windows 則把焦點轉到個人 Agent 如何安全進入企業。
微軟展示了適用於 OpenClaw 的 Windows 套件,可以幫助用戶設定自己的 OpenClaw,或連線已經託管在 Windows 和 WSL 中的 OpenClaw。
應用程式裡可以查看 gateway、參與 OpenClaw 的其他機器、連線使用狀態,也能快速進入聊天、畫布和主控台。
安全展示圍繞檔案權限展開。
OpenClaw Windows Companion app 允許用戶控制 Agent 能存取哪些資料夾,以及這些資料夾是唯讀、可寫還是隱藏。它也可以配置剪貼簿存取、聯網權限等細粒度選項。
微軟在現場要求 OpenClaw 刪除桌面上的所有檔案,並臨時關閉 OpenClaw 自身的安全層,只保留 MXC 的系統級限制。由於桌面資料夾被設定為唯讀,OpenClaw 多次嘗試刪除和檢查目錄,最後仍無法刪除檔案,桌面上的 94 張 JPG 得以保留。
龍蝦之父 Peter Steinberger 也透露,過去幾個月 OpenClaw 與 Microsoft、GitHub、OpenAI、Nvidia 等團隊合作,增加了可觀測性、自動權限模式,並重新設計存取控制。現在權限不再只有全部允許或全部禁止,用戶可以指定哪些資料夾唯讀、哪些可寫、哪些對 Agent 隱藏。
他還宣布,OpenClaw 可以在公司內部運作,harness 本身已經插件化。企業可以接入自己信任的 Copilot、Codex 或其他系統,把既有規則帶進 OpenClaw,再獲得持續記憶、heartbeat,以及在 Slack 或 Teams 中使用 OpenClaw 的能力。
AI 下半場,微軟盯上企業平台入口
除前述硬體和 Windows 更新外,微軟還發表了更多產品。
開發工具方面,微軟發表新的 GitHub Copilot app。它更像一個 Agent 編碼連線管理器,開發者可以同時啟動多個 issue 連線,並用 Git worktree 隔離,讓多個 Agent 並行工作。
Agent Merge 則負責追蹤 PR 的 CI 檢查、程式碼審查和合併衝突。微軟還發表 Raven,這是一個 Agent first SDK,用於連接 backend as a service,處理身分、儲存和資料庫 schema 等後端問題。
上下文能力由 Web IQ 承擔。
Agent 要進入企業流程,需要連接網路新資訊、企業業務物件、即時營運狀態、人員關係和組織流程。Web IQ 負責外部網路資訊,支援網頁、新聞、圖片和影片,模型無關、MCP native,可接入任意 Agent runtime,讓 Agent 的回答建立在更新、可驗證的內容上。
Copilot 也在升級為更複雜的工作入口。
納德拉稱,今年夏天會把 chat、cowork 和 code 放入同一個 Copilot,並發表 Autopilots。首個 Autopilot 名為 Scout,面向 Copilot Frontier 用戶開放,可在 Teams 群組聊天和 Outlook 執行緒中工作。
企業治理層面,微軟發表 Agent 365。它為 Agent 提供身分、權限、存取控制和合規管理,並接入 Entra、Defender 和 Purview。Agent 365 可管理託管在 Azure、AWS、GCP 或其他環境中的 Agent,也支援不同框架建構的 Agent。
科研方向則是 Microsoft Discovery。納德拉把它定義為面向科學發現的 Agent 平台,希望把論文研究、候選方案生成、模擬計算、實驗設計和自動化實驗室連接成連續流程。
發表會最後,微軟還正式發表了新一代量子晶片 Majorana 2,其量子位元平均壽命可達 20 秒,最高接近 1 分鐘,比 Majorana 1 高約 1000 倍;操作時間為 1 微秒,尺寸仍為 0.01 毫米量級,並採用全數位控制。
至此,這場拼圖龐大且野心勃勃的發表會終於完整。AI 的第一階段,主導產業敘事的是模型公司;第二階段,主導產業落地的可能是平台公司。
誰來選擇模型,誰來分配任務,誰來管理 Agent,誰來定義權限和審計,誰就更接近企業 AI 的核心入口。當模型逐漸成為標準能力之後,真正決定價值歸屬的,將是承載這些模型運行的系統。
如果說當年那張 AI 時代的頭等艙門票,很大程度上是藉助盟友 OpenAI 的力量搶下的;那麼現在,微軟已經坐進了駕駛艙,並打算親自接管這架飛機的航向。