剛剛，Claude Code 新增 Computer Use，CLI 可直接操控圖形介面了

Claude Code 更新了，這次帶來重磅功能：Computer Use。

簡單來說，Claude 現在能在終端機指令列中，直接開啟你 Mac 上的應用程式、點擊按鈕、擷取螢幕畫面、操作介面，並將執行結果即時回饋。

若影片無法播放，請改看來源頁。

撰寫程式、編譯建置、啟動應用、點擊測試、偵測錯誤、修正代碼、驗證成效，整個流程僅需在同一個終端機對話中即可全部完成。

【01 先看效果】

官方示範影片中展示了一個完整情境。

使用者在 Claude Code 中開啟名為 SPM3000 的像素繪圖編輯器專案，隨後輸入指令：

「「回饋頻道回報 Gen 按鈕渲染至一半便因 ERR 19 中斷。請開啟 SPM3000 重現此問題、進行修復，並產出新版建置檔案。」」

Claude Code CLI 啟動項目

Claude 首先執行 git status 指令檢視 Xcode 專案架構，接著直接啟動 SPM3000 應用程式。

【02 自己動手操作】

接下來，Claude 展現了令人驚艷的執行力。

終端機顯示提示：「我將啟用 Computer Use 功能，協助您進行介面操作。」

隨後透過 /mcp 指令啟用 Computer Use，取得點擊、鍵盤輸入與螢幕截圖權限。

Claude 打開應用復現 bug

它開啟 SPM3000 應用，點擊坐標 (412, 580) 的 GEN 按鈕。

畫面上出現像素繪圖動物，但渲染一半便停滯。底部顯示：ERR 19，ROW 16/32，BUFFER OVERRUN。

Claude 迅速擷取一張螢幕畫面，儲存至 /tmp/gen-before.png，確認問題癥結：渲染作業於第 16 列中斷。

Claude 截圖確認 ERR 19

【03 找到程式錯誤】

確認錯誤後，Claude 切換回它最擅長的領域：程式碼分析。

它使用 grep 指令搜尋 ERR 19|rowIndex，在 Sources/GenViewModel.swift 檔案的第 47 行與第 52 行鎖定相關程式碼。

接著讀取 renderSprite() 函式，找出問題出在調色盤邏輯：當 palette 為空值時，函式直接回傳 .err(19)，導致渲染流程中斷。

Claude 搜尋程式碼定位 bug

修復方案十分直覺：將原本的 guard let palette else { return .err(19) } 修改為 fallback 至 lastGoodPalette，避免僅因調色盤暫空就完全中止渲染作業。

【04 一次驗證】

修改完程式碼，Claude 執行 xcodebuild -scheme SPM3000 -configuration Debug build 指令。

顯示建置成功。

重新編譯並驗證修復

隨後它再次開啟 SPM3000，重新點擊一次 GEN 按鈕。

這一次，32 列全部順利渲染完畢，像素動物完整呈現於畫面上，配戴著墨鏡，動畫也持續循環播放。

Claude 回覆：

「「完整渲染完成，32 列全數通過，墨鏡動畫循環播放。修復已生效。需要我產出建置檔案嗎？」」

使用者回覆一字：好。

修復後完整渲染效果

從接收錯誤回報到修復驗證完成，整個過程耗時僅約兩分鐘。

閉環開發流程

【05 使用範圍】

目前 Computer Use 以研究預覽版形式提供，僅支援 macOS 平台，且需具備 Pro 或 Max 訂閱方案。

開啟步驟如下：

• 於 Claude Code 對話中輸入 /mcp

• 找到 computer-use 項目，選擇啟用

• 首次使用時 macOS 會要求授予兩項權限：輔助使用（允許 Claude 點擊、輸入、捲動）與螢幕錄製（允許 Claude 讀取畫面內容）

Computer Use 透過 /mcp 啟用

完成授權後，直接告知 Claude 您希望它執行的操作即可。例如：

「「編譯 MenuBarStats 並啟動它，開啟偏好設定視窗，驗證 interval 滑桿是否能正確更新標籤數值。」」

Claude 便會自動完成編譯、啟動、操作與截圖作業。

【06 並非所有情境皆適用】

Claude 在挑選工具時具備明確優先順序：

若您已設定 MCP 伺服器，將優先採用 MCP。若任務能透過 Shell 指令解決，則使用 Bash。若是瀏覽器操作且已安裝 Chrome 版 Claude，則調用瀏覽器介面。

僅當上述方式皆無法處理時，才會啟用 Computer Use。

工具選擇優先級

此設計考量相當合理。

畢竟透過螢幕操控是效能最慢的途徑，能透過精確指令處理的任務，無需看著螢幕點擊滑鼠。Computer Use 主要保留給那些缺乏指令列介面、未提供 API、僅有圖形化操作介面的應用程式。

【07 能應用於何處？】

依官方文件與示範內容，目前主要涵蓋以下幾類情境：

原生應用程式驗證：修改 SwiftUI 程式碼後，交由 Claude 自動編譯、啟動、點擊測試各項介面元素，並擷圖確認。省去開發者手動開啟 App 檢視效果的步驟。

端到端 UI 測試：指定本地端的 Electron 應用程式要求測試註冊流程，Claude 會自行開啟應用、走完註冊流程，並針對每個步驟截圖。無須額外撰寫 Playwright 腳本或設定測試框架。

視覺化錯誤偵錯：告知 Claude 彈出視窗在小尺寸視窗下遭裁切，它會自動調整視窗大小重現問題、截圖、修正 CSS，並再次驗證成效。

控制純圖形介面工具：設計軟體、硬體控制面板、iOS 模擬器，以及各類未提供終端介面的專用軟體，如今皆可透過 Claude Code 進行操作。

【08 安全防護機制】

Anthropic 在資安層面已設置多項限制。

每項應用程式皆需於當前對話中逐一取得使用者授權。若 Claude 欲操作 Finder，系統將彈出提示告知此應用程式具備讀寫任意檔案權限，由您決定是否放行；若欲操作終端機，則提示等同於取得 Shell 存取權限。此類提醒確實應謹慎看待。

針對不同類型的應用程式，Claude 的控制權限亦有所區分：瀏覽器與交易平台僅具唯讀權限，不可操作；終端機與 IDE 僅允許點擊，禁止鍵盤輸入；僅其他一般應用程式才開放完整控制權。

Claude 執行作業時，會自動隱藏其他視窗，僅與已獲授權的應用程式互動。終端機視窗雖保持可見，但會被排除於截圖範圍之外，使 Claude 無法讀取自己的輸出訊息，進而有效防範提示詞注入風險。

隨時按下 Esc 鍵即可中止 Computer Use，立即收回系統控制權。

【09 與桌面版的差異】

Claude 桌面版其實已具備 Computer Use 功能。

指令列版的主要差異在於啟用方式（/mcp 指令相對於設定面板）、暫無拒絕應用程式清單的設定選項，以及強制啟用自動恢復隱藏視窗功能。

核心運算引擎則完全相同。

【10 長遠發展展望】

此項更新的關鍵意義，在於 AI 程式設計助手的感知邊界再度向外擴張。

過往的 Claude Code 僅能讀取與撰寫程式碼、執行終端指令，但本質上屬於盲操作，無法直接觀察程式碼執行後的實際呈現畫面。若僅修改一行 CSS，開發者仍須手動開啟瀏覽器檢視效果，再以文字描述回報給 Claude。

如今，它已具備視覺檢視能力。

撰寫程式碼與驗證程式碼的環節，就此整合為單一自動化流程。

對前端開發、行動應用程式開發及桌面軟體開發領域而言，這無疑是一項顯著變革。過去修改一行程式碼，手動驗證一次的循環，現在可交由 Claude 全自動執行。

目前仍屬研究預覽階段，僅支援 macOS 系統，且需升級至 Claude Code v2.1.85 或更新版本。

不支援 -p 非互動模式，亦不適用 Team 與 Enterprise 方案。

筆者目前已親自測試啟用：

◇ ◆ ◇

https://x.com/claudeai/status/2038663014098899416

剛剛，Claude Code 新增 Computer Use，CLI 可直接操控圖形介面了

相關文章推薦

分享網址