Claude Sonnet 4.6 登場：百萬上下文下放，表現超越 Opus 4.5

Claude 突然更新。Sonnet 4.6 正式登場，直接取代了上一代的主力位置。

這一次，Anthropic 把 100 萬 token 上下文視窗下放到了 Beta 版。

價格沒變，依舊是每百萬 token 3 美元/15 美元。

但在程式碼能力上，它不僅大幅超越前代，甚至有 59% 的早期用戶認為，它比 2025 年 11 月發布的旗艦模型 Opus 4.5 還要好用。

這就是通常需要 Opus 級模型才能處理的重活，現在 Sonnet 4.6 就能幹，而且更便宜。

核心升級點非常集中：程式碼、電腦操作（Computer Use）、長上下文推理以及 Agent 規劃。

開發者反饋最直接：不偷懶，不瞎編，邏輯複用能力大幅提升。

在 Claude Code 環境測試中，70% 的用戶相比 Sonnet 4.5 更傾向於使用新模型。

前端程式碼和財務分析表現尤其突出，生成的視覺效果佈局更合理，甚至自帶設計感和動效。

電腦操作能力（Computer Use）是這次的重頭戲。

不依賴專用 API，模型像人一樣看螢幕、動滑鼠、敲鍵盤。

在 OSWorld 基準測試中，Sonnet 4.6 不僅刷分，還在複雜電子試算表導航和多步網頁表單填報上，展現出了人類水平。

雖然距離頂尖人類專家還有差距，但相比早期版本那種笨重感，進化速度肉眼可見。

安全性方面，針對 Prompt Injection（提示詞注入）攻擊的防禦力大幅提升，表現與 Opus 4.6 持平。

長視窗不再只是能裝，更在於能想。

在 Vending-Bench Arena 商業模擬測試中，它學會了放長線釣大魚。

前 10 個月瘋狂燒錢擴產能，最後階段極速轉向盈利模式，最終利潤碾壓對手。

這種跨度極大的時間規劃能力，得益於新的上下文壓縮技術。

當對話接近上限時，模型會自動把舊資訊打包摘要，給新思考騰出空間。

開發者平台同步解鎖了自適應思考和擴展思考。

API 端的搜尋工具現在學會了自己寫程式碼清洗數據，只把有用的資訊餵給模型，既省 Token 又提效。

Excel 外掛程式也打通了 MCP 協議。

S&P Global、FactSet 這些專業金融數據，不出表格就能直接調取，Pro 和 Enterprise 用戶即刻可用。

目前，https://claude.ai、API 以及各大雲端平台已全線實裝。

免費版用戶這次也被強制升級為 Sonnet 4.6，並解鎖了檔案建立和連接器功能。

想嚐鮮的開發者，API 代碼 claude-sonnet-4-6 已經可以跑起來了。