Claude 突然更新。Sonnet 4.6 正式登場,直接取代了上一代的主力位置。
這一次,Anthropic 把 100 萬 token 上下文視窗下放到了 Beta 版。
價格沒變,依舊是每百萬 token 3 美元/15 美元。
但在程式碼能力上,它不僅大幅超越前代,甚至有 59% 的早期用戶認為,它比 2025 年 11 月發布的旗艦模型 Opus 4.5 還要好用。
這就是通常需要 Opus 級模型才能處理的重活,現在 Sonnet 4.6 就能幹,而且更便宜。
核心升級點非常集中:程式碼、電腦操作(Computer Use)、長上下文推理以及 Agent 規劃。
開發者反饋最直接:不偷懶,不瞎編,邏輯複用能力大幅提升。
在 Claude Code 環境測試中,70% 的用戶相比 Sonnet 4.5 更傾向於使用新模型。
前端程式碼和財務分析表現尤其突出,生成的視覺效果佈局更合理,甚至自帶設計感和動效。
電腦操作能力(Computer Use)是這次的重頭戲。
不依賴專用 API,模型像人一樣看螢幕、動滑鼠、敲鍵盤。
在 OSWorld 基準測試中,Sonnet 4.6 不僅刷分,還在複雜電子試算表導航和多步網頁表單填報上,展現出了人類水平。
雖然距離頂尖人類專家還有差距,但相比早期版本那種笨重感,進化速度肉眼可見。
安全性方面,針對 Prompt Injection(提示詞注入)攻擊的防禦力大幅提升,表現與 Opus 4.6 持平。
長視窗不再只是能裝,更在於能想。
在 Vending-Bench Arena 商業模擬測試中,它學會了放長線釣大魚。
前 10 個月瘋狂燒錢擴產能,最後階段極速轉向盈利模式,最終利潤碾壓對手。
這種跨度極大的時間規劃能力,得益於新的上下文壓縮技術。
當對話接近上限時,模型會自動把舊資訊打包摘要,給新思考騰出空間。
開發者平台同步解鎖了自適應思考和擴展思考。
API 端的搜尋工具現在學會了自己寫程式碼清洗數據,只把有用的資訊餵給模型,既省 Token 又提效。
Excel 外掛程式也打通了 MCP 協議。
S&P Global、FactSet 這些專業金融數據,不出表格就能直接調取,Pro 和 Enterprise 用戶即刻可用。
目前,https://claude.ai、API 以及各大雲端平台已全線實裝。
免費版用戶這次也被強制升級為 Sonnet 4.6,並解鎖了檔案建立和連接器功能。
想嚐鮮的開發者,API 代碼 claude-sonnet-4-6 已經可以跑起來了。