Claude Sonnet 4.6 登場:百萬上下文下放,表現超越 Opus 4.5

圖片

Claude 突然更新。Sonnet 4.6 正式登場,直接取代了上一代的主力位置。

這一次,Anthropic 把 100 萬 token 上下文視窗下放到了 Beta 版。

價格沒變,依舊是每百萬 token 3 美元/15 美元。

但在程式碼能力上,它不僅大幅超越前代,甚至有 59% 的早期用戶認為,它比 2025 年 11 月發布的旗艦模型 Opus 4.5 還要好用。

圖片

這就是通常需要 Opus 級模型才能處理的重活,現在 Sonnet 4.6 就能幹,而且更便宜。

核心升級點非常集中:程式碼、電腦操作(Computer Use)、長上下文推理以及 Agent 規劃。

開發者反饋最直接:不偷懶,不瞎編,邏輯複用能力大幅提升。

在 Claude Code 環境測試中,70% 的用戶相比 Sonnet 4.5 更傾向於使用新模型。

前端程式碼和財務分析表現尤其突出,生成的視覺效果佈局更合理,甚至自帶設計感和動效。

電腦操作能力(Computer Use)是這次的重頭戲。

圖片

不依賴專用 API,模型像人一樣看螢幕、動滑鼠、敲鍵盤。

在 OSWorld 基準測試中,Sonnet 4.6 不僅刷分,還在複雜電子試算表導航和多步網頁表單填報上,展現出了人類水平。

雖然距離頂尖人類專家還有差距,但相比早期版本那種笨重感,進化速度肉眼可見。

安全性方面,針對 Prompt Injection(提示詞注入)攻擊的防禦力大幅提升,表現與 Opus 4.6 持平。

長視窗不再只是能裝,更在於能想。

在 Vending-Bench Arena 商業模擬測試中,它學會了放長線釣大魚。

前 10 個月瘋狂燒錢擴產能,最後階段極速轉向盈利模式,最終利潤碾壓對手。

圖片

這種跨度極大的時間規劃能力,得益於新的上下文壓縮技術。

當對話接近上限時,模型會自動把舊資訊打包摘要,給新思考騰出空間。

開發者平台同步解鎖了自適應思考和擴展思考。

API 端的搜尋工具現在學會了自己寫程式碼清洗數據,只把有用的資訊餵給模型,既省 Token 又提效。

Excel 外掛程式也打通了 MCP 協議。

S&P Global、FactSet 這些專業金融數據,不出表格就能直接調取,Pro 和 Enterprise 用戶即刻可用。

目前,https://claude.ai、API 以及各大雲端平台已全線實裝。

免費版用戶這次也被強制升級為 Sonnet 4.6,並解鎖了檔案建立和連接器功能。

想嚐鮮的開發者,API 代碼 claude-sonnet-4-6 已經可以跑起來了。

主標籤:人工智慧

次標籤:Claude Sonnet 4.6長上下文推理電腦操作自動化程式碼生成


上一篇:Qwen3.5:邁向原生多模態智慧代理人

下一篇:Gemini 靈魂人物、傳奇工程師 Jeff Dean 最新訪談:未來人均 50 個虛擬實習生,用不上專家了!

分享短網址