剛剛，Anthropic首個神話級Claude 5正式解禁！

新智元報導

【新智元導讀】藏了兩個月說「太危險」的Mythos 5終於解封！ASI級「神話」，今夜降臨。

Anthropic今晚「雙連發」！

就在剛剛，Claude Fable 5和Claude Mythos 5同時上線。

那個被Anthropic藏了兩個月、說「太危險不能公開」的Mythos級模型，第一次交到了所有人手上。

從Opus 4.7到4.8用了43天，4.8到Fable 5只用了11天。

Fable這個名字來自拉丁語fabula，和希臘語mythos同源。

同一個故事，同一個底座。公開版叫寓言，完整版叫神話。

軟體工程、知識工作、視覺、科學研究、長上下文，在幾乎所有benchmark上，Fable 5都是第一。

而且，任務越長、越複雜，拉開的差距就越大。

用Every的CEO Dan Shipper的話來說，這簡直就是一頭「性能怪獸」！

Fable 5和Mythos 5的分數幾乎一模一樣，差距通常在1到3個百分點以內。

它們最大的區別在於，前者內置了「安全分類器」，後者完全沒有限制。

一旦觸發了網安任務的查詢，Fable 5就會直接被「降級」到Opus 4.8來回覆。

Fable 5在所有安全任務中，拿下0分，就是最好的說明。

定價方面，Fable 5和Opus 4.8 Fast Mode基本一致，輸入10美元/百萬token，輸出50美元/百萬token。

雖然是Opus標準版的兩倍，但不到Mythos Preview的一半，也只有GPT-5.5 Pro的六分之一。

Pro、Max和Team訂閱用戶在6月22日前可以免費體驗，但之後就要花credits了。API今天即可使用，開發者調用claude-fable-5就行。

Claude 5「雙模」首秀

程式設計全球第一

Fable 5上線後，𝕏上的風向已經變了。

在剛加入Anthropic的Karpathy看來，這是一次配得上「大版本號」升級的跨越式進步。

工作軟體正在變得像自來水一樣隨取隨用，你可以隨手索取任何東西，解釋器、視覺化工具、儀表板、一次性客製化應用。

末尾，他還引了一句《駭客任務》的台詞：「解放你的心靈」。

經歷過Claude每一次發佈的研究員Alex Albert表示，這是第一個讓他覺得「不像工具，像夥伴」的模型。

Claude Code負責人Felix Rieseberg直接下了一個判斷，「第三個AI時代」在今天正式開啟！

隨之而來的，是一場史詩級的質變——我們將不再只是給AI派發「任務」，而是正式向它們賦予「職責」。

上下滑動查看

這幾句話背後真正的分量，恐怕許多人尚未真正領悟。

光說無憑，在各大基準測試、內/外部嚴苛評估中，Claude 5早已展現出「碾壓級」的統治力。

碾壓，不是一點半點

在人類最後考試（HLE）上，Mythos 5不用工具，實力趕超Preview版本。

相較於GPT-5.5、Gemini 3.1 Pro，Mythos 5更是呈現斷層式領先。

然後，再來看看Claude「最拿手」的智慧型代理程式設計任務。

SWE-Bench Pro，衡量真實世界代理程式設計能力的核心榜單，也是所有前沿模型卷得最兇的賽道。

Fable 5拿下80.3%。

作為參照，11天前剛發的Opus 4.8是69.2%，GPT-5.5是58.6%，Gemini 3.1 Pro是54.2%。

Fable 5比Opus 4.8高出11個百分點，比GPT-5.5高出21.7個百分點。

上一代王者剛坐穩11天的王座，就被自家的新模型一腳踹翻。

FrontierCode Diamond，Cognition做的專測代理程式碼品質的榜單，Fable 5拿了29.3%，GPT-5.5是5.7%。五倍差距。

而且Fable 5在中等算力檔位就到頂了。不需要拉滿思考，隨便想想就是第一。

Stripe拿到Fable 5的早期權限後幹了一件大事。

在一個5000萬行的Ruby程式碼庫裡，做了一次全域程式碼遷移。這種級別的工作，正常情況下需要一整個團隊花兩個多月。

Fable 5只用了一天。一天，5000萬行，整個團隊都看傻了。

Physical Superintelligence的CEO測完之後也大受震撼。

在前沿物理研究任務上，Fable 5不僅只消耗了GPT-5.5三分之一的推理token，而且只用了36小時就跑到了GPT-5.5花四天才到的位置。

Fable 5編曲造物，強到可怕

Anthropic的每一個測試，都在展示同一件事——Fable 5能長時間自主工作，而且產出品質高到離譜。

它自主玩《Factorio》，工程師們的聖經級工廠建設遊戲。

畫面上密密麻麻的傳送帶飛速運轉，機械臂在火爐和組裝機之間瘋狂揮舞。AI自己規劃資源流向、建設自動化生產線，在一個每秒都在消耗資源的混沌環境裡從零搭出秩序。

若影片無法播放，請改看來源頁。

它在瀏覽器裡設計了一個完整的3D可列印模型。

先是幾行程式碼，然後一個帶有UI面板、工具列的3D CAD編輯器在螢幕上被憑空渲染出來。

接著Fable 5切換身份，在自己搭建的編輯器裡旋轉視角、拉伸網格、倒角邊緣，把一個抽象概念塑造成可以送去3D列印的實體模型。

它還推演了太陽系行星運動，從物理第一性原理出發自己推導軌道方程式，然後用推導結果預測日食。

最魔幻的一個，暗色畫布頂端打著「FIFTH SYMPHONY FABLE」的標題，貝多芬第五號交響曲的EDM混音響起，高精度粒子流體在畫面中心炸開。

低音轟鳴時湧起深紫色星雲，小提琴揚起時冰藍色流體如極光般撕裂黑暗，每一次流體碰撞和擴散都踩在節拍上。

若影片無法播放，請改看來源頁。

這首混音曲本身，也是Fable 5用程式碼生成的。

一個從沒「聽」過音樂的AI，用程式碼寫了一首貝多芬混音，再用程式碼寫了一段跟著節拍跳舞的流體模擬。

另外，讓Fable 5玩《殺戮尖塔》遊戲時，配上持久化的檔案記憶後，性能提升是Opus 4.8的3倍，到達遊戲最終關卡的頻率也是3倍。

記憶讓Fable 5變強的幅度，遠超同樣的記憶對上一代模型的效果。

模型在「從自己的經驗中學習」這件事上，已經跨到了另一個台階。

不用一行程式碼，裸眼通關「寶可夢」

不僅如此，Fable 5在「視覺能力」上也取得了巨大的進步，程度不亞於程式設計。

之前的Claude模型玩《寶可夢火紅版》，需要一整套複雜的輔助工具才能推進，地圖導航、遊戲狀態解析、額外的工具介面，全都得餵進去，還經常卡關。

Fable 5只用了一個極簡的視覺介面。

若影片無法播放，請改看來源頁。

沒有地圖，沒有導航輔助，沒有任何額外的遊戲狀態資訊。

就靠看螢幕截圖，從頭到尾打通了整個《寶可夢火紅版》。

Anthropic放出了一段完整的縮時攝影影片記錄了全過程。AI看著像素畫面做決策、踩草叢遇敵、選技能打道館、穿迷宮，一路推到通關。

這意味著，Fable 5能從科學期刊裡複雜的圖表中提取精確數值，能僅憑幾張截圖把一個網路應用的原始碼完整重建出來。

模型對視覺資訊的理解深度到了一個新的層級，不再是「能看圖說話」，而是「看懂了，然後能動手」。

AI當科學家

Science級成果一週搞定

如果說程式設計和視覺還在「提效」的範疇裡，Fable 5和Mythos 5在生命科學領域做的事情，已經開始讓人重新思考「AI能做什麼」這個問題了。

在蛋白質設計任務中，Mythos 5實現了全自動研發。

從選靶點、跑設計到失敗自糾錯一氣呵成，14個疾病靶點成功斬獲9個強候選方案，精準覆蓋免疫、神經退化性疾病及肌肉疾病。

最炸裂的，是基因體學。

Mythos 5花了一週多時間，幾乎沒人管，自己搜集了138個物種、幾百萬個細胞的數據，自己設計並訓練了一個機器學習模型。

訓練出來的東西，甚至超越了近期發表在《Science》上的同類研究。

模型體積小100倍，性能卻反超。Anthropic打算過幾個月把結果發出來。

拒絕「蒸餾」，換腦Opus 4.8

由此，不難理解，為何Anthropic為Fable 5加了一層「安全分類器」。

尤其是，碰到網路安全、生物化學或模型蒸餾相關的請求時，系統自動把回答交給Opus 4.8處理。

越獄抵抗力對比圖（400輪紅隊測試）

有不少開發者吐槽，一些簡單任務，也會觸發Fable 5的「紅線」，直接降級。

值得注意的是，想要「蒸餾」Fable 5，可沒那麼簡單。

不同於網安任務，觸發此類問題後，Fable 5不會通知，直接透過提示詞修改、控制向量和PEET等方法，直接限制模型的能力。

Anthropic預估，大概約0.03%的流量會受到波及。

王座之戰，「神話」開場

GPT-5.5發佈才一個半月，能看到Fable 5車尾燈的項目就剩兩個。

Blueprint-Bench 2差2.4個百分點，Terminal-Bench上GPT-5.5憑藉Codex CLI拿了83.4%，是整張表裡最近的一項。

往下，全是單方面屠殺。

而Anthropic在出拳的同時，還藏了一層意思在名字裡。

Mythos，是文明解釋自身命運的神聖敘事。Fable，是人類最古老的道德教化。

古希臘哲學的誕生，曾被視為Logos對Mythos的一次勝利，人類學會了用理性解釋世界。

如今一家公司站在ASI的門檻上，把最強的模型命名為「神話」與「寓言」。

機器征服Logos的速度，所有人都看到了。

接下來的問題是，意義的製造和善惡的判斷，還能不能留在人類手裡。

參考資料：

https://www.anthropic.com/news/claude-fable-5-mythos-5

https://x.com/claudeai/status/2064394146916229443

https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf

編輯：摩西桃子

秒追ASI

⭐點讚、轉發、在看一鍵三連⭐

點亮星標，鎖定新智元極速推送！

人工智慧 Claude 5 AI基準測試大型語言模型 Anthropic

相關文章推薦

GPT-5.5 全球首破！零原始碼盲寫程式，程式開發 AI 進入新紀元人工智慧

AI的下一步是多模型融合？AI獨角獸發布Fugu：號稱基準測試比肩Fable！網友：這不就是AI服務包裝器？人工智慧

澳洲放羊大叔引爆AI程式開發革命！Claude Code 急推 goal 模式，不完工不許停人工智慧

Codex跑了22小時，真賺16.88美元：奧特曼預言的「AI打工人」來了其他

號稱全球最「危險」的AI，Anthropic Mythos實測curl僅找到一個真實漏洞人工智慧

分享網址

原始網址：https://mp.weixin.qq.com/s/jqBsN_2UDie47GVQj8L5MQ