剛剛,Anthropic首個神話級Claude 5正式解禁!

新智元報導

圖片

【新智元導讀】藏了兩個月說「太危險」的Mythos 5終於解封!ASI級「神話」,今夜降臨。

Anthropic今晚「雙連發」!

就在剛剛,Claude Fable 5和Claude Mythos 5同時上線。

那個被Anthropic藏了兩個月、說「太危險不能公開」的Mythos級模型,第一次交到了所有人手上。

圖片

從Opus 4.7到4.8用了43天,4.8到Fable 5只用了11天。

Fable這個名字來自拉丁語fabula,和希臘語mythos同源。

同一個故事,同一個底座。公開版叫寓言,完整版叫神話。

軟體工程、知識工作、視覺、科學研究、長上下文,在幾乎所有benchmark上,Fable 5都是第一。

而且,任務越長、越複雜,拉開的差距就越大。

圖片

用Every的CEO Dan Shipper的話來說,這簡直就是一頭「性能怪獸」!

圖片

Fable 5和Mythos 5的分數幾乎一模一樣,差距通常在1到3個百分點以內。

它們最大的區別在於,前者內置了「安全分類器」,後者完全沒有限制。

一旦觸發了網安任務的查詢,Fable 5就會直接被「降級」到Opus 4.8來回覆。

圖片

Fable 5在所有安全任務中,拿下0分,就是最好的說明。

定價方面,Fable 5和Opus 4.8 Fast Mode基本一致,輸入10美元/百萬token,輸出50美元/百萬token。

雖然是Opus標準版的兩倍,但不到Mythos Preview的一半,也只有GPT-5.5 Pro的六分之一。

Pro、Max和Team訂閱用戶在6月22日前可以免費體驗,但之後就要花credits了。API今天即可使用,開發者調用claude-fable-5就行。

圖片

圖片

Claude 5「雙模」首秀

程式設計全球第一

Fable 5上線後,𝕏上的風向已經變了。

在剛加入Anthropic的Karpathy看來,這是一次配得上「大版本號」升級的跨越式進步。

工作軟體正在變得像自來水一樣隨取隨用,你可以隨手索取任何東西,解釋器、視覺化工具、儀表板、一次性客製化應用。

末尾,他還引了一句《駭客任務》的台詞:「解放你的心靈」。

圖片

經歷過Claude每一次發佈的研究員Alex Albert表示,這是第一個讓他覺得「不像工具,像夥伴」的模型。

圖片

Claude Code負責人Felix Rieseberg直接下了一個判斷,「第三個AI時代」在今天正式開啟!

隨之而來的,是一場史詩級的質變——我們將不再只是給AI派發「任務」,而是正式向它們賦予「職責」。

圖片

上下滑動查看

這幾句話背後真正的分量,恐怕許多人尚未真正領悟。

光說無憑,在各大基準測試、內/外部嚴苛評估中,Claude 5早已展現出「碾壓級」的統治力。

圖片

圖片

碾壓,不是一點半點

在人類最後考試(HLE)上,Mythos 5不用工具,實力趕超Preview版本。

相較於GPT-5.5、Gemini 3.1 Pro,Mythos 5更是呈現斷層式領先。

圖片

然後,再來看看Claude「最拿手」的智慧型代理程式設計任務。

SWE-Bench Pro,衡量真實世界代理程式設計能力的核心榜單,也是所有前沿模型卷得最兇的賽道。

Fable 5拿下80.3%。

作為參照,11天前剛發的Opus 4.8是69.2%,GPT-5.5是58.6%,Gemini 3.1 Pro是54.2%。

Fable 5比Opus 4.8高出11個百分點,比GPT-5.5高出21.7個百分點。

上一代王者剛坐穩11天的王座,就被自家的新模型一腳踹翻。

圖片

FrontierCode Diamond,Cognition做的專測代理程式碼品質的榜單,Fable 5拿了29.3%,GPT-5.5是5.7%。五倍差距。

而且Fable 5在中等算力檔位就到頂了。不需要拉滿思考,隨便想想就是第一。

圖片

圖片

Stripe拿到Fable 5的早期權限後幹了一件大事。

在一個5000萬行的Ruby程式碼庫裡,做了一次全域程式碼遷移。這種級別的工作,正常情況下需要一整個團隊花兩個多月。

Fable 5只用了一天。一天,5000萬行,整個團隊都看傻了。

Physical Superintelligence的CEO測完之後也大受震撼。

在前沿物理研究任務上,Fable 5不僅只消耗了GPT-5.5三分之一的推理token,而且只用了36小時就跑到了GPT-5.5花四天才到的位置。

圖片

圖片

Fable 5編曲造物,強到可怕

Anthropic的每一個測試,都在展示同一件事——Fable 5能長時間自主工作,而且產出品質高到離譜。

它自主玩《Factorio》,工程師們的聖經級工廠建設遊戲。

畫面上密密麻麻的傳送帶飛速運轉,機械臂在火爐和組裝機之間瘋狂揮舞。AI自己規劃資源流向、建設自動化生產線,在一個每秒都在消耗資源的混沌環境裡從零搭出秩序。

若影片無法播放,請改看 來源頁

它在瀏覽器裡設計了一個完整的3D可列印模型。

先是幾行程式碼,然後一個帶有UI面板、工具列的3D CAD編輯器在螢幕上被憑空渲染出來。

接著Fable 5切換身份,在自己搭建的編輯器裡旋轉視角、拉伸網格、倒角邊緣,把一個抽象概念塑造成可以送去3D列印的實體模型。

圖片

它還推演了太陽系行星運動,從物理第一性原理出發自己推導軌道方程式,然後用推導結果預測日食。

圖片

最魔幻的一個,暗色畫布頂端打著「FIFTH SYMPHONY FABLE」的標題,貝多芬第五號交響曲的EDM混音響起,高精度粒子流體在畫面中心炸開。

低音轟鳴時湧起深紫色星雲,小提琴揚起時冰藍色流體如極光般撕裂黑暗,每一次流體碰撞和擴散都踩在節拍上。

若影片無法播放,請改看 來源頁

這首混音曲本身,也是Fable 5用程式碼生成的。

一個從沒「聽」過音樂的AI,用程式碼寫了一首貝多芬混音,再用程式碼寫了一段跟著節拍跳舞的流體模擬。

另外,讓Fable 5玩《殺戮尖塔》遊戲時,配上持久化的檔案記憶後,性能提升是Opus 4.8的3倍,到達遊戲最終關卡的頻率也是3倍。

記憶讓Fable 5變強的幅度,遠超同樣的記憶對上一代模型的效果。

模型在「從自己的經驗中學習」這件事上,已經跨到了另一個台階。

圖片

不用一行程式碼,裸眼通關「寶可夢」

不僅如此,Fable 5在「視覺能力」上也取得了巨大的進步,程度不亞於程式設計。

之前的Claude模型玩《寶可夢 火紅版》,需要一整套複雜的輔助工具才能推進,地圖導航、遊戲狀態解析、額外的工具介面,全都得餵進去,還經常卡關。

Fable 5只用了一個極簡的視覺介面。

若影片無法播放,請改看 來源頁

沒有地圖,沒有導航輔助,沒有任何額外的遊戲狀態資訊。

就靠看螢幕截圖,從頭到尾打通了整個《寶可夢 火紅版》。

Anthropic放出了一段完整的縮時攝影影片記錄了全過程。AI看著像素畫面做決策、踩草叢遇敵、選技能打道館、穿迷宮,一路推到通關。

圖片

這意味著,Fable 5能從科學期刊裡複雜的圖表中提取精確數值,能僅憑幾張截圖把一個網路應用的原始碼完整重建出來。

模型對視覺資訊的理解深度到了一個新的層級,不再是「能看圖說話」,而是「看懂了,然後能動手」。

圖片

圖片

AI當科學家

Science級成果一週搞定

如果說程式設計和視覺還在「提效」的範疇裡,Fable 5和Mythos 5在生命科學領域做的事情,已經開始讓人重新思考「AI能做什麼」這個問題了。

在蛋白質設計任務中,Mythos 5實現了全自動研發。

從選靶點、跑設計到失敗自糾錯一氣呵成,14個疾病靶點成功斬獲9個強候選方案,精準覆蓋免疫、神經退化性疾病及肌肉疾病。

圖片

最炸裂的,是基因體學。

Mythos 5花了一週多時間,幾乎沒人管,自己搜集了138個物種、幾百萬個細胞的數據,自己設計並訓練了一個機器學習模型。

訓練出來的東西,甚至超越了近期發表在《Science》上的同類研究。

模型體積小100倍,性能卻反超。Anthropic打算過幾個月把結果發出來。

圖片

圖片

拒絕「蒸餾」,換腦Opus 4.8

由此,不難理解,為何Anthropic為Fable 5加了一層「安全分類器」。

尤其是,碰到網路安全、生物化學或模型蒸餾相關的請求時,系統自動把回答交給Opus 4.8處理。

圖片

越獄抵抗力對比圖(400輪紅隊測試)

有不少開發者吐槽,一些簡單任務,也會觸發Fable 5的「紅線」,直接降級。

圖片

圖片

值得注意的是,想要「蒸餾」Fable 5,可沒那麼簡單。

不同於網安任務,觸發此類問題後,Fable 5不會通知,直接透過提示詞修改、控制向量和PEET等方法,直接限制模型的能力。

Anthropic預估,大概約0.03%的流量會受到波及。

圖片

圖片

王座之戰,「神話」開場

GPT-5.5發佈才一個半月,能看到Fable 5車尾燈的項目就剩兩個。

Blueprint-Bench 2差2.4個百分點,Terminal-Bench上GPT-5.5憑藉Codex CLI拿了83.4%,是整張表裡最近的一項。

往下,全是單方面屠殺。

圖片

而Anthropic在出拳的同時,還藏了一層意思在名字裡。

Mythos,是文明解釋自身命運的神聖敘事。Fable,是人類最古老的道德教化。

古希臘哲學的誕生,曾被視為Logos對Mythos的一次勝利,人類學會了用理性解釋世界。

圖片

如今一家公司站在ASI的門檻上,把最強的模型命名為「神話」與「寓言」。

機器征服Logos的速度,所有人都看到了。

接下來的問題是,意義的製造和善惡的判斷,還能不能留在人類手裡。

參考資料:

https://www.anthropic.com/news/claude-fable-5-mythos-5

https://x.com/claudeai/status/2064394146916229443

https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf

編輯:摩西 桃子

秒追ASI

⭐點讚、轉發、在看 一鍵三連⭐

點亮星標,鎖定新智元極速推送!

圖片

圖片

圖片

相關文章推薦

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.