Project Glasswing
為人工智慧時代保障關鍵軟體安全
簡介
今日我們宣布啟動 Project Glasswing1,這是一項全新的倡議,集結了亞馬遜雲端運算服務(AWS)、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、摩根大通(JPMorganChase)、Linux 基金會、Microsoft、NVIDIA 以及 Palo Alto Networks,共同致力於保障全球最關鍵的軟體安全。
我們成立 Project Glasswing,是因為我們在 Anthropic 訓練的一款新型前緣模型中觀察到了一些能力,我們相信這將重塑網路安全領域。Claude Mythos Preview 是一款尚未發布的通用前緣模型,它揭示了一個嚴峻的事實:人工智慧模型的程式碼能力已達到一定水準,在發現和利用軟體漏洞方面,除了頂尖人類的專家外,已能超越所有其他對象。
Mythos Preview 已經發現了數千個高嚴重性的漏洞,其中包括存在於每一個主要作業系統和網頁瀏覽器中的漏洞。鑑於人工智慧的進展速度,這類能力不久後將廣泛擴散,甚至可能落入不致力於安全部署的行動者手中。其後果——對經濟、公共安全和國家安全而言——可能極為嚴重。Project Glasswing 是一項緊急嘗試,旨在將這些能力用於防禦目的。
作為 Project Glasswing 的一部分,上述啟動合作夥伴將在其防禦性安全工作中使用 Mythos Preview;Anthropic 將分享我們所學到的知識,使整個產業都能受益。我們還將使用權限擴展至另外 40 多個構建或維護關鍵軟體基礎設施的組織,以便它們能夠利用該模型掃描和保護自有及開源系統。Anthropic 承諾為這些工作提供高達 1 億美元的 Mythos Preview 使用點數,並向開源安全組織直接捐贈 400 萬美元。
Project Glasswing 僅是起點。沒有任何單一組織能夠獨自解決這些網路安全問題:前緣 AI 開發者、其他軟體公司、安全研究人員、開源維護者以及世界各國政府都扮演著至關重要的角色。保衛全球網路基礎設施的工作可能需要數年時間;而前緣 AI 能力很可能在短短幾個月內就會大幅進步。為了讓網路防禦者取得優勢,我們必須即刻行動。

人工智慧時代的網路安全
我們每個人每天都依賴的軟體——負責運行銀行系統、儲存醫療記錄、串聯物流網絡、維持電網運作等等——向來都存在漏洞。許多漏洞微不足道,但有些是嚴重的安全缺陷,一旦被發現,可能讓網路攻擊者劫持系統、中斷運作或竊取資料。
我們已經目睹了網路攻擊對重要企業網絡、醫療系統、能源基礎設施、交通樞紐以及全球各地政府機構造成的嚴重後果。在全球舞台上,來自中國、伊朗、北韓和俄羅斯等國家支持的攻擊行動者,威脅到支撐平民生活和軍事戰備的基礎設施。即使是針對個別醫院或學校的小規模攻擊,仍可能造成重大經濟損失、洩露敏感數據,甚至危及生命。目前全球網路犯罪的財務成本難以估計,但可能每年高達 5000 億美元。
由於發現和利用軟體漏洞需要只有少數專業安全專家才具備的專業知識,許多軟體缺陷多年來一直未被察覺。隨著最新的前緣 AI 模型出現,發現和利用軟體漏洞所需的成本、精力和專業門檻都大幅下降。過去一年來,AI 模型在閱讀和推理程式碼方面變得越來越有效——特別是它們展現出驚人的能力,能夠發現漏洞並找出利用這些漏洞的方法。Claude Mythos Preview 在這些網路技能上展現了飛躍式的進步——它發現的漏洞在某些情況下甚至逃過了數十年的人工審查和數百萬次自動化安全測試,而其開發的攻擊手法也日益複雜。
距離首屆DARPA 網路大挑戰已過十年,前緣 AI 模型在發現和利用漏洞方面,已開始與最頂尖的人類專家競爭。若缺乏必要的防護措施,這些強大的網路能力可能被用來利用全球最重要軟體中現有的眾多缺陷。這將使各類網路攻擊變得更頻繁且更具破壞性,並賦予美國及其盟友的對手更多力量。因此,解決這些問題是民主國家重要的安全優先事項。
儘管 AI 增強型網路攻擊的風險嚴峻,但我們仍有理由保持樂觀:同樣讓 AI 模型在錯誤的人手中變得危險的能力,若用於尋找和修復重要軟體中的缺陷,以及開發安全性更高、漏洞更少的新軟體,則顯得無比珍貴。Project Glasswing 是邁向讓防禦者在即將到來的 AI 驅動網路安全時代取得持久優勢的重要一步。

使用 Claude Mythos Preview 識別漏洞與攻擊手法
在過去幾週內,我們使用 Claude Mythos Preview 識別出數千個零日漏洞(即軟體開發者先前未知的缺陷),其中許多屬於關鍵漏洞,存在於每一個主要作業系統和主要網頁瀏覽器中,以及其他一系列重要軟體內。
在我們的Frontier Red Team 部落格文章中,我們提供了部分已修補漏洞的技術細節,在某些情況下,還包括 Mythos Preview 發現的利用方式。它能夠完全自主地識別出這些漏洞中的絕大部分,並開發出許多相關的攻擊手法,完全無需任何人為引導。以下是三個範例:
- Mythos Preview 在 OpenBSD 中發現了一個存在 27 年的漏洞——該系統被認為是世界上安全性最強的作業系統之一,用於運行防火牆和其他關鍵基礎設施。該漏洞允許攻擊者僅需連接即可遠端癱瘓任何運行該作業系統的機器;
- 它還發現了 FFmpeg 中一個存在 16 年的漏洞——該軟體被無數應用程式用於編碼和解碼影片——出現在一行已通過自動化測試工具 500 萬次測試卻從未發現問題的程式碼中;
- 該模型自主發現並串聯了 Linux 核心(運行全球大多數伺服器的軟體)中的多個漏洞,使攻擊者能將普通使用者權限提升至完全控制機器。
我們已向相關軟體的維護者通報了上述漏洞,目前這些漏洞均已修補。對於許多其他漏洞,我們今天提供了詳細資訊的加密雜湊值(請參閱 Red Team 部落格),並將在修復完成後揭露具體細節。
CyberGym 等評估基準強調了 Mythos Preview 與我們次佳模型 Claude Opus 4.6 之間的顯著差異:
網路安全漏洞重現
除了我們自己的工作外,許多合作夥伴已經使用 Claude Mythos Preview 數週。以下是他們的發現:
Claude Mythos Preview 強大的網路能力源於其強大的代理編碼和推理技能。例如,如下方評估結果所示,該模型在各類軟體編碼任務中的得分均高於迄今為止開發的任何其他模型。
有關該模型能力、安全屬性及其一般特性的更多資訊,請參閱Claude Mythos Preview 系統卡。
我們目前無計劃全面發布 Claude Mythos Preview,但我們的最終目標是讓使用者能夠大規模安全地部署 Mythos 級別模型——不僅用於網路安全目的,也包括此類高能力模型帶來的無數其他益處。為此,我們需要在開發網路安全(及其他)防護措施方面取得進展,以偵測並封鎖模型最危險的輸出。我們計劃在即將推出的 Claude Opus 模型中推出新的防護措施,讓我們能夠在不具備 Mythos Preview 同等風險等級的模型上改進和完善這些措施2。

Project Glasswing 的規劃
今日的宣布僅是長期努力的開始。要取得成功,需要科技產業及更廣泛領域的廣泛參與。
Project Glasswing 的合作夥伴將獲得使用 Claude Mythos Preview 的權限,以在其基礎系統中尋找並修復漏洞或弱點——這些系統代表了全球極大比例的共用網路攻擊面。我們預計這項工作將聚焦於本地漏洞檢測、二進位檔案的黑盒測試、端點安全防護以及系統滲透測試等任務。
Anthropic 承諾向 Project Glasswing 及其他參與者提供 1 億美元的模型使用點數,將涵蓋此次研究預覽期間的大量使用量。此後,Claude Mythos Preview 將以每百萬輸入/輸出代幣 25/125 美元的價格向參與者提供(參與者可透過 Claude API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 存取該模型)。
除了承諾提供模型使用點數外,我們還透過 Linux 基金會向 Alpha-Omega 和 OpenSSF 捐贈了 250 萬美元,並向 Apache 軟體基金會捐贈了 150 萬美元,以協助開源軟體的維護者應對這一變化的格局(有興趣的維護者可透過Claude for Open Source計畫申請存取權限)。
我們希望這項工作能擴大範圍並持續數月,我們將盡可能多地分享資訊,以便其他組織能將經驗教訓應用於自身的安全防護。合作夥伴將在能力範圍內彼此分享資訊與最佳實踐;在 90 天內,Anthropic 將公開發布我們所學到的內容,以及可公開揭露的已修復漏洞和改進措施。我們還將與頂尖安全組織合作,提出一套實用建議,說明安全實踐應如何在 AI 時代演進。這可能包括:
- 漏洞披露流程;
- 軟體更新流程;
- 開源與供應鏈安全;
- 軟體開發生命週期與安全設計(Secure-by-design)實踐;
- 受監管產業的標準;
- 分級擴展與自動化;以及
- 修補自動化。
Anthropic 也持續與美國政府官員就 Claude Mythos Preview 及其攻防網路能力進行討論。如前所述,保護關鍵基礎設施是民主國家的國家安全首要任務——這些網路能力的出現是另一個原因,說明美國及其盟友必須在 AI 技術方面保持決定性領先。政府在協助維持這一領先地位,以及評估和減輕與 AI 模型相關的國家安全風險方面,扮演著至關重要的角色。我們已準備好與地方、州和聯邦層級的代表合作,協助完成這些任務。
我們希望 Project Glasswing 能成為跨產業和公共部門更大規模努力的種子,各方共同應對有關強大模型對安全影響的最大問題。我們邀請其他 AI 產業成員加入我們,共同制定產業標準。在中長期內,一個能匯集私營和公共部門組織的獨立第三方機構,可能是持續推動此類大規模網路安全專案的理想歸宿。
附錄
- 該計畫以玻璃翼蝶(Greta oto)命名。這個隱喻有兩種應用方式:蝴蝶透明的翅膀使其能藏身於眾目睽睽之下,就像本文中討論的漏洞一樣;它們也能使其規避傷害——就像我們在主張的方法中所提倡的透明度。
- 受這些防護措施影響的合法工作的安全專業人員將能夠申請即將推出的網路驗證計畫(Cyber Verification Program)。