Project Glasswing

為人工智慧時代保障關鍵軟體安全

若影片無法播放，請改看來源頁。

簡介

今日我們宣布啟動 Project Glasswing¹，這是一項全新的倡議，集結了亞馬遜雲端運算服務（AWS）、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、摩根大通（JPMorganChase）、Linux 基金會、Microsoft、NVIDIA 以及 Palo Alto Networks，共同致力於保障全球最關鍵的軟體安全。

我們成立 Project Glasswing，是因為我們在 Anthropic 訓練的一款新型前緣模型中觀察到了一些能力，我們相信這將重塑網路安全領域。Claude Mythos Preview 是一款尚未發布的通用前緣模型，它揭示了一個嚴峻的事實：人工智慧模型的程式碼能力已達到一定水準，在發現和利用軟體漏洞方面，除了頂尖人類的專家外，已能超越所有其他對象。

Mythos Preview 已經發現了數千個高嚴重性的漏洞，其中包括存在於每一個主要作業系統和網頁瀏覽器中的漏洞。鑑於人工智慧的進展速度，這類能力不久後將廣泛擴散，甚至可能落入不致力於安全部署的行動者手中。其後果——對經濟、公共安全和國家安全而言——可能極為嚴重。Project Glasswing 是一項緊急嘗試，旨在將這些能力用於防禦目的。

作為 Project Glasswing 的一部分，上述啟動合作夥伴將在其防禦性安全工作中使用 Mythos Preview；Anthropic 將分享我們所學到的知識，使整個產業都能受益。我們還將使用權限擴展至另外 40 多個構建或維護關鍵軟體基礎設施的組織，以便它們能夠利用該模型掃描和保護自有及開源系統。Anthropic 承諾為這些工作提供高達 1 億美元的 Mythos Preview 使用點數，並向開源安全組織直接捐贈 400 萬美元。

Project Glasswing 僅是起點。沒有任何單一組織能夠獨自解決這些網路安全問題：前緣 AI 開發者、其他軟體公司、安全研究人員、開源維護者以及世界各國政府都扮演著至關重要的角色。保衛全球網路基礎設施的工作可能需要數年時間；而前緣 AI 能力很可能在短短幾個月內就會大幅進步。為了讓網路防禦者取得優勢，我們必須即刻行動。

人工智慧時代的網路安全

我們每個人每天都依賴的軟體——負責運行銀行系統、儲存醫療記錄、串聯物流網絡、維持電網運作等等——向來都存在漏洞。許多漏洞微不足道，但有些是嚴重的安全缺陷，一旦被發現，可能讓網路攻擊者劫持系統、中斷運作或竊取資料。

我們已經目睹了網路攻擊對重要企業網絡、醫療系統、能源基礎設施、交通樞紐以及全球各地政府機構造成的嚴重後果。在全球舞台上，來自中國、伊朗、北韓和俄羅斯等國家支持的攻擊行動者，威脅到支撐平民生活和軍事戰備的基礎設施。即使是針對個別醫院或學校的小規模攻擊，仍可能造成重大經濟損失、洩露敏感數據，甚至危及生命。目前全球網路犯罪的財務成本難以估計，但可能每年高達 5000 億美元。

由於發現和利用軟體漏洞需要只有少數專業安全專家才具備的專業知識，許多軟體缺陷多年來一直未被察覺。隨著最新的前緣 AI 模型出現，發現和利用軟體漏洞所需的成本、精力和專業門檻都大幅下降。過去一年來，AI 模型在閱讀和推理程式碼方面變得越來越有效——特別是它們展現出驚人的能力，能夠發現漏洞並找出利用這些漏洞的方法。Claude Mythos Preview 在這些網路技能上展現了飛躍式的進步——它發現的漏洞在某些情況下甚至逃過了數十年的人工審查和數百萬次自動化安全測試，而其開發的攻擊手法也日益複雜。

距離首屆DARPA 網路大挑戰已過十年，前緣 AI 模型在發現和利用漏洞方面，已開始與最頂尖的人類專家競爭。若缺乏必要的防護措施，這些強大的網路能力可能被用來利用全球最重要軟體中現有的眾多缺陷。這將使各類網路攻擊變得更頻繁且更具破壞性，並賦予美國及其盟友的對手更多力量。因此，解決這些問題是民主國家重要的安全優先事項。

儘管 AI 增強型網路攻擊的風險嚴峻，但我們仍有理由保持樂觀：同樣讓 AI 模型在錯誤的人手中變得危險的能力，若用於尋找和修復重要軟體中的缺陷，以及開發安全性更高、漏洞更少的新軟體，則顯得無比珍貴。Project Glasswing 是邁向讓防禦者在即將到來的 AI 驅動網路安全時代取得持久優勢的重要一步。

若影片無法播放，請改看來源頁。

使用 Claude Mythos Preview 識別漏洞與攻擊手法

在過去幾週內，我們使用 Claude Mythos Preview 識別出數千個零日漏洞（即軟體開發者先前未知的缺陷），其中許多屬於關鍵漏洞，存在於每一個主要作業系統和主要網頁瀏覽器中，以及其他一系列重要軟體內。

在我們的Frontier Red Team 部落格文章中，我們提供了部分已修補漏洞的技術細節，在某些情況下，還包括 Mythos Preview 發現的利用方式。它能夠完全自主地識別出這些漏洞中的絕大部分，並開發出許多相關的攻擊手法，完全無需任何人為引導。以下是三個範例：

Mythos Preview 在 OpenBSD 中發現了一個存在 27 年的漏洞——該系統被認為是世界上安全性最強的作業系統之一，用於運行防火牆和其他關鍵基礎設施。該漏洞允許攻擊者僅需連接即可遠端癱瘓任何運行該作業系統的機器；
它還發現了 FFmpeg 中一個存在 16 年的漏洞——該軟體被無數應用程式用於編碼和解碼影片——出現在一行已通過自動化測試工具 500 萬次測試卻從未發現問題的程式碼中；
該模型自主發現並串聯了 Linux 核心（運行全球大多數伺服器的軟體）中的多個漏洞，使攻擊者能將普通使用者權限提升至完全控制機器。

我們已向相關軟體的維護者通報了上述漏洞，目前這些漏洞均已修補。對於許多其他漏洞，我們今天提供了詳細資訊的加密雜湊值（請參閱 Red Team 部落格），並將在修復完成後揭露具體細節。

CyberGym 等評估基準強調了 Mythos Preview 與我們次佳模型 Claude Opus 4.6 之間的顯著差異：

網路安全漏洞重現

CyberGym

Mythos Preview

83.1%

Opus 4.6

66.6%

除了我們自己的工作外，許多合作夥伴已經使用 Claude Mythos Preview 數週。以下是他們的發現：

01 / 08

「AI 能力已經跨越了一個門檻，從根本上改變了保護關鍵基礎設施免受網路威脅所需的緊迫性，且已無法回頭。我們與這些模型的基礎合作表明，我們能夠以前所未有的速度和規模識別並修復硬體和軟體中的安全漏洞。這是一個深遠的轉變，也明確顯示出舊有的系統強化方式已不再足夠。技術提供者必須立即積極採用新方法，客戶也需要準備好部署。這就是 Cisco 加入 Project Glasswing 的原因——這項工作太重要、太緊急，無法獨自完成。」

Anthony Grieco

思科（Cisco）資深副總裁暨安全與信任長

閱讀公告

「在 AWS，我們在威脅出現之前就構建防禦措施，從我們的客製化晶片到整個技術堆疊。安全對我們來說不是一個階段，而是不間斷且融入我們所做的一切之中。我們的團隊每天分析超過 400 兆個網路流量以尋找威脅，AI 是我們大規模防禦能力的核心。我們一直在自己的安全運作中測試 Claude Mythos Preview，將其應用於關鍵程式碼庫，它已經幫助我們加強了程式碼的安全性。我們將深厚的安全專業知識帶入與 Anthropic 的合作夥伴關係，並協助強化 Claude Mythos Preview，讓更多組織能夠在設定標準的安全性下推進他們最具雄心的工作。」

Amy Herzog

亞馬遜雲端運算服務（AWS）副總裁暨資訊安全長

閱讀公告

「當我們進入網路安全不再僅受人類能力限制的階段時，負責任地利用 AI 來大規模提升安全性並降低風險的機會是前所未有的。加入 Project Glasswing 並使用 Claude Mythos Preview，使我們能夠及早識別和減輕風險，並增強我們的安全與開發解決方案，從而更好地保護客戶和 Microsoft。在針對我們的開源安全基準 CTI-REALM 進行測試時，Claude Mythos Preview 顯示出比先前模型有顯著改善。我們期待與 Anthropic 及更廣泛的產業合作，為所有人改善安全成果。」

Igor Tsyganskiy

Microsoft 網路安全與 Microsoft Research 執行副總裁

閱讀公告

「從發現漏洞到被對手利用之間的時間窗口已經崩潰——過去需要幾個月的時間，現在有了 AI 只需幾分鐘。Claude Mythos Preview 展示了防禦者在大規模下現在能做到的事情，而對手將不可避免地尋求利用相同的能力。這不是放慢腳步的理由；而是讓我們一起更快行動的理由。如果你想部署 AI，你就需要安全。這就是 CrowdStrike 從第一天起就參與這項努力的原因。」

Elia Zaitsev

CrowdStrike 技術長

閱讀公告

「過去，安全專業知識是只有擁有大型安全團隊的組織才能享受的奢侈品。開源維護者——其軟體支撐著全球大部分關鍵基礎設施——歷來只能靠自己解決安全問題。開源軟體構成了現代系統中絕大多數的程式碼，包括 AI 代理用來編寫新軟體的系統。透過讓這些關鍵開源程式碼庫的維護者能夠使用新一代 AI 模型，主動大規模識別並修復漏洞，Project Glasswing 提供了一條可信的途徑來改變這種狀況。這就是 AI 增強型安全如何能成为每位維護者（而不僅僅是那些能負擔昂貴安全團隊的人）值得信賴的助手。」

Jim Zemlin

Linux 基金會執行長

閱讀公告

「促進金融體系的網路安全與韌性是摩根大通（JPMorganChase）使命的核心，我們認為，當領先機構共同應對共同挑戰時，產業會變得更強大。Project Glasswing 提供了一個獨特的早期機會，讓我們能夠在自有條件下並與受人尊敬的技術領導者一起，評估用於關鍵基礎設施防禦性網路安全的下一代 AI 工具。我們將採取嚴格、獨立的方法來決定如何推進以及我們能提供協助的地方。Anthropic 的倡議反映了此時此刻所需的前瞻性與協作方式。」

Pat Opet

摩根大通（JPMorganChase）資訊安全長

「Google 很高興看到這項跨產業網路安全倡議的成形，並透過 Vertex AI 向參與者提供 Mythos Preview。產業界攜手應對新興安全問題向來至關重要，無論是後量子密碼學、負責任的零日漏洞披露、安全的開源軟體，還是防禦基於 AI 的攻擊。我們長期以來一直認為，AI 帶來了新的挑戰，也為網路防禦開啟了新機遇，這就是為什麼我們構建了由 AI 驅動的工具（如 Big Sleep 和 CodeMender）來尋找並修復關鍵軟體缺陷。我們將繼續投資於我們領先的網路安全平台，並建立以保護使用者、客戶、生態系統和國家安全為核心的文化。」

Heather Adkins

Google 安全工程副總裁

閱讀公告

「在過去幾週，我們有機會使用 Claude Mythos Preview 模型，識別出前幾代模型完全錯過的複雜漏洞。這不僅是尋找先前隱藏漏洞的遊戲規則改變者，也標誌著一個危險的轉變，攻擊者很快就能找到更多零日漏洞，並比以往更快地開發攻擊手法。很明顯，這些模型需要掌握在開源擁有者和防禦者手中，以便在攻擊者取得這些能力之前找到並修復這些漏洞。或許更重要的是：每個人都需要為 AI 輔助的攻擊者做好準備。將會有更多攻擊、更快的攻擊和更複雜的攻擊。現在是現代化各地網路安全堆疊的時候了。我們讚賞 Anthropic 與產業合作，確保這些強大的能力優先考慮防禦。」

Lee Klarich

Palo Alto Networks 產品與技術長

閱讀公告

Claude Mythos Preview 強大的網路能力源於其強大的代理編碼和推理技能。例如，如下方評估結果所示，該模型在各類軟體編碼任務中的得分均高於迄今為止開發的任何其他模型。

SWE-bench Pro

Mythos Preview

77.8%

Opus 4.6

53.4%

Terminal-Bench 2.0

Mythos Preview

82.0%

Opus 4.6

65.4%

SWE-bench Multimodal (內部實作)

Mythos Preview

59.0%

Opus 4.6

27.1%

SWE-bench Multilingual

Mythos Preview

87.3%

Opus 4.6

77.8%

SWE-bench Verified

Mythos Preview

93.9%

Opus 4.6

80.8%

• SWE-bench Verified、Pro 和 Multilingual：我們的記憶化篩選機制在這些 SWE-bench 評估中標記了一部分問題。排除任何顯示出記憶化跡象的問題後，Mythos Preview 相對於 Opus 4.6 的改進幅度依然成立。• SWE-bench Multimodal：我們對 Mythos Preview 和 Opus 4.6 使用了內部實作。分數與公開排行榜分數不具直接可比性。• Terminal-Bench 2.0：我們使用了 Terminus-2 框架，在最大努力下進行自適應思考，每個任務的總代幣預算為 100 萬。所有實驗均使用 1 倍保證/3 倍上限的資源配置，並對每個任務進行五次嘗試取平均值。當我們將超時限制增加到四小時並使用 Terminal-Bench 2.1 更新時，Mythos Preview 得分為 92.1%。

GPQA Diamond

Mythos Preview

94.6%

Opus 4.6

91.3%

人類最後一考 (Humanity's Last Exam)

Mythos Preview (無工具)

56.8%

Opus 4.6 (無工具)

40.0%

Mythos Preview (含工具)

64.7%

Opus 4.6 (含工具)

53.1%

人類最後一考：我們發現 Mythos 在低努力下於 HLE 仍表現良好，這可能表明存在某種程度的記憶化。

BrowseComp

Mythos Preview

86.9%

Opus 4.6

83.7%

OSWorld-Verified

Mythos Preview

79.6%

Opus 4.6

72.7%

BrowseComp：Claude Mythos Preview 的分數高於 Opus 4.6，同時使用的代幣數量減少了 4.9 倍。

有關該模型能力、安全屬性及其一般特性的更多資訊，請參閱Claude Mythos Preview 系統卡。

我們目前無計劃全面發布 Claude Mythos Preview，但我們的最終目標是讓使用者能夠大規模安全地部署 Mythos 級別模型——不僅用於網路安全目的，也包括此類高能力模型帶來的無數其他益處。為此，我們需要在開發網路安全（及其他）防護措施方面取得進展，以偵測並封鎖模型最危險的輸出。我們計劃在即將推出的 Claude Opus 模型中推出新的防護措施，讓我們能夠在不具備 Mythos Preview 同等風險等級的模型上改進和完善這些措施²。

Project Glasswing 的規劃

今日的宣布僅是長期努力的開始。要取得成功，需要科技產業及更廣泛領域的廣泛參與。

Project Glasswing 的合作夥伴將獲得使用 Claude Mythos Preview 的權限，以在其基礎系統中尋找並修復漏洞或弱點——這些系統代表了全球極大比例的共用網路攻擊面。我們預計這項工作將聚焦於本地漏洞檢測、二進位檔案的黑盒測試、端點安全防護以及系統滲透測試等任務。

Anthropic 承諾向 Project Glasswing 及其他參與者提供 1 億美元的模型使用點數，將涵蓋此次研究預覽期間的大量使用量。此後，Claude Mythos Preview 將以每百萬輸入/輸出代幣 25/125 美元的價格向參與者提供（參與者可透過 Claude API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 存取該模型）。

除了承諾提供模型使用點數外，我們還透過 Linux 基金會向 Alpha-Omega 和 OpenSSF 捐贈了 250 萬美元，並向 Apache 軟體基金會捐贈了 150 萬美元，以協助開源軟體的維護者應對這一變化的格局（有興趣的維護者可透過Claude for Open Source計畫申請存取權限）。

我們希望這項工作能擴大範圍並持續數月，我們將盡可能多地分享資訊，以便其他組織能將經驗教訓應用於自身的安全防護。合作夥伴將在能力範圍內彼此分享資訊與最佳實踐；在 90 天內，Anthropic 將公開發布我們所學到的內容，以及可公開揭露的已修復漏洞和改進措施。我們還將與頂尖安全組織合作，提出一套實用建議，說明安全實踐應如何在 AI 時代演進。這可能包括：

漏洞披露流程；
軟體更新流程；
開源與供應鏈安全；
軟體開發生命週期與安全設計（Secure-by-design）實踐；
受監管產業的標準；
分級擴展與自動化；以及
修補自動化。

Anthropic 也持續與美國政府官員就 Claude Mythos Preview 及其攻防網路能力進行討論。如前所述，保護關鍵基礎設施是民主國家的國家安全首要任務——這些網路能力的出現是另一個原因，說明美國及其盟友必須在 AI 技術方面保持決定性領先。政府在協助維持這一領先地位，以及評估和減輕與 AI 模型相關的國家安全風險方面，扮演著至關重要的角色。我們已準備好與地方、州和聯邦層級的代表合作，協助完成這些任務。

我們希望 Project Glasswing 能成為跨產業和公共部門更大規模努力的種子，各方共同應對有關強大模型對安全影響的最大問題。我們邀請其他 AI 產業成員加入我們，共同制定產業標準。在中長期內，一個能匯集私營和公共部門組織的獨立第三方機構，可能是持續推動此類大規模網路安全專案的理想歸宿。

附錄

該計畫以玻璃翼蝶（Greta oto）命名。這個隱喻有兩種應用方式：蝴蝶透明的翅膀使其能藏身於眾目睽睽之下，就像本文中討論的漏洞一樣；它們也能使其規避傷害——就像我們在主張的方法中所提倡的透明度。
受這些防護措施影響的合法工作的安全專業人員將能夠申請即將推出的網路驗證計畫（Cyber Verification Program）。

Project Glasswing：為人工智慧時代保障關鍵軟體安全

Project Glasswing

簡介

人工智慧時代的網路安全

使用 Claude Mythos Preview 識別漏洞與攻擊手法

Project Glasswing 的規劃

附錄

相關文章推薦

分享網址