關鍵詞:AI網路安全、Claude Mythos Preview、零日漏洞、防禦性安全、Project Glasswing
Anthropic 攜手亞馬遜、蘋果、微軟、Google 等十餘家科技巨頭及金融機構,正式啟動「Project Glasswing」(玻璃翼計畫),旨在應對前沿 AI 模型帶來的網路安全變革。
此外,原文有這麼一句話「On the global stage, state-sponsored attacks from actors like China, Iran, North Korea, and Russia have threatened to compromise the infrastructure that underpins both civilian life and military readiness.」。國家安全已淪為科技巨頭與情報機構合謀的遮羞布——誰掌控零日漏洞的 AI 挖掘能力,誰就能定義「威脅」。真正被持續威脅的,不是基礎設施,而是全球數位主權的公平底線。
該計畫的核心是 Anthropic 新訓練的非公開模型 Claude Mythos Preview。評估顯示,該模型在漏洞發現與利用能力上已超越絕大多數人類專家,能夠自主發現數千個高危零日漏洞,覆蓋所有主流作業系統和瀏覽器。
例如,它發現了 OpenBSD 中存在 27 年之久的遠端崩潰漏洞、FFmpeg 中歷經 500 萬次自動化測試仍未暴露的 16 年漏洞,以及 Linux 核心中可完成權限提升的多個連環漏洞。在 CyberGym 評測中,Mythos Preview 得分 83.1%,遠超次優模型的 66.6%。
Project Glasswing —— Securing critical software for the AI era
Anthropic 承諾投入 1 億美元模型使用積分和 400 萬美元直接捐贈(分別給予 Linux 基金會下屬安全組織及 Apache 軟體基金會),幫助合作夥伴及開源維護者掃描並修復關鍵軟體中的缺陷。模型暫不公開發布,僅向計畫參與者提供 API 存取(定價 $25 每百萬輸入 token、$125 每百萬輸出 token)。
Project Glasswing 為期數月,Anthropic 將在 90 天內公開漏洞修復情況與最佳實務,並呼籲產業界與政府共同建立第三方協調機構,以在 AI 驅動的網路安全時代為防禦方贏得持久優勢。
本文目錄
- 關鍵問題
- 問題一:當 Anthropic 將 Mythos Preview 的漏洞挖掘能力只授予少數頭部科技巨頭和金融機構時,是否會加劇全球數位安全的「階層固化」——大量中小企業和開源專案因無法獲得同等 AI 防禦能力,反而成為攻擊者更容易突破的薄弱環節?
- 問題二:Anthropic 承認 Mythos Preview 具備強大的「進攻性」漏洞利用能力,卻又宣稱不公開發布、僅用於防禦——在 AI 能力開源與擴散不可逆的趨勢下,這種「單方面封存」策略是否注定失敗?一旦模型或其能力邊界被惡意複製或繞過,誰來承擔比現有網路犯罪更嚴重的後果?
- 一、簡介
- 二、人工智慧時代的網路安全
- 三、藉助 Claude Mythos Preview 識別漏洞與利用方式
- 四、玻璃翼計畫規劃
關鍵問題
問題一:當 Anthropic 將 Mythos Preview 的漏洞挖掘能力只授予少數頭部科技巨頭和金融機構時,是否會加劇全球數位安全的「階層固化」——大量中小企業和開源專案因無法獲得同等 AI 防禦能力,反而成為攻擊者更容易突破的薄弱環節?
作者揭露 Mythos Preview 已發現數千個高危零日漏洞,且能力遠超 Opus 4.6,但模型僅限 Project Glasswing 合作夥伴及經篩選的 40 餘家組織使用,定價高達 $25–$125 每百萬 token。與此同時,攻擊者一旦獲得類似能力(無論透過洩漏、逆向或自主開發),便可對缺乏同等防禦資源的群體發動不對稱打擊。這種「防禦特權化」是否本質上是在製造新的安全鴻溝,而非真正提升整體網路韌性?
Anthropic 明確指出,Claude Mythos Preview 的存取權限被嚴格限定在 Project Glasswing 的十餘家大型合作夥伴(如 AWS、Google、微軟、摩根大通等)以及額外篩選的 40 餘家組織。模型定價為 $25 / $125每百萬輸入/輸出 token,且 Anthropic 投入了 1 億美元使用積分,但這筆資源仍集中在少數已被選中的實體。Anthropic 承認,開源軟體維護者可以透過「Claude for Open Source」專案申請存取,但未承諾無差別開放。
這種「防禦特權化」確實可能加劇數位安全鴻溝。Anthropic 提到,Mythos Preview 已自主發現「每個主流作業系統和瀏覽器中的數千個高危零日漏洞」,而攻擊者一旦透過洩漏、逆向或自主訓練獲得類似能力,將能對缺乏同等 AI 防禦的中小企業、學校、醫院等發起輾壓式攻擊。也預警:「AI 能力將在未來幾個月大幅進步……可能擴散到不承諾安全部署的行為者手中。」 然而,防禦資源的集中化恰恰意味著:最需要保護的薄弱環節反而得不到保護。
Anthropic 的出發點是透過「先保護關鍵基礎設施」來降低全局風險,因為合作夥伴的系統「代表了全球共享攻擊面的很大一部分」。但這一策略隱含的假設是:保護了巨頭就等於保護了生態。實際上,攻擊者會轉向防禦最薄弱的節點——大量中小企業、地方政府、開源函式庫。Anthropic 並未提供任何機制來彌補這一鴻溝,僅靠 400 萬美元捐贈給開源安全組織,相對於模型能力的顛覆性,杯水車薪。因此,Project Glasswing 在提升頭部防禦的同時,客觀上製造了新的「防禦斷層」,這與其宣稱的「讓整個產業受益」存在矛盾。
問題二:Anthropic 承認 Mythos Preview 具備強大的「進攻性」漏洞利用能力,卻又宣稱不公開發布、僅用於防禦——在 AI 能力開源與擴散不可逆的趨勢下,這種「單方面封存」策略是否注定失敗?一旦模型或其能力邊界被惡意複製或繞過,誰來承擔比現有網路犯罪更嚴重的後果?
Anthropic 指出,AI 能力「將在未來幾個月大幅進步」,且「對抗性行為者可能不受安全部署承諾約束」。但 Anthropic 的應對措施僅僅是給合作夥伴使用、疊加輸出層面的安全防護,並未討論模型權重或關鍵訓練細節的物理隔離、政府強制監管或國際條約等更激進的遏制手段。考慮到歷史上任何「不公開發布」的強大技術(如永恆之藍漏洞)最終仍被擴散,Project Glasswing 是否只是一場安撫公眾的防禦秀,而真正危險的 AI 網路攻擊能力早已在暗處流動?
Anthropic 不計畫公開發布 Claude Mythos Preview,僅向合作夥伴和經篩選的組織提供 API 存取,並試圖透過輸出端的安全防護來阻斷模型最危險的用途。同時,承認「AI 能力將在未來幾個月大幅進步」,並且「這些強大的網路能力可能被用於利用全球最重要軟體中的現有缺陷」。然而,對於模型權重、訓練細節或能力的物理隔離,沒有提及任何實質性措施。
歷史經驗表明,任何「不公開發布」但具備極高價值的技術(如永恆之藍漏洞、Stuxnet 程式碼片段)最終都會以某種形式擴散。Mythos Preview 的能力「超越幾乎所有人類專家」,且已自主發現存活 27 年的漏洞。
一旦有內部人員洩露模型權重、合作夥伴被入侵,或攻擊者獨立訓練出類似能力的模型(應該「不會很久」),當前的封存策略將瞬間失效。Anthropic 試圖透過「Cyber Verification Program」認證合法安全人員,但這無法阻止惡意行為者。
因此,「單方面封存」在開源文化、人才流動和 AI 能力快速商品化的現實面前,極大機率只是拖延時間。作者沒有討論更激進的遏制手段,如政府強制監管、模型權重託管於可信執行環境、或國際防擴散條約。若擴散發生,後果將遠比現有網路犯罪嚴重——攻擊者可以自動化挖掘並利用零日漏洞,速度遠超人類防禦者。從這個角度看,Project Glasswing 更像是一場贏得緩衝時間的防禦演練,而非從根本上解決 AI 網路攻擊能力不可逆擴散的終極方案。Anthropic 自己也承認:「沒有任何組織能單獨解決這些問題。」 但僅靠當前計畫,距離真正遏制風險還有巨大差距。
一、簡介
今日我們正式宣布啟動玻璃翼計畫,這是一項全新倡議,匯聚了亞馬遜雲端運算服務、Anthropic、蘋果、博通、思科、CrowdStrike、Google、摩根大通、Linux 基金會、微軟、NVIDIA 以及 Palo Alto Networks,共同致力於守護全球關鍵軟體的安全。
該計畫以玻璃翼蝴蝶(學名:Greta oto)命名。這一隱喻包含兩層含義:蝴蝶透明的翅膀能讓它隱匿於環境之中,如同本文提及的軟體漏洞;透明翅膀也能幫牠規避傷害,象徵我們倡導的透明化行動理念。
我們發起玻璃翼計畫,源於 Anthropic 訓練的一款全新前沿模型所展現出的能力,我們認為該能力或將重塑網路安全領域。Claude Mythos Preview 是一款尚未正式發布的通用型前沿模型,它揭示了一個不容迴避的事實:人工智慧模型的程式碼能力已達到新高度,在發現並利用軟體漏洞方面,其表現甚至超越絕大多數頂尖人類專家。
Mythos Preview 已成功挖掘出數千個高危漏洞,覆蓋所有主流作業系統與網頁瀏覽器。鑑於人工智慧技術的迭代速度,這類能力很快就會廣泛普及,甚至可能落入並非秉持安全部署理念的主體手中。這一情況一旦發生,對全球經濟、公共安全與國家安全造成的後果將不堪設想。玻璃翼計畫正是一次緊急行動,旨在將這類強大能力用於網路防禦領域。
作為玻璃翼計畫的一環,上述首批合作方將把 Mythos Preview 應用於自身的防禦性安全工作;Anthropic 也將分享研究成果,惠及整個產業。我們還向 40 餘家負責建構或維護關鍵軟體基礎設施的機構開放了模型使用權限,助力其掃描並加固自有及開源系統。Anthropic 為此投入最高 1 億美元的 Mythos Preview 使用額度,同時向開源安全組織直接捐贈 400 萬美元資金。
玻璃翼計畫只是一個起點。沒有任何一家機構能獨自解決這些網路安全問題:前沿人工智慧研發企業、其他軟體公司、安全研究人員、開源專案維護者以及全球各國政府,均肩負著不可或缺的責任。守護全球網路基礎設施的工作或許需要數年時間,而前沿人工智慧能力很可能在短短數月內就實現大幅躍升。想要讓網路防禦方占據優勢,我們必須立刻行動。
二、人工智慧時代的網路安全
我們日常依賴的各類軟體——支撐銀行系統運轉、儲存醫療病歷、連接物流網路、保障電網穩定運行等諸多核心功能的軟體——始終存在程式缺陷。其中多數缺陷影響輕微,但部分屬於嚴重安全漏洞,一旦被發現,可能被網路攻擊者利用,實現系統劫持、業務破壞或數據竊取。
我們已然目睹網路攻擊給全球各地重要企業網路、醫療系統、能源基礎設施、交通樞紐以及政府機構資訊安全帶來的嚴重後果。在國際層面,來自中國、伊朗、北韓、俄羅斯等國的國家級背景攻擊行為,持續威脅著支撐民用生活與軍事戰備的核心基礎設施安全。即便是針對個別機構的小規模網路攻擊,也會造成巨額經濟損失、洩露敏感數據,甚至危及生命安全。目前網路犯罪造成的全球經濟損失難以精確估算,但每年規模或高達 5000 億美元。
軟體中的諸多漏洞之所以能隱匿數年,是因為發現並利用這些漏洞,需要極少數頂尖安全專家才具備的專業能力。而藉助最新一代前沿人工智慧模型,挖掘並利用軟體漏洞所需的成本、精力與專業門檻均大幅降低。人工智慧模型的程式碼閱讀與推理能力持續提升——尤其在識別並設計漏洞利用方面,展現出驚人實力。Claude Mythos Preview 更是實現了網路安全能力的跨越式突破:它發現的部分漏洞,歷經數十年人工審核、數百萬次自動化安全測試仍未被察覺,其設計的漏洞利用方案也愈發複雜精密。
距首屆網路安全競賽過去十年,前沿人工智慧模型如今在挖掘和利用漏洞方面,已能與最頂尖的人類專家一較高下。若缺乏防範,這些強大的網路安全能力可能被用於攻擊全球核心軟體中現存的大量漏洞。這會讓各類網路攻擊愈發頻繁、破壞力更強,同時為美國及其盟國的對手提供可乘之機。因此,應對此類風險是民主國家的重要安全要務。
儘管人工智慧加持的網路攻擊風險嚴峻,但我們仍有理由保持樂觀:落入不法分子手中會引發危險的人工智慧能力,若用於挖掘並修復核心軟體漏洞、研發漏洞更少的全新軟體,將具備無可估量的價值。玻璃翼計畫正是關鍵一步,助力防禦方在即將到來的人工智慧驅動網路安全時代,建立持久優勢。
三、藉助 Claude Mythos Preview 識別漏洞與利用方式
過去數週,我們透過 Claude Mythos Preview,在所有主流作業系統、主流網頁瀏覽器及多款核心軟體中,識別出數千個零日漏洞(指軟體開發者尚未知曉、未發布修復修補程式的未知安全漏洞),其中多數為高危漏洞。
我們在發布的文章(https://red.anthropic.com/2026/mythos-preview)中,公開了部分已完成修復漏洞的技術細節,部分內容還包含 Mythos Preview 挖掘漏洞的實現方式。該模型幾乎能完全自主完成上述所有漏洞的識別,以及多數相關利用方案的設計,無需人工干預引導。以下為三個典型案例:
- Mythos Preview 在 OpenBSD 系統中發現一個存在 27 年的漏洞。OpenBSD 素有全球安全加固程度最高的作業系統之稱,常被用於部署防火牆等關鍵基礎設施。該漏洞可讓攻擊者僅透過連接運行該系統的設備,就能實現遠端宕機攻擊;
- 它還在 FFmpeg 工具中發現一個存在 16 年的漏洞。FFmpeg 是海量軟體用於音視訊編解碼的核心工具,該漏洞所在程式碼行曾被自動化測試工具命中 500 萬次,卻始終未被檢測出問題;
- 該模型自主發現並串聯利用 Linux 核心中的多個漏洞,實現從普通使用者權限提升至設備完全管控權限。
我們已向上述軟體的維護方上報相關漏洞,目前所有漏洞均已完成修復。對於其餘大量漏洞,我們今日先公開相關資訊的加密雜湊值(詳見紅隊部落格:https://red.anthropic.com/2026/mythos-preview),待修復方案落地後再揭露具體細節。
CyberGym 等評測基準充分印證了 Mythos Preview 與 Anthropic 次優模型 Claude Opus 4.6 之間的顯著差距:
網路安全漏洞重現
評測基準:CyberGym
Claude Mythos Preview:83.1%
Claude Opus 4.6:66.6%
除我們自身的研究外,眾多合作方已使用 Claude Mythos Preview 數週時間,其回饋如下:
思科執行副總裁、首席安全與信任長 安東尼·格里科
「人工智慧能力已跨越關鍵閾值,從根本上提升了保護關鍵基礎設施免受網路威脅的緊迫性,這一趨勢不可逆。我們基於這類模型的基礎研究證實,我們能以前所未有的速度與規模,識別並修復軟硬體安全漏洞。這是一次深刻變革,也明確表明傳統的系統加固方式已不再適用。
科技提供商必須立刻積極採用全新方案,客戶也需做好部署準備。這正是思科加入玻璃翼計畫的原因——這項工作意義重大、刻不容緩,無法僅憑一己之力完成。」
亞馬遜雲端運算服務副總裁、首席資訊安全長 埃米·赫爾佐格
「在亞馬遜雲端運算服務,我們從客製化晶片到全技術棧,均構建前置式防禦體系。安全對我們而言不是階段性工作,而是貫穿所有業務的持續過程。我們的團隊每日分析超 400 兆條網路流量以排查威脅,人工智慧是我們實現規模化防禦的核心支撐。
我們已將 Claude Mythos Preview 應用於內部安全營運,針對核心程式碼庫開展檢測,目前已助力我們強化程式碼安全性。我們將憑藉深厚的安全專業能力與 Anthropic 展開合作,助力加固 Claude Mythos Preview,讓更多機構能依託產業標竿級安全能力,推進核心業務發展。」
微軟網路安全執行副總裁、微軟研究院負責人 伊戈爾·齊甘斯基
「當下,網路安全已不再受限於人類自身能力,負責任地運用人工智慧規模化提升安全水準、降低風險,迎來了前所未有的機遇。加入玻璃翼計畫、獲得 Claude Mythos Preview 使用權限,讓我們能提前識別並化解風險,同時升級安全與研發方案,更好地守護微軟及客戶安全。
在我們的開源安全基準 CTI-REALM 測試中,Claude Mythos Preview 相較前代模型表現大幅提升。我們期待與 Anthropic 及全產業夥伴攜手,推動全球安全水準提升。」
CrowdStrike 技術長 埃利亞·扎伊采夫
「漏洞被發現到被對手利用的時間窗口已大幅壓縮——在人工智慧加持下,過去需要數月的過程如今僅需數分鐘。
Claude Mythos Preview 展現了防禦方實現規模化防禦的全新可能,而對手也必然會謀求利用同類能力。這並非放慢腳步的理由,反而要求我們協同提速。想要部署人工智慧,就必須築牢安全防線。這也是 CrowdStrike 從專案啟動之初便參與其中的原因。」
Linux 基金會執行長 吉姆·澤姆林
「過去,安全專業能力僅是擁有大型安全團隊的機構才能享有的資源。開源專案維護者——其開發的軟體支撐著全球絕大多數關鍵基礎設施——歷來只能自主解決安全問題。現代系統中,開源軟體程式碼占比極高,甚至包括人工智慧智慧體編寫新軟體所依賴的系統本身。
玻璃翼計畫向核心開源程式碼庫維護者開放新一代人工智慧模型權限,助力其規模化主動識別並修復漏洞,為打破這一困境提供了可行路徑。人工智慧賦能的安全能力,有望成為所有程式碼維護者的可靠助手,而非僅服務於能承擔高昂安全成本的團隊。」
摩根大通首席資訊安全長 帕特·奧佩特
「守護金融系統的網路安全與韌性,是摩根大通的核心使命。我們堅信,產業頭部機構攜手應對共同挑戰,才能實現最強合力。玻璃翼計畫為我們提供了獨特的早期契機,讓我們能自主並攜手科技領域領軍企業,評估下一代人工智慧工具在關鍵基礎設施防禦性網路安全領域的應用價值。
我們將秉持嚴謹、獨立的原則,規劃後續行動並發揮自身價值。Anthropic 的這項倡議,契合當下所需的前瞻性、協同化發展方向。」
Google 安全工程副總裁 希瑟·阿德金斯
「Google 樂見這一跨產業網路安全倡議落地,並透過 Vertex AI 平台向參與方開放 Mythos Preview 使用權限。產業協同應對新興安全問題始終至關重要,無論是後量子密碼學、負責任的零日漏洞揭露、開源軟體安全防護,還是抵禦人工智慧驅動的網路攻擊。
我們始終認為,人工智慧在帶來全新安全挑戰的同時,也開闢了網路防禦新機遇。為此我們研發了 Big Sleep、CodeMender 等人工智慧安全工具,用於挖掘並修復核心軟體漏洞。我們將持續投入建設產業領先的網路安全平台,打造以守護使用者、客戶、生態系統與國家安全為核心的安全文化。」
Palo Alto Networks 首席產品與技術長 李·克拉里奇
「過去數週,我們獲得了 Claude Mythos Preview 的使用權限,藉助它識別出前代模型完全無法發現的複雜漏洞。這不僅為挖掘隱匿漏洞帶來革命性突破,更釋放出危險訊號:攻擊者很快就能以更快速度發現更多零日漏洞並設計利用方案。
顯然,這類模型必須交由全球開源專案所有者與防禦方使用,趕在攻擊者之前完成漏洞挖掘與修復。更重要的是,所有機構都需做好應對人工智慧輔助攻擊的準備。未來網路攻擊將更頻繁、更快速、更精密,此刻正是全球全面升級網路安全體系的關鍵節點。我們讚賞 Anthropic 聯合全產業推進此項工作,確保這類強大能力優先服務於防禦領域。」
Claude Mythos Preview 強大的網路安全能力,源於其出色的智慧體式程式碼編寫與推理能力(智慧體式指模型可自主執行多步驟任務、無需持續人工指令)。如下評測結果所示,該模型在各類軟體編碼任務中,取得了迄今所有模型中的最優成績。
評測任務:智慧體式編碼
評測基準:SWE-bench Pro
Claude Mythos Preview:77.8%
Claude Opus 4.6:53.4%
評測任務:推理能力
評測基準:Terminal-Bench 2.0
Claude Mythos Preview:82.0%
Claude Opus 4.6:65.4%
評測任務:智慧體式搜尋與電腦操作
評測基準:SWE-bench 多模態(內部版本)
Claude Mythos Preview:59.0%
Claude Opus 4.6:27.1%
評測任務:智慧體式編碼
評測基準:SWE-bench 多語言
Claude Mythos Preview:87.3%
Claude Opus 4.6:77.8%
評測任務:智慧體式編碼
評測基準:SWE-bench 驗證集
Claude Mythos Preview:93.9%
Claude Opus 4.6:80.8%
- SWE-bench 驗證集、專業版與多語言基準:我們的記憶篩查機制標記了上述評測中的部分題目。剔除存在記憶痕跡的題目後,Mythos Preview 相較 Opus 4.6 的效能優勢依然成立。
- SWE-bench 多模態:Mythos Preview 與 Opus 4.6 均採用內部實作版本,得分與公開榜單成績不具直接可比性。
- Terminal-Bench 2.0:採用 Terminus-2 測試框架,開啟自適應思考模式並設定最高算力配置,單任務總令牌預算為 100 萬。所有實驗均採用 1 次保底/3 次上限的資源分配策略,每項任務平均測試 5 次。若將逾時限制提升至 4 小時並採用 Terminal-Bench 2.1 更新版本,Mythos Preview 得分可達 92.1%。
評測任務:專業知識推理
評測基準:GPQA Diamond
Claude Mythos Preview:94.6%
Claude Opus 4.6:91.3%
評測任務:綜合能力測試
評測基準:人類終極測試(無工具)
Claude Mythos Preview:56.8%
Claude Opus 4.6:40.0%
評測任務:綜合能力測試
評測基準:人類終極測試(搭載工具)
Claude Mythos Preview:64.7%
Claude Opus 4.6:53.1%
- 人類終極測試:研究發現,即便在低算力模式下,Mythos Preview 仍能取得優異成績,或存在一定程度的記憶痕跡。
評測任務:網頁瀏覽能力
評測基準:BrowseComp
Claude Mythos Preview:86.9%
Claude Opus 4.6:83.7%
評測任務:作業系統互動
評測基準:OSWorld-Verified
Claude Mythos Preview:79.6%
Claude Opus 4.6:72.7%
- BrowseComp:Claude Mythos Preview 得分高於 Opus 4.6,且令牌消耗量僅為後者的 1/4.9。
我們暫無面向公眾開放 Claude Mythos Preview 的計畫,但最終目標是讓使用者能安全規模化部署 Mythos 級模型——不僅用於網路安全領域,還能釋放這類高能力模型的多元價值。
實現這一目標,需要我們在網路安全(及其他領域)防護機制上取得突破,實現對模型高危輸出內容的檢測與攔截。我們計畫在即將發布的 Claude Opus 模型中搭載全新防護機制,藉助風險等級低於 Mythos Preview 的模型完成防護機制的優化與迭代。
四、玻璃翼計畫規劃
今日的公告,僅是一項長期行動的開端。該計畫若想取得成功,需要科技產業乃至更多領域的廣泛參與。
玻璃翼計畫合作方將獲得 Claude Mythos Preview 使用權限,用於挖掘並修復自身基礎系統中的漏洞或缺陷——這類系統構成了全球網路攻擊面的絕大部分。我們預計相關工作將聚焦於本地漏洞檢測、二進位檔案黑箱測試、終端設備加固、系統滲透測試等場景。
Anthropic 為玻璃翼計畫及其他參與方提供的 1 億美元模型使用額度,將涵蓋本次研究預覽階段的大量使用需求。此後,Claude Mythos Preview 將向參與方開放付費使用,定價為每百萬輸入令牌 25 美元、每百萬輸出令牌 125 美元,參與方可透過 Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Azure AI Foundry 使用該模型。
除模型使用額度捐贈外,我們還透過 Linux 基金會向 Alpha-Omega 專案與開源軟體安全基金會捐贈 250 萬美元,向 Apache 軟體基金會捐贈 150 萬美元,助力開源軟體維護者應對產業變革。
我們計畫持續擴大專案覆蓋範圍,推進工作長達數月,並盡可能公開研究成果,助力其他機構將經驗應用於自身安全體系建設。合作方將在能力範圍內共享資訊與最佳實務;Anthropic 將在 90 日內公開發布研究成果,以及可揭露的已修復漏洞與安全優化內容。我們還將與頂尖安全機構協作,制定一系列實操性建議,指導網路安全實務在人工智慧時代的升級方向,具體包括:
- 漏洞揭露流程;
- 軟體更新流程;
- 開源與供應鏈安全;
- 軟體開發生命週期與安全原生設計實務;
- 監管產業安全標準;
- 漏洞分級擴容與自動化處置;
- 修補程式自動化部署。
模型能力與安全協同機制
Anthropic 也就 Claude Mythos Preview 及其攻防網路安全能力,與美國政府官員持續開展溝通。如前文所述,守護關鍵基礎設施是民主國家的核心國家安全要務——這類網路安全能力的出現,進一步凸顯了美國及其盟國必須在人工智慧技術領域保持絕對領先優勢。
多方協作治理路徑
各國政府在維持技術領先、評估並緩解人工智慧模型相關國家安全風險方面,肩負著核心責任。我們願與各級政府代表協作,助力相關工作推進。
長期生態建設願景
我們期待玻璃翼計畫能催生覆蓋產業與公共部門的更大規模行動,各方共同解決高能力模型對安全領域影響的核心問題。我們邀請人工智慧產業其他夥伴加入,攜手制定產業標準。中長期來看,由獨立第三方機構統籌——匯聚私營與公共部門主體——或是持續推進此類大規模網路安全專案的理想模式。