プロジェクト・グラスウィング
AI 時代における重要ソフトウェアの保護
目次
はじめに
本日、Amazon Web Services、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks が一堂に会し、世界で最も重要なソフトウェアを保護するための新たなイニシアチブ「プロジェクト・グラスウィング1」を発表します。
私たちがプロジェクト・グラスウィングを立ち上げたのは、Anthropic が訓練したフロンティアモデルにおいて、サイバーセキュリティの在り方を変える可能性のある機能を確認したためです。「Claude Mythos Preview」は未公開の汎用フロンティアモデルであり、これが浮き彫りにした事実は明白です。AI モデルのコーディング能力は、ソフトウェアの脆弱性を発見・悪用する能力において、最も熟練した人間を凌駕するレベルに達しているのです。
Mythos Preview はこれまでに、主要なすべての OS および Web ブラウザを含む、深刻度の高い数千件もの脆弱性を発見してきました。AI の進歩の速さを考慮すると、これらの能力が安全な配備を誓約する主体の枠を超えて拡散するのも、そう遠い未来の話ではないでしょう。その結果、経済、公衆の安全、そして国家安全保障に及ぶ影響は甚大なものとなる可能性があります。プロジェクト・グラスウィングは、これらの能力を防衛目的で活用するための緊急の試みです。
本プロジェクトの一環として、上記の立ち上げパートナー各社は、自社の防衛的セキュリティ業務において Mythos Preview を活用します。また、Anthropic はそこで得られた知見を共有し、産業界全体が恩恵を受けられるようにします。さらに、重要ソフトウェアインフラを構築・維持する 40 社以上の組織群にもアクセスを拡大し、自社製およびオープンソースシステムの両方をスキャンし保護するために本モデルを利用できるようにしました。Anthropic はこれらの取り組みに対し、Mythos Preview の利用枠として最大 1 億ドルのクレジットを提供するとともに、オープンソースセキュリティ団体へ 400 万ドルの直接寄付を行うことを約束します。
プロジェクト・グラスウィングは出発点に過ぎません。これらのサイバーセキュリティ上の課題を解決できる組織は一つもありません。フロンティア AI 開発企業、他のソフトウェア企業、セキュリティ研究者、オープンソースのメンテナー、そして世界中の政府が、それぞれ不可欠な役割を担っています。世界のサイバーインフラを防衛する取り組みには数年を要する可能性がありますが、フロンティア AI の能力は今後数ヶ月で飛躍的に向上するでしょう。サイバー防衛側が優位に立つためには、今すぐ行動する必要があります。
AI 時代におけるサイバーセキュリティ
私たちが日々依存しているソフトウェア、すなわち銀行システムの稼働、医療記録の保存、物流ネットワークの連携、送電網の機能維持などを担うソフトウェアには、常にバグが存在してきました。その多くは軽微なものですが、一部は深刻なセキュリティ上の欠陥であり、これが発見されれば、サイバー攻撃者によるシステムの乗っ取り、業務の妨害、データの盗難などを許す可能性があります。
これまでに、重要な企業ネットワーク、医療システム、エネルギーインフラ、交通の要所、そして世界中の政府機関に対するサイバー攻撃の深刻な結果を目の当たりにしてきました。国際的な舞台では、中国、イラン、北朝鮮、ロシアなど国家に後援された行為者による攻撃が、市民生活と軍事即応能力の基盤となるインフラの侵害を脅かしています。個々の病院や学校が標的となるような小規模な攻撃でさえ、多大な経済的損害を与え、機微なデータを露呈させ、人命を危険にさらす可能性があります。サイバー犯罪による世界の金融コストの推定は困難ですが、年間約 5000 億ドルに達する可能性があります。
ソフトウェアの欠陥の多くは何年もの間見過ごされてきましたが、それは発見と悪用に、ごく一部の熟練したセキュリティ専門家にしか持っていない専門知識を必要としてきたからです。最新のフロンティア AI モデルにより、ソフトウェアの脆弱性を発見・悪用するためのコスト、労力、専門知識のレベルは劇的に低下しました。過去 1 年間、AI モデルはコードの読み取りと推論においてますます効果を発揮するようになり、とりわけ脆弱性を発見し、それを悪用する方法を導き出す際立った能力を示しています。Claude Mythos Preview はこれらのサイバースキルにおいて飛躍的な進歩を示しており、同モデルが発見した脆弱性には、数十年にわたる人間のレビューと数百万回の自動セキュリティテストを生き延びてきたものも含まれており、開発するエクスプロイトも高度化の一途をたどっています。
最初のDARPA サイバー・グランド・チャレンジから 10 年が経過し、フロンティア AI モデルは脆弱性の発見と悪用において、最高の人間と競合できるレベルになりつつあります。必要な安全策がなければ、これらの強力なサイバー能力は、世界の最も重要なソフトウェアに存在する数多くの既存の欠陥を悪用するために利用される可能性があります。これにより、あらゆる種類のサイバー攻撃がはるかに頻繁かつ破壊的なものとなり、米国とその同盟国に対する敵対者を力づけることになります。したがって、これらの問題への対処は、民主主義国家にとって重要な安全保障上の優先事項です。
AI によって強化されたサイバー攻撃のリスクは深刻ですが、楽観視できる理由もあります。誤った人々の手に渡れば危険となるのと同じ能力が、重要なソフトウェアの欠陥を発見・修正し、セキュリティ上のバグがはるかに少ない新しいソフトウェアを生み出すために不可欠なものとなるからです。プロジェクト・グラスウィングは、サイバーセキュリティにおける AI 駆動の次なる時代において、防衛側に永続的な優位性を与えるための重要な一歩です。
Claude Mythos Preview による脆弱性とエクスプロイトの特定
ここ数週間、私たちは Claude Mythos Preview を使用して、すべての主要な OS および主要な Web ブラウザ、その他重要なソフトウェア群において、数千件ものゼロデイ脆弱性(ソフトウェア開発者に以前は知られていなかった欠陥)を特定しました。その多くがクリティカルなものです。
私たちのFrontier Red Team ブログの投稿では、すでに修正済みのこれらの脆弱性の一部と、Mythos Preview がそれらを悪用するために見つけた方法について、技術的な詳細を提供しています。同モデルは、人間の誘導を一切受けることなく、完全に自律的にこれらの脆弱性のほぼすべてを特定し、関連する多くのエクスプロイトを開発することができました。以下に 3 つの事例を示します。
- Mythos Preview は、世界で最もセキュリティ強化された OS の一つとされ、ファイアウォールやその他の重要インフラの実行に使用されている OpenBSD において、27 年前の脆弱性を発見しました。この脆弱性により、攻撃者は OS を実行しているマシンに接続するだけで、遠隔からそのマシンをクラッシュさせることができました。
- また、自動化されたテストツールが 500 万回もヒットしながら一度も問題を捕捉できなかったコード行において、動画のエンコードおよびデコードに無数のソフトウェアで使用されている FFmpeg の 16 年前の脆弱性を発見しました。
- 同モデルは、世界のサーバーの大部分を稼働させているソフトウェアである Linux カーネルにおいて、複数の脆弱性を自律的に発見して連鎖させ、攻撃者が通常のユーザーアクセスからマシンの完全な制御権限へと特権を昇格させることを可能にしました。
上記の脆弱性は該当するソフトウェアのメンテナーに報告済みで、現在はすべて修正済みです。他の多くの脆弱性については、本日その詳細の暗号学的ハッシュ値を提供し(Red Team ブログを参照)、修正が完了次第、具体的な内容を公開します。
CyberGym などの評価ベンチマークは、Mythos Preview と次点のモデルである Claude Opus 4.6 との間に大きな隔たりがあることを裏付けています。
サイバーセキュリティ脆弱性再現
Mythos Preview: 83.1%
Opus 4.6: 66.6%
私たちの取り組みに加え、パートナー企業の多くはすでに数週間 Claude Mythos Preview を利用しています。彼らが発見したことは以下の通りです。
Cisco:
「AI の能力は、重要インフラをサイバー脅威から保護するために必要な緊急性を根本的に変える閾値を越えました。もはや後戻りはできません。これらのモデルを用いた私たちの基盤的な取り組みにより、これまで不可能だったペースと規模でハードウェアおよびソフトウェアのセキュリティ上の脆弱性を特定・修正できることが示されました。これは劇的な変化であり、システムを強化する従来の方法ではもはや不十分であるという明確なシグナルです。技術プロバイダーは新たなアプローチを積極的に採用しなければならず、顧客も導入の準備を整える必要があります。それが、Cisco がプロジェクト・グラスウィングに参加した理由です。この取り組みは一人では成し得ないほど重要かつ緊急なのです」
— Anthony Grieco 氏(Cisco SVP 兼 最高セキュリティ・トラスト責任者)発表を読む
AWS:
「AWS では、脅威が発生する前から、独自シリコンからテクノロジー・スタック全体にわたって防御を構築しています。セキュリティは私たちにとって一時的なフェーズではなく、継続的かつすべてに組み込まれたものです。私たちのチームは毎日 400 兆を超えるネットワークフローを脅威に対して分析しており、AI は規模の防御において中核をなしています。私たちは自社のセキュリティ運用において Claude Mythos Preview のテストを実施し、重要なコードベースに適用してきましたが、すでにコードの強化に役立っています。私たちは Anthropic とのパートナーシップに深いセキュリティの専門知識をもたらし、さらに多くの組織が標準を定めるセキュリティによって最も野心的な仕事を前進させられるよう、Claude Mythos Preview の強化を支援します」
— Amy Herzog 氏(Amazon Web Services 副社長 兼 CISO)発表を読む
Microsoft:
「サイバーセキュリティがもはや純粋な人間の能力に縛られない段階に入る中、セキュリティを向上させ、規模でリスクを低減するために AI を責任を持って活用する機会は前例のないものです。プロジェクト・グラスウィングに参加し、Claude Mythos Preview へのアクセスを得ることで、リスクを早期に特定・緩和し、セキュリティおよび開発ソリューションを強化して、顧客と Microsoft をよりよく保護することができます。オープンソースのセキュリティベンチマークである CTI-REALM に対してテストしたところ、Claude Mythos Preview は以前のモデルと比較して大幅な改善を示しました。私たちは Anthropic および産業界全体と連携し、すべての人々のセキュリティ成果を向上させることを楽しみにしています」
— Igor Tsyganskiy 氏(Microsoft Cybersecurity 担当エグゼクティブバイスプレジデント 兼 Microsoft Research 担当)発表を読む
CrowdStrike:
「脆弱性が発見されてから敵対者に悪用されるまでの期間は崩壊しました。かつて数ヶ月かかっていたことが、AI によって今や数分で起こります。Claude Mythos Preview は、規模で防衛する側に何が可能かを示しましたが、敵対者も同様の能力を悪用しようとすることは避けられません。それは減速する理由ではなく、共に、より速く動く理由です。AI を導入したいなら、セキュリティが必要です。それが、CrowdStrike が初日からこの取り組みに参加している理由です」
— Elia Zaitsev 氏(CrowdStrike CTO)発表を読む
Linux Foundation:
「過去、セキュリティの専門知識は、大規模なセキュリティチームを持つ組織のための贅沢品でした。世界の重要インフラの多くを支えるソフトウェアを担うオープンソースのメンテナーは、歴史的にセキュリティを独自に解決することを余儀なくされてきました。現代のシステム、さらには AI エージェントが新しいソフトウェアを書くために使用するシステムでさえ、コードの大部分はオープンソースソフトウェアで構成されています。これらの重要なオープンソースコードベースのメンテナーに対し、規模で脆弱性を先回りして特定・修正できる新世代の AI モデルへのアクセスを提供することで、プロジェクト・グラスウィングはその方程式を変える信頼できる道筋を示します。これこそが、高価なセキュリティチームを雇える者だけでなく、すべてのメンテナーにとって AI 強化型セキュリティが信頼できるサイドキックとなる方法です」
— Jim Zemlin 氏(Linux Foundation CEO)発表を読む
JPMorganChase:
「金融システムのサイバーセキュリティと回復力の促進は JPMorgan Chase の使命の中核であり、業界は主要機関が共通の課題に共に取り組む時に最も強固になります。プロジェクト・グラスウィングは、次世代の AI ツールを防衛的サイバーセキュリティの観点から、自社内および尊敬すべき技術リーダーらと共に評価するためのユニークな初期段階の機会を提供します。私たちは、どのように進め、どこで支援できるかを決定するために、厳格かつ独立したアプローチを取ります。Anthropic のイニシアチブは、この瞬間に求められる先見的かつ協調的なアプローチを反映したものです」
— Pat Opet 氏(JPMorganChase CISO)
Google:
「Google は、この産業界横断的なサイバーセキュリティイニシアチブが実現し、Vertex AI を介して参加者に Mythos Preview を提供できることを嬉しく思います。ポスト量子暗号、責任あるゼロデイ開示、安全なオープンソースソフトウェア、AI ベースの攻撃からの防御など、新たなセキュリティ問題において業界が協力することは常に重要でした。私たちは AI がサイバー防衛において新たな課題をもたらし、新たな機会を開くと長く信じており、重要なソフトウェアの欠陥を発見・修正するために Big Sleep や CodeMender といった AI 搭載ツールを構築してきました。私たちは、ユーザー、顧客、エコシステム、そして国家安全保障を保護することに焦点を当てた文化と、最先端のサイバーセキュリティプラットフォームへの投資を継続します」
— Heather Adkins 氏(Google セキュリティエンジニアリング担当 VP)発表を読む
Palo Alto Networks:
「ここ数週間、私たちは Claude Mythos Preview モデルにアクセスし、前世代のモデルが完全に見逃していた複雑な脆弱性を特定するために使用しました。これは隠れた脆弱性を発見するゲームチェンジャーであるだけでなく、攻撃者がこれまで以上に迅速にさらに多くのゼロデイ脆弱性を発見し、エクスプロイトを開発できる危険な転換点を示唆しています。これらのモデルが攻撃者の手に渡る前に脆弱性を発見・修正するためには、至る所のオープンソース所有者と防衛側の手にこれらのモデルを届ける必要があります。さらに重要なのは、誰もが AI 支援型攻撃者への備えをしなければならないということです。より多くの攻撃が、より速い攻撃が、より高度な攻撃が起きるでしょう。今こそ、至る所でサイバーセキュリティスタックを近代化する時です。これらの強力な能力がまず防衛を優先することを確実にするために、産業界と連携する Anthropic を称賛します」
— Lee Klarich 氏(Palo Alto Networks 最高製品・技術責任者)発表を読む
Claude Mythos Preview の強力なサイバー能力は、その強力なエージェント型コーディングおよび推論スキルに起因します。例えば、以下の評価結果に示されているように、同モデルはさまざまなソフトウェアコーディングタスクにおいて、これまでに開発されたどのモデルよりも高いスコアを記録しています。
エージェント型コーディング:
SWE-bench Pro: Mythos Preview 77.8% / Opus 4.6 53.4%
Terminal-Bench 2.0: Mythos Preview 82.0% / Opus 4.6 65.4%
SWE-bench Multimodal (内部実装): Mythos Preview 59.0% / Opus 4.6 27.1%
SWE-bench Multilingual: Mythos Preview 87.3% / Opus 4.6 77.8%
SWE-bench Verified: Mythos Preview 93.9% / Opus 4.6 80.8%
推論:
GPQA Diamond: Mythos Preview 94.6% / Opus 4.6 91.3%
Humanity's Last Exam (ツールなし): Mythos Preview 56.8% / Opus 4.6 40.0%
Humanity's Last Exam (ツールあり): Mythos Preview 64.7% / Opus 4.6 53.1%
エージェント型検索とコンピュータ使用:
BrowseComp: Mythos Preview 86.9% / Opus 4.6 83.7%
OSWorld-Verified: Mythos Preview 79.6% / Opus 4.6 72.7%
モデルの能力、セキュリティ特性、および一般的な特性の詳細は、Claude Mythos Preview システムカードでご覧ください。
Claude Mythos Preview を一般公開する予定はありませんが、最終的な目標は、ユーザーが Mythos クラスのモデルをサイバーセキュリティ目的だけでなく、こうした高度に有能なモデルがもたらす無数の恩恵のために安全に大規模展開できるようにすることです。そのためには、モデルの最も危険な出力を検知・ブロックするサイバーセキュリティ(およびその他)の安全策の開発で進捗を遂げる必要があります。私たちは、Mythos Preview と同レベルのリスクを持たないモデルで、これらの安全策を改善・洗練させることを可能にするため、次期 Claude Opus モデルと共に新しい安全策を導入する計画です。
プロジェクト・グラスウィングの計画
本日の発表は、より長期的な取り組みの始まりです。成功のためには、テクノロジー業界およびその先を超えた広範な関与が必要となります。
プロジェクト・グラスウィングのパートナーは、基盤システムにおける脆弱性や弱点の発見・修正のため、Claude Mythos Preview へのアクセスを受け取ります。世界の共有されるサイバー攻撃対象領域の非常に大きな割合を占めるシステムが対象です。この取り組みは、ローカルな脆弱性検出、ブラックボックステストによるバイナリ検査、エンドポイントの保護、システムへの侵入テストなどのタスクに焦点を当てると予想されます。
Anthropic は、本リサーチプレビュー期間中の実質的な利用をカバーするため、プロジェクト・グラスウィングおよび追加の参加者に対し、モデル利用枠として 1 億ドルを約束します。その後、Claude Mythos Preview は、入力/出力トークン 100 万 件あたり 25 ドル/125 ドルで参加者が利用可能になります(参加者は Claude API、Amazon Bedrock、Google Cloud の Vertex AI、Microsoft Foundry を介してモデルにアクセスできます)。
モデル利用枠の提供に加え、オープンソースソフトウェアのメンテナーが変化する状況に対応できるよう、Linux Foundation を通じて Alpha-Omega および OpenSSF へ 250 万ドル、Apache Software Foundation へ 150 万ドルを寄付しました(アクセスに関心のあるメンテナーはClaude for Open Sourceプログラムから申請可能です)。
私たちは、この取り組みが範囲を拡大し、今後数ヶ月にわたって継続されることを意図しており、他の組織が自社のセキュリティに教訓を適用できるよう、可能な限りの情報を共有します。パートナーは、可能な範囲で互いに情報やベストプラクティスを共有します。90 日以内に、Anthropic は学んだこと、修正された脆弱性、開示可能な改善点について公表します。また、主要なセキュリティ組織と協力し、AI 時代においてセキュリティ慣行がどのように進化すべきかに関する実践的な推奨事項セットを作成します。これには以下が含まれる可能性があります。
- 脆弱性の開示プロセス
- ソフトウェア更新プロセス
- オープンソースおよびサプライチェーンセキュリティ
- ソフトウェア開発ライフサイクルとセキュリティ・バイ・デザインの慣行
- 規制対象産業の基準
- トリアージの拡張と自動化
- パッチ適用の自動化
Anthropic はまた、Claude Mythos Preview およびその攻撃的・防衛的サイバー能力について、米国政府当局者と継続的に協議を行っています。前述の通り、重要インフラの保護は民主主義国家にとって最優先の国家安全保障事項です。これらのサイバー能力の出現は、米国とその同盟国が AI 技術において決定的な優位を維持しなければならないさらなる理由です。政府はその優位性の維持、および AI モデルに関連する国家安全保障リスクの評価と軽減において不可欠な役割を担います。私たちはこれらの任務を支援するため、連邦、州、地方の各代表者と協力する用意があります。
私たちは、プロジェクト・グラスウィングが、産業界と公共部門全体にわたるより大きな取り組みの種となり、すべての関係者が強力なモデルのセキュリティへの影響に関する最大の課題に対処する一助となることを願っています。業界標準の設定を支援するため、他の AI 業界メンバーに参加を呼びかけます。中期的には、官民の組織を集結させることのできる独立した第三者機関が、これらの大規模なサイバーセキュリティプロジェクトに関する継続的な取り組みの受け皿として理想的である可能性があります。
付録
- 本プロジェクトは、Greta oto(ガラスマダラハネチョウ)にちなんで名付けられました。この比喩は 2 つの方法で適用できます。蝶の透明な羽は、この記事で議論されている脆弱性と同様に、隠れもせずに存在することを可能にします。また、私たちのアプローチで提唱している透明性のように、害を逃れることも可能にします。
- これらの安全策によって正当な業務が影響を受けるセキュリティ専門家は、今後予定されているサイバー検証プログラムに申請することができます。