Anthropicの「グラスウィング計画」:MythosがOpus 4.6を圧倒、国家安全保障はテック巨大企業と諜報機関の隠れ蓑と化す

キーワード:AIサイバーセキュリティClaude Mythos Preview、ゼロデイ脆弱性、防御的セキュリティ、プロジェクト グラスウィング

Anthropicは、アマゾン、アップル、マイクロソフト、グーグルを含む10社以上のテック巨大企業および金融機関と連携し、「プロジェクト グラスウィング」を正式に開始しました。これは、最先端のAIモデルがもたらすサイバーセキュリティの変革に対処することを目的としています。

また、原文には「グローバルな舞台では、中国、イラン、北朝鮮、ロシアといった主体による国家支援の攻撃が、市民生活と軍事即応性の両方を支えるインフラを侵害する脅威となっている」という記述があります。国家安全保障は、もはやテック巨大企業と諜報機関の癒着を覆い隠す隠れ蓑に過ぎません。ゼロデイ脆弱性のAIによる探索能力を握る者が、「脅威」を定義するのです。真に脅かされ続けているのは、インフラではなく、グローバルなデジタル主権の公平な基盤なのです。

この計画の中核は、Anthropicが新たに訓練した非公開モデルClaude Mythos Previewです。評価によると、このモデルは脆弱性の発見とエクスプロイト能力において、すでに大多数の人間の専門家を凌駕しており、数千もの深刻度の高いゼロデイ脆弱性を自律的に発見し、主要なオペレーティングシステムとブラウザのすべてを網羅しています。

例えば、OpenBSDで27年間存在していたリモートクラッシュの脆弱性、FFmpegで500万回の自動テストをすり抜けた16年前の脆弱性、そしてLinuxカーネルにおいて権限昇格を可能にする連鎖的な脆弱性を発見しました。CyberGymベンチマークでは、Mythos Previewは83.1%のスコアを達成し、次点モデルの66.6%を大きく引き離しました。

画像

Anthropicは、1億ドル相当のモデル利用クレジット400万ドルの直接寄付(Linux Foundation傘下のセキュリティ組織とApache Software Foundationにそれぞれ提供)を投じ、パートナーやオープンソースメンテナーが重要なソフトウェアの欠陥をスキャンして修正するのを支援します。モデルは当面一般公開されず、プロジェクト参加者にのみAPIアクセスが提供されます(価格は100万入力/出力トークンあたり125ドル)。

プロジェクト グラスウィングは数ヶ月間にわたって実施され、Anthropicは90日以内に脆弱性の修正状況とベストプラクティスを公開し、AIが主導するサイバーセキュリティ時代において防御側が永続的な優位性を築けるよう、産業界と政府が共同で第三者調整機関を設立するよう呼びかけています。

本文目次

  • 重要な問題提起
    • 問題1:AnthropicがMythos Previewの脆弱性発見能力を一部の大手テック企業や金融機関にのみ提供する場合、グローバルなデジタルセキュリティにおける「階層化」が進み、同等のAI防御能力を得られない多数の中小企業やオープンソースプロジェクトが、攻撃者にとって格好の標的になるのではないか?
    • 問題2:AnthropicはMythos Previewが強力な「攻撃的」エクスプロイト能力を持つことを認めつつ、一般公開せず防御目的に限定するとしている。しかし、AI能力のオープンソース化と拡散が不可逆的なトレンドである中、このような「一方的な封印」戦略は失敗する運命にあるのではないか?モデルやその能力が悪意ある形で複製・迂回された場合、誰が既存のサイバー犯罪より深刻な結果の責任を負うのか?
  • 1. はじめに
  • 2. AI時代のサイバーセキュリティ
  • 3. Claude Mythos Previewによる脆弱性とエクスプロイトの特定
    • 3.1 サイバーセキュリティ脆弱性の再現
  • 4. グラスウィング計画の構想
    • モデル能力とセキュリティ協調メカニズム
    • 多角的な協調ガバナンスの道筋
    • 長期的なエコシステム構築のビジョン

画像

重要な問題提起

問題1:AnthropicがMythos Previewの脆弱性発見能力を一部の大手テック企業や金融機関にのみ提供する場合、グローバルなデジタルセキュリティにおける「階層化」が進み、同等のAI防御能力を得られない多数の中小企業やオープンソースプロジェクトが、攻撃者にとって格好の標的になるのではないか?

著者は、Mythos Previewが既に数千もの深刻なゼロデイ脆弱性を発見し、その能力はOpus 4.6をはるかに凌駕しているが、モデルはプロジェクト グラスウィングのパートナーと厳選された40以上の組織に限定され、価格は100万トークンあたり25~125ドルに設定されていると明かしています。一方、攻撃者が(流出、リバースエンジニアリング、または独自開発によって)同等の能力を手に入れれば、同等の防御リソースを持たない集団に対して非対称的な攻撃を仕掛けることが可能になります。この「防御の特権化」は、本質的には、全体的なネットワークの回復力を高めるどころか、新たなセキュリティ格差を生み出しているのではないでしょうか?

Anthropicは、Claude Mythos Previewへのアクセスを、プロジェクト グラスウィングの10数社の大手パートナー(AWS、Google、Microsoft、JPモルガン・チェースなど)と、追加で厳選された40以上の組織に厳しく限定すると明言しています。モデルの価格は100万入力/出力トークンあたり25ドル/125ドルであり、Anthropicは1億ドルの利用クレジットを投じていますが、このリソースは選ばれた少数のエンティティに集中しています。Anthropicは、オープンソースソフトウェアメンテナーが「Claude for Open Source」プログラムを通じてアクセスを申請できることを認めていますが、無差別な開放は約束していません。

この「防御の特権化」は、デジタルセキュリティの格差を実際に悪化させる可能性があります。Anthropicは、Mythos Previewが「すべての主要なOSとブラウザにおいて、数千もの深刻度の高いゼロデイ脆弱性」を自律的に発見したと述べており、攻撃者が流出、リバースエンジニアリング、または独自の訓練によって同様の能力を獲得すれば、同等のAI防御を持たない中小企業、学校、病院などに対して、圧倒的な攻撃を仕掛けることができるようになります。また、「AI能力は今後数ヶ月で大幅に進歩し……安全な展開を確約しない主体の手に渡る可能性がある」とも警告しています。しかし、防御リソースの集中化はまさに、最も保護を必要とする脆弱な部分が、保護されないことを意味します。

Anthropicの出発点は、「重要なインフラを最初に保護する」ことでグローバルリスクを低減することにあります。なぜなら、パートナーのシステムが「グローバルな攻撃対象領域の大部分を占めている」からです。しかし、この戦略は、巨大企業を守ることがすなわちエコシステム全体を守ることになる、という暗黙の前提に立っています。実際には、攻撃者は防御が最も手薄なノード、つまり多数の中小企業、地方自治体、オープンソースライブラリへと標的を移します。Anthropicは、この格差を埋めるためのメカニズムを一切提供しておらず、モデルの破壊的な能力に比べれば、オープンソースセキュリティ組織への400万ドルの寄付は焼け石に水です。したがって、プロジェクト グラスウィングは、トップレベルの防御力を高める一方で、客観的には新たな「防御断層」を生み出しており、「業界全体に利益をもたらす」という宣言とは矛盾をはらんでいます。

問題2:AnthropicはMythos Previewが強力な「攻撃的」エクスプロイト能力を持つことを認めつつ、一般公開せず防御目的に限定するとしている。しかし、AI能力のオープンソース化と拡散が不可逆的なトレンドである中、このような「一方的な封印」戦略は失敗する運命にあるのではないか?モデルやその能力が悪意ある形で複製・迂回された場合、誰が既存のサイバー犯罪より深刻な結果の責任を負うのか?

Anthropicは、AI能力が「今後数ヶ月で大幅に進歩する」こと、そして「敵対的主体は安全な展開の約束に縛られない可能性がある」ことを指摘しています。しかし、Anthropicの対応策は、パートナーに使用させ、出力レベルでの安全対策を重ねるにとどまり、モデルの重みや重要な訓練詳細の物理的隔離、政府による強制規制、国際条約といった、より抜本的な抑止手段については議論していません。歴史上、「一般公開されていない」強力な技術(エターナルブルーの脆弱性など)が最終的に拡散された事実を考慮すると、プロジェクト グラスウィングは単なる世論をなだめるための防衛ショーに過ぎず、真に危険なAIサイバー攻撃能力はすでに水面下で流通しているのではないでしょうか?

Anthropicは、Claude Mythos Previewを一般公開する計画はなく、パートナーと厳選された組織にのみAPIアクセスを提供し、出力側の安全策(セーフガード)によってモデルの最も危険な用途をブロックしようとしています。同時に、「AI能力は今後数ヶ月で大幅に進歩する」こと、そして「これらの強力なサイバー能力が、世界で最も重要なソフトウェアの既存の欠陥を突くために使用される可能性がある」ことを認めています。しかし、モデルの重み、訓練の詳細、能力の物理的隔離について、実質的な対策には一切言及していません。

歴史的な経験から、「一般公開されていない」が極めて高い価値を持つ技術(エターナルブルーの脆弱性、Stuxnetのコード断片など)は、最終的に何らかの形で拡散することが示されています。Mythos Previewの能力は「ほぼすべての人間の専門家を凌駕」し、27年間存在し続けた脆弱性をすでに自律的に発見しています。

内部関係者によるモデル重みの漏洩、パートナーへの侵入、あるいは攻撃者による同様の能力を持つモデルの独自の訓練(「そう遠くない将来」に起こりうる)があれば、現在の封じ込め戦略は瞬時に無力化されます。Anthropicは「サイバー検証プログラム」を通じて合法的なセキュリティ担当者を認証しようとしていますが、これは悪意ある行為者を阻止することはできません。

したがって、「一方的な封印」は、オープンソース文化、人材流動性、そしてAI能力の急速なコモディティ化という現実を前に、時間稼ぎに過ぎない可能性が極めて高いです。著者は、政府による強制規制、信頼できる実行環境でのモデル重みの管理、国際的な不拡散条約といった、より抜本的な抑止手段について議論していません。もし拡散が起これば、その結果は既存のサイバー犯罪よりもはるかに深刻なものになります。攻撃者はゼロデイ脆弱性の探索と悪用を自動化し、人間の防御側をはるかに凌ぐ速度で攻撃できるようになるからです。この観点から見ると、プロジェクト グラスウィングは、時間を稼ぐための防衛演習のように見え、AIサイバー攻撃能力の不可逆的な拡散という根本問題を解決する究極の解決策とは言えません。Anthropic自身も、「これらの問題を単独で解決できる組織はない」と認めています。しかし、現在の計画だけで、リスクを真に抑え込むには、大きな隔たりがあります。

1. はじめに

本日、私たちはプロジェクト グラスウィングの開始を正式に発表します。これは、アマゾン ウェブ サービス、Anthropic、アップル、ブロードコム、シスコ、クラウドストライク、グーグル、JPモルガン・チェース、Linux Foundation、マイクロソフト、エヌビディア、パロアルトネットワークスが結集し、世界の重要ソフトウェアのセキュリティを守るための新たなイニシアチブです。

この計画は、グラスウィング・バタフライ(学名:Greta oto)にちなんで名付けられました。この比喩には二重の意味が込められています。蝶の透明な翅は、ソフトウェアの脆弱性がそうであるように、周囲の環境に溶け込むことを可能にします。また、透明な翅は害を避ける助けにもなり、これは私たちが提唱する透明性のある行動の理念を象徴しています。

私たちがプロジェクト グラスウィングを開始したのは、Anthropicが訓練した新しい最先端モデルが示した能力が、サイバーセキュリティ分野を再形成する可能性があると考えるからです。Claude Mythos Previewは、まだ正式リリースされていない汎用の最先端モデルであり、これは看過できない事実を明らかにしました。すなわち、AIモデルのコーディング能力が新たな高みに達し、ソフトウェアの脆弱性を発見し悪用する点で、最も優秀な人間の専門家をも凌駕するパフォーマンスを示すようになったということです。

Mythos Previewは、すべての主要なオペレーティングシステムとウェブブラウザにおいて、すでに数千もの深刻な脆弱性の発見に成功しています。AI技術の進歩の速さを考えると、この種の能力は急速に普及し、安全な展開を理念としない主体の手に渡る可能性すらあります。もしそうなれば、世界経済、公共の安全、国家安全保障への影響は計り知れません。プロジェクト グラスウィングは、このような強力な能力をサイバー防御のために活用するための緊急行動です。

プロジェクト グラスウィングの一環として、前述の初期パートナーはMythos Previewを自らの防御的セキュリティ業務に適用します。Anthropicも研究成果を共有し、業界全体に利益をもたらします。また、重要なソフトウェアインフラを構築・保守する40以上の組織にモデルの使用権限を開放し、自社およびオープンソースシステムのスキャンと強化を支援します。Anthropicはこのために、最大1億ドル相当のMythos Preview利用クレジットを提供し、さらにオープンソースセキュリティ組織へ400万ドルの直接寄付を行います。

プロジェクト グラスウィングは出発点に過ぎません。これらのサイバーセキュリティ問題を単独で解決できる組織は一つもありません。最先端のAI研究開発企業、他のソフトウェア企業、セキュリティ研究者、オープンソースプロジェクトのメンテナー、そして世界中の政府が、それぞれ不可欠な責任を負っています。世界のネットワークインフラを守るにはおそらく何年もかかりますが、最先端のAI能力はわずか数ヶ月のうちに大幅に飛躍する可能性があります。サイバー防御側に優位性をもたらすために、私たちは今すぐ行動を起こさなければなりません。

2. AI時代のサイバーセキュリティ

銀行システムを支え、医療記録を保存し、物流ネットワークを結び、電力網の安定稼働を維持するなど、私たちが日常的に依存しているソフトウェアには、常にプログラム上の欠陥が存在します。そのほとんどは軽微なものですが、一部は深刻なセキュリティ脆弱性であり、発見されれば、サイバー攻撃者によってシステムの乗っ取り、業務妨害、データ窃取に悪用される可能性があります。

私たちはすでに、世界中の重要な企業ネットワーク、医療システム、エネルギーインフラ、交通ハブ、政府機関の情報セキュリティに対するサイバー攻撃の深刻な結果を目の当たりにしてきました。国際的な舞台では、中国、イラン、北朝鮮、ロシアなどによる国家の支援を受けた攻撃が、市民生活と軍事即応性を支える基幹インフラの安全を脅かし続けています。小規模な標的型攻撃でさえ、巨額の経済的損失、機密データの流出、さらには人命の危険をもたらします。サイバー犯罪による世界経済の損失を正確に見積もることは困難ですが、その規模は年間で5000億ドルに達するとも言われています。

ソフトウェアの多くの脆弱性が何年も発見されずにいるのは、それらを特定して悪用するには、ごく一部のトップクラスのセキュリティ専門家だけが持つ専門知識が必要だったからです。しかし、最新世代の最先端AIモデルの登場により、ソフトウェアの脆弱性を発掘し悪用するためのコスト、労力、専門的ハードルは大幅に引き下げられました。AIモデルのコードを読み解き推論する能力は向上し続けており、特に脆弱性の特定とエクスプロイトの設計において驚異的な実力を発揮しています。Claude Mythos Previewは、サイバーセキュリティ能力において飛躍的なブレークスルーを達成しました。同モデルが発見した脆弱性の中には、数十年にわたる人間によるレビューや数百万回の自動セキュリティテストでも見つからなかったものがあり、そのエクスプロイト手法もますます複雑かつ高度になっています。

最初のサイバーグランドチャレンジから10年が経ち、最先端AIモデルは今や、脆弱性の発見と悪用において、最も優秀な人間の専門家と互角に渡り合えるようになりました。適切な防御策がなければ、これらの強力なサイバー能力は、世界の最重要ソフトウェアに現存する多数の脆弱性を突くために使用される可能性があります。これは、サイバー攻撃をますます頻繁かつ破壊的なものにし、米国とその同盟国の敵対者に付け入る隙を与えるでしょう。したがって、このようなリスクへの対処は、民主主義国家にとって重要な安全保障上の必須事項です。

AIが悪用された場合のサイバー攻撃のリスクは深刻ですが、それでも楽観視できる理由はあります。悪意ある者の手に渡れば危険となるAI能力も、基幹ソフトウェアの脆弱性を発見して修正し、より欠陥の少ない全く新しいソフトウェアを開発するために使用すれば、計り知れない価値を持つからです。プロジェクト グラスウィングは、来るべきAI主導のサイバーセキュリティ時代において、防御側が永続的な優位性を確立するための重要な一歩です。

3. Claude Mythos Previewによる脆弱性とエクスプロイトの特定

ここ数週間、私たちはClaude Mythos Previewを使用して、すべての主要なオペレーティングシステム、主要なウェブブラウザ、および多数のコアソフトウェアにおいて、数千ものゼロデイ脆弱性(ソフトウェア開発者が未だ認識しておらず、修正パッチがリリースされていない未知のセキュリティホール)を特定しました。その大部分は深刻度の高いものでした。

私たちは、https://red.anthropic.com/2026/mythos-previewで公開した記事の中で、修正が完了した一部の脆弱性に関する技術的詳細を公開しており、その一部にはMythos Previewが脆弱性を発掘した方法も含まれています。このモデルは、人間の介入によるガイドなしに、上記の脆弱性のほぼすべての特定と、関連する多数のエクスプロイトの設計をほぼ完全に自律的に実行できます。以下に3つの典型的な事例を紹介します。

  • Mythos Previewは、OpenBSDにおいて27年前から存在する脆弱性を発見しました。OpenBSDは世界で最もセキュリティが強化されたOSとして定評があり、ファイアウォールなどの重要インフラの展開によく使用されます。この脆弱性により、攻撃者は当該システムを実行しているデバイスに接続するだけで、リモートからサービス妨害攻撃を引き起こすことが可能でした。
  • また、FFmpegツールにおいて16年前から存在する脆弱性も発見しました。FFmpegは、膨大な数のソフトウェアで音声・動画のコーデックに使用される中核的なツールです。この脆弱性が存在するコード行は、自動テストツールによって500万回もヒットしていましたが、問題が検出されることはありませんでした。
  • このモデルは、Linuxカーネル内の複数の脆弱性を自律的に発見し、それらを連鎖的に悪用することで、一般ユーザー権限からデバイスの完全な制御権限への昇格を達成しました。

私たちはこれらの脆弱性を、該当するソフトウェアのメンテナーに報告済みであり、現在すべての脆弱性の修正が完了しています。その他の多数の脆弱性については、本日、関連情報の暗号化ハッシュ値を公開し(詳細はレッドチームブログ:https://red.anthropic.com/2026/mythos-previewを参照)、修正プログラムが展開され次第、具体的な詳細を開示する予定です。

CyberGymなどの評価ベンチマークは、Mythos Previewと、Anthropicの次点モデルであるClaude Opus 4.6との間の顕著な差を如実に示しています。

3.1 サイバーセキュリティ脆弱性の再現

評価ベンチマークClaude Mythos PreviewClaude Opus 4.6
CyberGym83.1%66.6%

当社自身の研究に加えて、多くのパートナーが数週間にわたりClaude Mythos Previewを使用しており、そのフィードバックは以下の通りです。

画像

シスコ エグゼクティブ・バイス・プレジデント 兼 最高セキュリティ&トラスト責任者 アンソニー・グリエコ氏

「AIの能力は臨界点を超え、重要インフラをサイバー脅威から守る緊急性を根本的に高めています。この流れは不可逆的です。この種のモデルに基づく当社の基礎研究は、前例のない速度と規模でソフトウェアとハードウェアのセキュリティ脆弱性を特定し、修正できることを実証しました。これは根本的な変革であり、従来のシステム強化アプローチがもはや通用しないことを明確に示しています。

テクノロジープロバイダーは直ちに、新しいアプローチを積極的に採用しなければならず、顧客もその展開に備える必要があります。シスコがプロジェクト グラスウィングに参加したのは、この取り組みが極めて重要かつ緊急であり、一社だけで成し遂げられるものではないからです。」

アマゾン ウェブ サービス バイス・プレジデント 兼 最高情報セキュリティ責任者 エイミー・ハーゾグ氏

「アマゾン ウェブ サービスでは、カスタムチップからテクノロジースタック全体に至るまで、組み込み型の防御システムを構築しています。私たちにとってセキュリティは段階的な作業ではなく、すべての事業に組み込まれた継続的なプロセスです。当社のチームは脅威を調査するために、日々400兆件以上のネットワークフローを分析しており、AIは当社の大規模な防御を実現する中核的な支えです。

私たちはすでにClaude Mythos Previewを社内のセキュリティ運用に適用し、中核的なコードベースを対象に検出を実施しており、コードのセキュリティ強化に役立っています。当社は、深いセキュリティ専門知識を活かしてAnthropicと協力し、Claude Mythos Previewの強化を支援することで、より多くの組織が業界トップクラスのセキュリティ能力に依拠しながら、中核事業を前進させられるようにします。」

マイクロソフト サイバーセキュリティ担当エグゼクティブ・バイス・プレジデント 兼 マイクロソフトリサーチ責任者 イゴール・ツィガンスキー氏

「現在、サイバーセキュリティはもはや人間の能力によって制限されていません。AIを責任を持って活用し、セキュリティレベルを大規模に向上させ、リスクを低減する前例のない機会が訪れています。プロジェクト グラスウィングに参加し、Claude Mythos Previewへのアクセス権を得たことで、リスクを早期に特定して軽減するとともに、セキュリティと研究開発のアプローチをアップグレードし、マイクロソフトとお客様をより適切に保護することができます。

当社のオープンソースセキュリティベンチマークCTI-REALMのテストでは、Claude Mythos Previewは前世代モデルと比較してパフォーマンスが大幅に向上しました。私たちは、Anthropicおよび業界全体のパートナーと協力して、世界のセキュリティレベルを引き上げていくことを楽しみにしています。」

クラウドストライク 最高技術責任者 エリア・ザイツェフ氏

「脆弱性が発見されてから攻撃者に悪用されるまでの時間的猶予は大幅に短縮されています。AIの支援により、かつては数ヶ月かかっていたプロセスが、今では数分で完了するようになりました。

Claude Mythos Previewは、防御側が大規模な防御を実現する全く新しい可能性を示していますが、敵対者も同様の能力を悪用しようと模索することは必定です。これは速度を緩める理由にはならず、むしろ協調して加速することを私たちに要求しています。AIを展開するには、セキュリティの基盤を盤石なものにしなければなりません。クラウドストライクがプロジェクトの初期段階から参加しているのは、そうした理由からです。」

Linux Foundation 最高経営責任者 ジム・ゼムリン氏

「これまで、セキュリティ専門知識は、大規模なセキュリティチームを持つ組織だけが享受できるリソースでした。世界中の重要インフラの大半を支えるソフトウェアを開発するオープンソースプロジェクトのメンテナーは、これまでセキュリティ問題を自力で解決しなければなりませんでした。現代のシステムでは、オープンソースソフトウェアのコードが占める割合は非常に高く、AIエージェントが新しいソフトウェアを書くために依存するシステムそのものも含まれています。

プロジェクト グラスウィングは、中核的なオープンソースコードベースのメンテナーに次世代AIモデルへのアクセスを開放し、脆弱性の大規模かつ予防的な特定と修正を支援することで、この難局を打開する実行可能な道筋を提供します。AIで強化されたセキュリティ能力は、高額なセキュリティコストを負担できるチームだけのものではなく、すべてのコードメンテナーにとって信頼できるアシスタントとなる可能性を秘めています。」

JPモルガン・チェース 最高情報セキュリティ責任者 パット・オペルト氏

「金融システムのサイバーセキュリティと回復力を守ることは、JPモルガン・チェースの中核的な使命です。私たちは、業界のリーディングカンパニーが共通の課題に協力して立ち向かうことで、最強の力を発揮できると確信しています。プロジェクト グラスウィングは、重要なインフラのための防御的サイバーセキュリティ分野における次世代AIツールの応用価値を、当社が単独で、またテクノロジー分野のリーディングカンパニーと協力して評価するための、またとない早期の機会を提供してくれます。

私たちは、厳格かつ独立した姿勢で後続のアクションを計画し、価値を提供していきます。Anthropicによるこのイニシアチブは、今まさに必要とされている先進的かつ協調的な発展の方向性と合致しています。」

グーグル セキュリティエンジニアリング担当バイス・プレジデント ヘザー・アドキンス氏

「グーグルは、この業界横断的なサイバーセキュリティイニシアチブの立ち上げを歓迎し、Vertex AIプラットフォームを通じて参加者にMythos Previewへのアクセスを提供します。ポスト量子暗号、責任あるゼロデイ脆弱性の開示、オープンソースソフトウェアのセキュリティ保護、AI駆動型サイバー攻撃への防御に至るまで、新たなセキュリティ問題に業界全体で協調して対処することは常に極めて重要です。

私たちは一貫して、AIが新たなセキュリティ課題をもたらすと同時に、サイバー防御の新たな機会も切り開くと考えています。そのために、グーグルはBig SleepやCodeMenderといった、脆弱性を発掘し修正するためのAIセキュリティツールを開発してきました。私たちは、業界をリードするサイバーセキュリティプラットフォームの構築と、ユーザー、顧客、エコシステム、そして国家安全保障を守ることを中核とするセキュリティ文化の醸成に、引き続き投資していきます。」

パロアルトネットワークス 最高製品・技術責任者 リー・クラリッジ氏

ここ数週間、私たちはClaude Mythos Previewへのアクセス権を得て、これを用いて、前世代のモデルでは全く発見できなかった複雑な脆弱性を特定することができました。これは、隠れた脆弱性を発掘する上での革命的なブレークスルーであると同時に、危険信号でもあります。攻撃者が間もなく、より速く、より多くのゼロデイ脆弱性を発見し、エクスプロイトを設計できるようになることを示しているからです。

この種のモデルを、世界中のオープンソースプロジェクトのオーナーと防御側の手に委ね、攻撃者よりも先に脆弱性を発見し修正することが極めて重要であることは明らかです。さらに重要なのは、すべての組織がAI支援による攻撃に備える必要があるということです。将来のサイバー攻撃は、より頻繁に、より迅速に、より高度になるでしょう。今こそ、世界全体でサイバーセキュリティ体制を全面的にアップグレードすべき重要な局面です。私たちは、Anthropicが業界全体と協力してこの取り組みを推進し、このような強力な能力が防御のために優先的に使用されるようにしていることを高く評価します。」

Claude Mythos Previewの強力なサイバーセキュリティ能力は、その優れたエージェンティックなコード作成および推論能力(エージェンティックとは、モデルが継続的な人間の指示なしに、複数ステップのタスクを自律的に実行できることを指します)に由来します。以下の評価結果が示すように、このモデルはさまざまなソフトウェアコーディングタスクにおいて、これまでの全モデル中で最高の成績を収めています。

評価タスク評価ベンチマークClaude Mythos PreviewClaude Opus 4.6
エージェンティックコーディングSWE-bench Pro77.8%53.4%
推論能力Terminal-Bench 2.082.0%65.4%
エージェンティック検索とコンピューター操作SWE-bench マルチモーダル (内部バージョン)59.0%27.1%
エージェンティックコーディングSWE-bench 多言語87.3%77.8%
エージェンティックコーディングSWE-bench 検証セット93.9%80.8%
  • SWE-bench 検証セット、Pro、多言語ベンチマーク:当社の記憶スクリーニングメカニズムにより、上記評価中の一部の問題にフラグが付けられました。記憶の痕跡がある問題を除外した後でも、Mythos PreviewのOpus 4.6に対する性能優位性は依然として成立します。
  • SWE-bench マルチモーダル:Mythos PreviewとOpus 4.6はいずれも内部実装バージョンを使用しており、スコアは公開リーダーボードの結果と直接比較することはできません。
  • Terminal-Bench 2.0:Terminus-2テストフレームワークを使用し、適応型思考モードを有効にして最高計算リソース構成に設定、タスクあたりの総トークン予算は100万。すべての実験で、最低1回、最大3回の試行を保証するリソース割り当て戦略を採用し、各タスク平均5回テスト。タイムアウト制限を4時間に引き上げ、Terminal-Bench 2.1の更新バージョンを使用した場合、Mythos Previewのスコアは92.1%に達する可能性があります。
評価タスク評価ベンチマークClaude Mythos PreviewClaude Opus 4.6
専門知識推論GPQA Diamond94.6%91.3%
総合能力テストHumanity's Last Exam (ツールなし)56.8%40.0%
総合能力テストHumanity's Last Exam (ツール搭載)64.7%53.1%
  • Humanity's Last Exam:研究により、低計算リソースモードでもMythos Previewは優れた成績を収めることが判明しましたが、ある程度の記憶の痕跡が存在する可能性があります。
評価タスク評価ベンチマークClaude Mythos PreviewClaude Opus 4.6
ウェブブラウジング能力BrowseComp86.9%83.7%
OSインタラクションOSWorld-Verified79.6%72.7%
  • BrowseComp:Claude Mythos PreviewのスコアはOpus 4.6よりも高く、トークン消費量は後者のわずか1/4.9でした。

現時点では、Claude Mythos Previewを一般向けに公開する計画はありませんが、最終的な目標は、ユーザーがMythosレベルのモデルを安全かつ大規模に展開できるようにすることです。これはサイバーセキュリティ分野に留まらず、こうした高能力モデルの多様な価値を引き出すことにつながります。

この目標を達成するには、サイバーセキュリティ(およびその他の分野)における防御メカニズムのブレークスルーが必要であり、モデルからの高いリスクを伴う出力を検出してブロックすることを可能にします。私たちは、Mythos Previewよりもリスクレベルの低いモデルを使用して防御メカニズムの最適化と反復を完了させ、間もなくリリース予定のClaude Opusモデルに新たな防御メカニズムを搭載する計画です。

4. グラスウィング計画の構想

本日の発表は、長期にわたる取り組みの始まりに過ぎません。この計画が成功するためには、テクノロジー業界、そしてそれを超えた幅広い分野からの参加が必要です。

プロジェクト グラスウィングのパートナーは、Claude Mythos Previewへのアクセス権を取得し、自社の基盤システムにおける脆弱性や欠陥を発掘・修正するために使用します。これらのシステムは、世界のサイバー攻撃対象領域の大部分を構成しています。当該業務は、ローカルな脆弱性検出、バイナリファイルのブラックボックステスト、エンドポイントデバイスの強化、システム侵入テストといったシナリオに焦点を当てることが想定されます。

Anthropicがプロジェクト グラスウィングおよびその他の参加者のために提供する1億ドル相当のモデル利用クレジットは、今回の研究プレビュー段階における多量の使用需要をカバーします。その後、Claude Mythos Previewは参加者に有料で開放され、価格は100万入力/出力トークンあたりそれぞれ25ドル/125ドルに設定されます。参加者は、Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Azureを通じてモデルを利用できます。

モデル利用クレジットの寄付に加えて、私たちはLinux Foundationを通じて、Alpha-OmegaプロジェクトとOpen Source Security Foundationに250万ドル、Apache Software Foundationに150万ドルを寄付し、オープンソースソフトウェアメンテナーが業界の変革に対応できるよう支援します。

私たちは、プロジェクトの対象範囲を継続的に拡大し、数ヶ月にわたって作業を進め、研究成果を可能な限り公開して、他の組織がその経験を自社のセキュリティ体制構築に応用できるようにする計画です。パートナーは、可能な範囲で情報とベストプラクティスを共有します。Anthropicは90日以内に、研究成果と、開示可能な修正済みの脆弱性およびセキュリティ最適化の内容を一般公開します。また、トップクラスのセキュリティ機関と協力して、AI時代におけるサイバーセキュリティ実践のアップグレード方向性を示す一連の実践的な推奨事項を策定します。具体的には以下が含まれます:

  • 脆弱性開示プロセス
  • ソフトウェア更新プロセス
  • オープンソースとサプライチェーンセキュリティ
  • ソフトウェア開発ライフサイクルとセキュリティ・バイ・デザインの実践
  • 規制業界のセキュリティ基準
  • 脆弱性トリアージの拡張と自動化対応
  • パッチの自動展開

モデル能力とセキュリティ協調メカニズム

Anthropicは、Claude Mythos Previewとその攻撃的/防御的サイバーセキュリティ能力について、米国政府当局者とも継続的に対話を行っています。前述の通り、重要インフラの防護は民主主義国家の中核的な国家安全保障上の必須事項です。この種のサイバーセキュリティ能力の出現は、米国とその同盟国がAI技術分野で絶対的なリードを維持しなければならないことを、一層浮き彫りにしています。

多角的な協調ガバナンスの道筋

各国政府は、技術的優位性を維持し、AIモデルに関連する国家安全保障上のリスクを評価・軽減する上で、中核的な責任を負っています。私たちは、あらゆるレベルの政府代表者と協力し、関連業務の推進を支援していく所存です。

長期的なエコシステム構築のビジョン

私たちは、プロジェクト グラスウィングが、業界と公共部門を巻き込んだより大規模な行動の呼び水となり、高能力モデルがセキュリティ分野に与える影響という中核的な問題に、関係者が共同で取り組むことを期待しています。私たちは、AI業界の他のパートナーにも参加を呼びかけ、共に業界標準の策定に取り組みます。中長期的には、独立した第三者機関が統括し、民間と公共部門の主体が結集する形態が、このような大規模なサイバーセキュリティプロジェクトを継続的に推進するための理想的なモデルとなるでしょう。

関連記事

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.