Anthropic、神話級のClaude 5をついに解禁！「危険すぎる」と封印された真の実力

新智元報道

ヘッダー画像

【新智元概説】2ヶ月間「危険すぎる」と封印されてきたMythos 5がついに解禁！ ASIレベルの「神話」が、今夜幕を開ける。

Anthropicが今夜、「2つの衝撃」を放った！

つい先ほど、Claude Fable 5とClaude Mythos 5が同時にオンラインとなった。

Anthropicが2ヶ月もの間、「危険すぎるため公開できない」と隠してきたMythos級モデルが、初めてすべてのユーザーの手に渡ったのだ。

Claude 5の比較タイムライン図

Opus 4.7から4.8までに43日かかったが、4.8からFable 5へはわずか11日だった。

Fable（寓話）という名前はラテン語のfabulaに由来し、ギリシャ語のmythosと同源である。

同じ物語、同じ基盤。公開版が「寓話」、完全版が「神話」だ。

ソフトウェアエンジニアリング、知識労働、視覚、科学研究、長文コンテキスト。ほぼすべてのベンチマークで、Fable 5が首位を獲得した。

そして、タスクが長く複雑になるほど、その差は大きく開く。

主要ベンチマーク比較チャート

EveryのCEO、Dan Shipper氏の言葉を借りれば、まさに「パフォーマンスモンスター」だ！

Dan Shipperのコメント

Fable 5とMythos 5のスコアはほぼ同一で、その差は通常1〜3ポイント以内に収まる。

両者の最大の違いは、前者は「安全分類器」を内蔵しており、後者にはまったく制限がないことだ。

サイバーセキュリティタスクに関するクエリがトリガーされると、Fable 5は即座に「降格」され、Opus 4.8が応答する。

サイバーセキュリティ対策テスト結果

Fable 5がすべてのセキュリティタスクで0点を取ったことこそ、その何よりの証拠だ。

価格面では、Fable 5はOpus 4.8のFast Modeとほぼ同水準で、入力100万トークンあたり10ドル、出力100万トークンあたり50ドルだ。

これはOpus標準版の2倍だが、Mythos Previewの半額以下、GPT-5.5 Proと比べればわずか6分の1である。

Pro、Max、Teamのサブスクリプションユーザーは6月22日までは無料で体験できるが、それ以降はクレジット消費が必要になる。APIは本日から利用可能で、開発者はclaude-fable-5を指定するだけでいい。

API価格比較表

Claude 5「デュアルモデル」デビュー: コーディングで世界一

Fable 5の登場で、𝕏上の空気は一変した。

Anthropicに加入したばかりのKarpathy氏は、これは「メジャーバージョン番号」のアップグレードにふさわしい、飛躍的な進歩だと評している。

「仕事用ソフトウェアは水道水のように、いつでも欲しいものを手に入れられるようになりつつある。インタープリター、可視化ツール、ダッシュボード、使い捨てのカスタムアプリなど、何でもリクエストできます。」

最後に、映画『マトリックス』の「自由に思考せよ (Free Your Mind)」という台詞を引用している。

Karpathyのコメント

Claudeのすべてのリリースを経験してきた研究者Alex Albert氏は、「これは初めて“ツール”ではなく“仲間”だと感じさせてくれたモデルだ」と語る。

Alex Albertのコメント

Claude Codeの責任者であるFelix Rieseberg氏は、「第三のAI時代」が今日から正式に始まったと断言する！

それに伴い、画期的な質的変化が訪れる——私たちはAIに「タスク」を割り振るだけでなく、正式に「責務」を委ねるようになるのだ。

Felix Riesebergの詳細な見解 1

Felix Riesebergの詳細な見解 2

（上下にスライドして全文を表示）

この言葉の背後にある真の重みを、まだ多くの人は真に理解していないだろう。

言葉だけではない。主要なベンチマークテストや内部・外部の厳格な評価において、Claude 5は「圧倒的」な支配力をすでに見せつけている。

パフォーマンス全体図

圧倒的、桁違いの性能

「人類最後の試験 (HLE)」において、Mythos 5はツールなしで、プレビュー版を凌駕する実力を示した。

GPT-5.5やGemini 3.1 Proと比較しても、Mythos 5は断層的にリードしている。

HLEベンチマーク比較

次に、Claudeが「最も得意とする」エージェントコーディングタスクを見てみよう。

SWE-Bench Proは、実世界のエージェントコーディング能力を測定する中心的な評価指標であり、すべての最先端モデルが最も鎬を削る分野だ。

Fable 5は80.3%を達成した。

参考までに、11日前に発表されたばかりのOpus 4.8は69.2%、GPT-5.5は58.6%、Gemini 3.1 Proは54.2%である。

Fable 5はOpus 4.8を11ポイント、GPT-5.5を21.7ポイントも上回っている。

前世代の王者がわずか11日で王座から蹴り落とされたのだ。

SWE-Bench Pro比較

Cognitionが開発したエージェントコードの品質を測るベンチマーク「FrontierCode Diamond」では、Fable 5が29.3%を獲得。GPT-5.5は5.7%だ。5倍の差である。

しかもFable 5は、中程度の計算リソースでトップに立った。思考をフルに発揮させる必要すらなく、考えただけで1位になったのだ。

FrontierCode Diamond スコア

Terminal-Bench スコア

StripeはFable 5の早期アクセス権を入手後、大規模なプロジェクトを実行した。

5000万行のRubyコードベース全体の移行である。このレベルの作業は通常、チーム全体で2ヶ月以上かかる。

Fable 5はわずか1日で完了させた。1日で5000万行だ。チーム全員が唖然とした。

Physical SuperintelligenceのCEOもテスト後に大きな衝撃を受けた。

最先端の物理学研究タスクにおいて、Fable 5はGPT-5.5の3分の1の推論トークンしか消費せず、36時間でGPT-5.5が4日かけて到達した地点に達したのだ。

Stripe CEOのコメント

Fable 5の創造力、恐ろしき到達点

Anthropicのテストはすべて、同じことを示している。Fable 5は長時間自律的に作業でき、そのアウトプットの質は異常なほど高い。

エンジニアのバイブル的な工場建設ゲーム「Factorio」を自律プレイした。

画面上では無数のベルトコンベアが高速で動き、ロボットアームが炉と組立機の間で激しく動く。AIはリソースの流れを独自に計画し、自動化生産ラインを構築。1秒ごとにリソースが消費される混沌とした環境で、ゼロから秩序を組み立てたのだ。

若影片無法播放，請改看來源頁。

ブラウザで完全な3Dプリント可能なモデルを設計した。

最初は数行のコード、そしてUIパネルとツールバーを備えた3D CADエディタが画面上に突如としてレンダリングされる。

次にFable 5は役割を変え、自ら構築したエディタ内で視点を回転させ、メッシュを引き伸ばし、エッジを面取りして、抽象的なコンセプトを3Dプリント可能な物理モデルへと成形した。

3Dモデル設計デモ

太陽系の惑星運動を物理の第一原理から独自に軌道方程式を導出し、その結果から日食を予測した。

軌道計算デモ

最も幻想的な例では、暗いキャンバスの上部に「FIFTH SYMPHONY FABLE」のタイトルが掲げられ、ベートーヴェンの交響曲第5番のEDMリミックスが流れる中、高精度の粒子流体が画面中央で炸裂する。

重低音が轟くと深紫色の星雲が湧き上がり、バイオリンが高らかに鳴ると氷青色の流体がオーロラのように闇を切り裂く。流体の衝突と拡散のすべてがビートに乗っている。

若影片無法播放，請改看來源頁。

このリミックス曲自体も、Fable 5がコードで生成したものだ。

一度も音楽を「聴いた」ことのないAIが、コードでベートーヴェンのリミックスを作り、さらにコードでビートに合わせて踊る流体シミュレーションを書いたのだ。

また、「Slay the Spire」をプレイさせたところ、永続的なファイル記憶と組み合わせることで、パフォーマンスはOpus 4.8の3倍に向上し、最終ステージへの到達頻度も3倍になった。

Fable 5が記憶によって強くなる度合いは、前世代のモデルに対する同様の記憶の効果をはるかに超えている。

モデルは「自らの経験から学習する」能力において、次の段階へと足を踏み入れたのだ。

一行もコードを書かずに「ポケモン」をクリア

さらに、Fable 5は「視覚能力」においてもコーディングに劣らぬ大きな進歩を遂げた。

以前のClaudeモデルがポケモンファイアレッドをプレイするには、マップナビゲーション、ゲーム状態の解析、追加のツールインターフェースなど、複雑な補助ツール一式が必要で、しばしば先に進めなくなっていた。

Fable 5は、極めてシンプルな視覚インターフェースのみを使用した。

若影片無法播放，請改看來源頁。

マップもナビゲーション補助も、追加のゲーム状態情報も一切なし。

スクリーンショットを見るだけで、ポケモンファイアレッドを最初から最後までクリアしてしまった。

Anthropicは、その全過程を記録した完全なタイムラプス動画を公開した。AIはピクセルの画面を見て判断し、草むらで野生のポケモンに遭遇し、ジム戦で技を選択し、迷路のような洞窟を抜け、最後まで突き進んだ。

ポケモン攻略の様子

これは、Fable 5が科学ジャーナルの複雑な図表から正確な数値を抽出したり、数枚のスクリーンショットだけでWebアプリケーションのソースコードを完全に再構築できることを意味する。

視覚情報に対するモデルの理解深度は新たなレベルに達し、「画像について話す」ことができるだけでなく、「理解した上で行動できる」ようになったのだ。

視覚タスクベンチマーク

AIが科学者に：Science級の成果を1週間で達成

コーディングと視覚がまだ「効率化」の範疇なら、Fable 5とMythos 5がライフサイエンス分野で成し遂げていることは、「AIに何ができるのか」という問いそのものを考え直させる。

タンパク質設計タスクにおいて、Mythos 5は全自動研究開発を実現した。

ターゲット選定から設計の実行、失敗時の自律的なエラー修正まで一気通貫で行い、14の疾患ターゲットから9の強力な候補ソリューションの獲得に成功。免疫、神経変性疾患、筋肉疾患を幅広くカバーした。

タンパク質設計の成果

最も衝撃的なのはゲノミクスだ。

Mythos 5は1週間以上、ほとんど人の手を借りずに、138種、数百万細胞のデータを自ら収集し、独自に機械学習モデルを設計・トレーニングした。

その結果は、最近Science誌に掲載された同種の研究を凌駕するものだった。

モデルサイズは100分の1でありながら、性能で上回ったのだ。Anthropicは数ヶ月以内にこの結果を発表する予定だ。

ゲノム研究成果

「蒸留」を拒否し、Opus 4.8に差し替え

ここまで来れば、AnthropicがFable 5に「安全分類器」を追加した理由は理解しやすいだろう。

特に、サイバーセキュリティ、生化学、モデル蒸留に関連するリクエストがあると、システムは自動的にOpus 4.8に回答を振り分ける。

ジェイルブレイク耐性比較図

ジェイルブレイク耐性比較図 (400回のレッドチームテスト)

一部の開発者からは、簡単なタスクでもFable 5の「レッドライン」に触れてしまい、直接降格されてしまうという不満の声が上がっている。

注目すべきは、Fable 5を「蒸留」するのはそう簡単ではないということだ。

サイバーセキュリティタスクとは異なり、この種の問題がトリガーされると、Fable 5は通知することなく、プロンプトの変更、制御ベクトル、PEETなどの手法を通じて、モデルの能力を直接制限する。

Anthropicは、約0.03%のトラフィックが影響を受けると見積もっている。

蒸留対策の概要

王座を巡る戦い、「神話」の幕開け

GPT-5.5が発表されてまだ1ヶ月半だが、Fable 5のテールランプを見られる競合プロジェクトは残り2つとなった。

Blueprint-Bench 2では2.4ポイント差、Terminal-BenchではGPT-5.5がCodex CLIによって83.4%を獲得しており、これが全チャート中で最も僅差となっている。

これ以下は、すべて一方的な蹂躙だ。

総合ベンチマーク比較

Anthropicは一撃を放つと同時に、名前にもう一つの意味を込めた。

「ミュトス (Mythos)」は、文明が自らの運命を説明する神聖な物語である。「フェイブル (Fable)」は、人類最古の道徳教育だ。

古代ギリシャ哲学の誕生は、かつてロゴス（理性）によるミュトス（神話）への勝利と見なされ、人類は理性で世界を説明することを学んだ。

古代ギリシャのイメージ図

今、ASIの入り口に立つ企業が、最強のモデルに「神話」と「寓話」と名付けた。

機械がロゴスを征服する速度を、誰もが目の当たりにした。

次の問題は、意味の創造と善悪の判断が、まだ人間の手に留まり続けることができるのか、だ。

参考資料：

https://www.anthropic.com/news/claude-fable-5-mythos-5

https://x.com/claudeai/status/2064394146916229443

https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf

編集：摩西、桃子

ASIを追いかけて

⭐いいね、転送、シェアの3連コンボ⭐

スターをつけて、新智元の最速プッシュ通知をキャッチ！

新智元フッター画像

公式QRコード

著作権表示

Anthropic、神話級のClaude 5をついに解禁！「危険すぎる」と封印された真の実力

Claude 5「デュアルモデル」デビュー: コーディングで世界一

Fable 5の創造力、恐ろしき到達点

一行もコードを書かずに「ポケモン」をクリア

AIが科学者に：Science級の成果を1週間で達成

「蒸留」を拒否し、Opus 4.8に差し替え

王座を巡る戦い、「神話」の幕開け

関連記事

分享網址