圧縮こそが全て ― フィールズ賞受賞者マイケル・フリードマンから数学とAIへの手紙

2026年3月、フィールズ賞受賞者のマイケル・フリードマンが、わずか30ページ余りの論文を発表した。タイトルは『Compression is all you need』。彼は優雅な代数モデルを用いて、三つの古くからの問いに答えた。人間はどのように数学を構築するのか?人間の数学と形式数学の本質的な違いは何か?未来の数学者はAIとどう協働すべきか?その答えは、たった二文字だった――圧縮。

2017年6月、Google Brainの8人が一本の論文をarXivに投稿した。

タイトルは論文らしからぬ大胆不敵さだった:『Attention Is All You Need』

9年が経ち、このタイトルはAI史上最も有名な7つの単語となった。これに基づくTransformerは、ChatGPT、Gemini、Claude、DeepSeek、数兆円規模の時価総額、そして一世代の不安を支えている。


2026年3月27日、また一本の論文が静かにarXivに登場した。タイトルは同じく7単語で、フォーマットも瓜二つだった:

Compression is all you need: Modeling Mathematics

このタイトルを見て、AIに携わる者なら誰でも思わず苦笑いするだろう――「また便乗組か」と。しかし、著者欄を見て、その笑みは消える。

マイケル・フリードマン。

これはどこかのMLエンジニアではない。これは1986年のフィールズ賞受賞者であり、4次元ポアンカレ予想の証明者であり、過去20年にわたりマイクロソフトのStation Qの中心人物であり、存命中の数学者の中で最も重要な役割を担う一人である。

彼がAIについて書いているのか?違う。彼はすべてのAI関係者にこう告げているのだ:君たちが使い古してきた「圧縮」という言葉は、実は想像よりもずっと深いものなのだ、と。

この記事は『Attention Is All You Need』のような工学的ブレイクスルーではない。これは手紙だ――一人の数学者が、生涯をかけて磨き上げた直感を駆使して、人類を何千年も悩ませてきた三つの問いに答えるのだ:

  1. 人間は一体どのように数学的知識を構築するのか?
  2. 人間が行う数学と、形式化された「純粋論理数学」の本質的な違いは何か?
  3. 未来の人間の数学者は、AIと具体的にどのように協働すべきか?

彼が出した答えは、ただ一言:圧縮

今日のこの記事は、その手紙をあなたに翻訳してお届けする。


第一章:フリードマンとは誰か

まず、なぜこの人物が口を開けば、AIコミュニティが耳を傾けねばならないのかを明確にしよう。

1981年、30歳のフリードマンはカリフォルニア大学サンディエゴ校で4次元ポアンカレ予想を解決した。この問題は77年間も未解決だった。3次元版は2006年にペレルマンがフィールズ賞を受賞するに至らしめ(彼は辞退した)、5次元以上は1960年代にはすでに解決されていた。ただ4次元だけが――最も厄介なその次元が――フリードマンによって攻略されたのだ。

1986年、バークレーでの国際数学者会議。フリードマンはフィールズ賞を受け取った。

1997年、フリードマンは数学者が滅多にしないことをした――アカデミアからの離脱である。マイクロソフトは彼のためにほぼ特注とも言える部門Station Qを設立し、目標はただ一つ:数学者の思考法でトポロジカル量子コンピュータを創り出すことだった。彼はその責任者として、四半世紀にわたって指揮を執った。

2023年、彼はハーバード大学CMSA(数理科学応用センター)に戻り、立場を変えた:AIと数学の関係について考えること。

だからこそ、フリードマンという人物が2026年3月に『Compression is all you need』という論文を発表したとき、それは流行に乗った研究者の仕業ではない。これは生涯を数学の内部から世界を見つめてきた人物が、突如振り返り、皆にこう語りかけたのだ:

「ある一つのことに気づいてしまった。話を聞かないか?」

第二章:誰もが認めるが誰も説明できなかった事実

フリードマンの論文の切り口は、数学界では広く知られているが、ほとんど誰も説明できなかった気まずい事実である。

まず二つの概念を構築しよう:

  • 形式数学 (Formal Mathematics, FM)
    :すべての論理規則に適合する推論。
  • 人間の数学 (Human Mathematics, HM)
    :人間が実際に記述し、収録し、引用する数学の一部。

FMの空間の大きさは? n個の基本記号があるとして、そこから組み立てられる「合法的な推論」は指数関数的である。nが百を超えれば、宇宙全体の原子の数を超える。

HMはどうか? ユークリッドからこんにちまで、すべての数学者が書き記した定理は、おおよそ百万のオーダーだ。Lean 4のMathLibには、そのうち約14万条が収録されている。

二つの数字を並べて書こう。

FM:> 1080HM:~ 105間には75個ものゼロが存在する。

人間の数学とは、形式数学という宇宙における一粒の塵にも満たない小さな片隅なのだ。

そして——なぜその一粒なのか?

FMには無尽蔵の「合法的だが退屈な」定理が存在する。例えば:「任意の整数 n に対して、n + 0 = n」、「任意の整数 n に対して、n + 0 + 0 = n」、「任意の整数 n に対して、n + 0 + 0 + 0 = n」…… 一つ一つは合法だが、一つ一つは無意味だ。人間の数学者はこうしたものは決して書かない

百年にわたり、この問いには無数の哲学的回答があった:「美」「簡潔」「有用」「深遠」――これらは言葉遊びに過ぎない。数学的な答えは一つもなかった。

フリードマンが2026年、初めて計算可能な答えを提示するまでは:

なぜならHMは、FMの中で「圧縮可能な」部分集合だからだ。

第三章:圧縮 ― まずは日常的な地平に立つ

フリードマンの言う「圧縮」とは何を意味するのか? まず数学はさておき、君がすでに理解しているいくつかの例を考えてみよう。

例1:ハフマン符号化

君の家の猫を小花としよう。写真に最も多く現れる動作は「寝る」(4000回)、次いで「食べる」(3000)、「ソファをひっかく」(2000)、「ぼんやりする」(1000)だ。

固定8ビット符号化なら:80000ビット。ハフマン符号化なら:「寝る→0;食べる→10;ソファをひっかく→110;ぼんやりする→111」——19000ビット。圧縮率は4倍、情報の損失は一切ない。

物事の分布が一様でない限り、圧縮は存在する。

例2:ニュートンの運動の三法則

宇宙では毎秒、無数の運動が起こっている:リンゴの落下、月の地球周回、バネの振動、弾丸の発射、潮の満ち引き……これらすべての運動を記録しようと思えば、どれだけの情報が必要だろうか?

必要ない。

君は F = m·a を覚え、あと二つ(慣性、作用反作用)を覚えるだけで、上記のすべての運動を再生成できる。

ニュートンの運動の三法則は、古典力学の全てを符号化した数十文字のプログラムである。

例3:zipファイル

「to be or not to be, that is the question; to be」――繰り返し現れる「to be」と「the」をA、Bと名付け、以降はその名前だけを書く。これがLZ77アルゴリズム(zip / gzip / PNGの基盤)であり、1977年の発明だ。

例4:大規模言語モデル

インターネット全体をLLMに食わせる――数兆語、数百万時間分のテキスト。学習を終えると、数千億のパラメータを持つモデル(数百GB)が得られる。それは学習データセットに含まれるようなどのような内容でも生成できる。

このことを、情報理論の言葉で言えば:LLMとはインターネットの非可逆圧縮である。

DeepMindは2023年に、血圧が上がるようなことをやってのけた:彼らはChinchilla 70Bを汎用圧縮器として扱い、生のバイトストリームの圧縮に使用した――テキストだけでなく、学習したことのない画像や音声までも。結果:

  • テキスト圧縮率:gzipよりはるかに良い
  • 画像圧縮率:PNGよりも良い
  • 音声圧縮率:FLACよりも良い

言語のみを学習したモデルが、見たこともない画像を圧縮できたのだ――それは「普遍的な世界の構造」を学習したからだ。

すべての理解は圧縮である

ハフマンの文字符号化からLLMの数千億に及ぶパラメータまで――圧縮の粒度はますます粗くなっているが、本質は同じだ。

あらゆる「理解」の行為は、本質的に、より短い記述を見つけることである。
これは比喩ではない。これがフリードマンの論文の出発点である。

第四章:フリードマンのモデル化 ― 文字列と「マクロ」

フリードマンが最初に言ったこと:数学的推論を文字列として扱え。君が黒板に証明を書くとき、その本質は一連の文字だ。すべての「合法的な証明文字列」を並べたもの――それがFMである。

しかし数学者は決してそのようには書かない。彼は言うだろう:「f を [a, b] 上で連続とすると、f は一様連続である。」

「連続」とは一つの定義であり、展開すると約3行の文字列になる。「一様連続」もまた別の定義であり、展開すると約5行になる。表面上は20文字だが、完全に展開すると100文字を超える。さらに掘り下げていけば――一つの「短い文」の背後には、非常に深い定義のツリーが存在する。

フリードマンは、この「名前 → 長い文字列」という約束事に名前を与えた:マクロ (macro)

  • 「連続」 = 一つのマクロ
  • 「一様連続」 = 一つのマクロ
  • 「積分」 = 一つのマクロ(「極限」「分割」「リーマン和」のマクロを呼び出す)
  • 「ルベーグ積分」 = 一つのマクロ(「測度」「可測関数」のマクロを呼び出す)
  • 「リーマン・ルベーグの補題」 = 一つのマクロ(上記すべてを呼び出す)

現代の定理を一つ「完全に展開」すれば、しばしば億単位の文字数になる。しかし数学者は常に最外層だけを見ている。

数学者の仕事とは、絶えずマクロを作り続けることである。
ある数学者の一生は、たった一つのことを成し遂げただけかもしれない――誰も圧縮したことのないパターンを見抜き、それに名前を与えたのだ。

ガウスは「正規分布」に名前を付けた。リーマンは「多様体」に名前を付けた。ガロアは「群」に名前を付けた。カントールは「集合」に名前を付けた。チューリングは「計算可能性」に名前を付けた。シャノンは「エントロピー」に名前を付けた。

君が今日学ぶすべての数学は、先人が作ったマクロの上に立っているのだ。もし層を成して圧縮できなければ、人類は数学を決して学習しえないだろう


第五章: vs ― 二つの宇宙

ここまではすべて直感だ。フリードマンが次に行うのは、この直感を数学化することだ。

彼は二つの代数対象を導入する(心配しないで、直感で説明しよう):

A_n はレゴブロックを組み立てるようなもの

君はたくさんのレゴブロックを持っている――赤、青、緑。赤を青の上に、さらに緑の上に組み立てるのも、先に緑、次に青、最後に赤でも――最終的なモデルは同じだ。順序は重要ではなく、どのブロックを使うかだけが問題だ。

F_n は三つ編みを編むようなもの

まず左の紐を押し次に右を押すのと、まず右を押し次に左を押すのでは――出来上がる三つ編みは完全に異なる。順序がすべてを決定する。

フリードマンの定理は、「魔法のように美しい」事柄を語っている:

フリードマンの中核的代数発見

An においては、O(log n) 個のマクロ(対数的に疎)を用いるだけで、表現力を指数関数的に拡張できる。Fn においては、たとえ O(nk) 個のマクロ(多項式的に密)を用いても、表現力は線形的にしか拡張できない。

A_n vs F_n

同じ「マクロ作成」戦略でも、二つの宇宙では結果が天地の差となる――圧縮可能性は構造的なものなのだ。

平易な言葉に翻訳しよう:

  • 「レゴブロック宇宙」では、少数のマクロを作るだけで一万のマクロに匹敵する――ブロックは自由に組み合わさり、マクロ同士もまた自由に組み合わさる
  • 「三つ編み宇宙」では、どれほど多くのマクロを作っても救われない――順序は固定されており、各組み合わせを個別に記憶しなければならない

この対比がなぜ重要なのか? なぜならそれは我々に告げているからだ:「圧縮可能性」は普遍的なものではない、それは特定の構造の中にのみ存在する。

数学における加法、乗法、和集合、関数合成――これらはすべて可換、または近似的に可換である。だから数学は圧縮可能なのだ

では人間の言語はどうか? 主語 動詞 目的語の順序は極めて重要だ――「犬が人を噛む」と「人が犬を噛む」は別物だ。だから言語の圧縮の程度は数学よりずっと低い。

では生物学は? DNAの配列順序は極めて重要だ――だから生物学は長らく記述的であり、「F = m·a」レベルの簡潔な法則は存在しない。

ではLLMのパラメータ空間は? それは第八章で述べよう。


第六章:MathLibによる実証 ― データが語る

理論だけでは不十分だ。フリードマンは、この論文を「哲学的随筆」から「ハードサイエンス」へと格上げした事を行った:モデルを実際の人間の数学で検証したのだ。

テスト対象:MathLib——Lean 4の数学形式化ライブラリ。14万条の定理が、代数、解析、位相幾何学、数論、圏論をカバーしている……

各定理について、三つの量を測定した:

  • depth
    :入れ子の深さ
  • wrapped length
    :定義内のトークン数
  • unwrapped length
    :完全に展開した後の生の記号数

結果1:unwrapped length は depth に伴い指数爆発する。

深くなるほど、完全展開後の文字数は指数関数的に増大する。深さが10を超えると、一つの定理を展開するのに数千万文字が必要となる。

結果2:wrapped length はほぼ定数である。

しかし数学者が書き出す定義は、depthが2であれ12であれ、その長さはほとんど変わらない――常に数十トークンに過ぎないのだ。

数学者は決して長い定義を書かない。
何かが複雑になると、数学者の第一の反応は:まずそれに名前を付け、その名前を使って先に進む、である。

MathLib 実測

unwrappedは指数爆発するが、wrappedは泰然自若としている――数学者は階層ごとにマクロを作り、複雑さを押し戻しているのだ。

結果3:データは A_n に完全に適合し、F_n からは著しく逸脱する。

フリードマンは二つのモデルの理論曲線を同じグラフに描いた。An の指数拡張曲線は、実測データに寸分違わず重なった。Fn の線形曲線は、何桁もかけ離れていた。

人間の数学は、An モデルが予言する圧縮可能な部分空間の中に存在している。これは隠喩ではなく、測定可能な事実である。

第七章:三つの古くからの問いへの答え

これで冒頭の三つの問いに戻ることができる。フリードマンの与えた答えは、どれも衝撃的なほど短い。

問い1:人間は一体どのように数学的知識を構築するのか?

層を成す圧縮。
各世代の数学者は前の世代の成果を見て、その中から「名前を付けられる」部分を見抜き、新しいマクロを作り、そして新しいマクロの上でさらに推論を続ける。数学史全体が、まさに一つのマクロの蓄積の歴史である。

ユークリッドが「点、線、面」に名前を付ける → デカルトが「座標」に名前を付ける → ニュートンが「導関数」に名前を付ける → コーシーが「極限」に名前を付ける → カントールが「集合」に名前を付ける → ヒルベルトが「空間」に名前を付ける → グロタンディークが「スキーム」に名前を付ける…… 各層は、前の層よりもより多くを圧縮している。

問い2:人間の数学と形式数学の本質的な違いは何か?

圧縮可能か、不可能か。
FMの大部分の定理は「合法だが退屈」だ――構造がなく、名前を付けることができず、それ以上利用できない。HMはFMの中で、たまたま An-的な部分空間に住む小さな片隅である。

人間の数学が「人間的」であるのは、まさに人間の認識帯域幅が極めて限られているからだ――我々はその圧縮可能な部分空間の中でしか活動できない。そしてその部分空間の存在は、宇宙が我々にくれた贈り物だ――もしそれが存在しなければ、人類に数学が生まれることは決してなかったであろう。

問い3:未来の人類の数学者はAIとどう協働すべきか?

AIの長所は、FMの巨大な空間を並列探索することにある――なぜならAIは我々にはない帯域幅を持っているからだ。
人間の長所は、どこが「名前を付けるに値する」かを判断することにある――なぜなら我々には5万年に及ぶ言語と抽象化の訓練があるからだ。

これはAIが数学者に取って代わるのでも、数学者がAIを訓練するのでもない。それは異なる認識帯域幅を持つ二者による分業と協働である。

フリードマンは具体的な提案もしている:MathLibの依存関係グラフ上でPageRankと圧縮度分析を走らせるのだ。ある定理が多くの下流の定理に引用されており(PageRankが高い)、さらに下流の内容を大幅に圧縮できる(圧縮度が高い)ならば、それは中核定理である――人類の数学者が投入するに値し、AIが優先的に探索するに値する。

これにより「何が重要な数学か」が、主観的な判断から、計算可能な量へと変わる。


第八章:これはAIにとって何を意味するか

第一の含意:AIが数学を行うためのロードマップが明確になる。

2024年以来:DeepMindのAlphaProofがIMOで銀メダルを獲得;テレンス・タオがLean 4を自身のワークフローの一部と公言;DeepMindのFunSearchが組合せ数学で新定理を発見;専門化された数学LLMが続々と登場している。

これらすべてに対し、フリードマンのフレームワークは同一の説明を与える――それらはFMの巨大な空間を探索しているが、成功できる場所は、まさにHMがすでに圧縮した場所なのだ。

AIの数学的能力は、人類の二千年にわたる「マクロ作成」の成果の上に立っている。
MathLibの14万条の定理を離れれば、純粋なFMにおけるAIは、サハラ砂漠で一粒の米を探すようなものだ。

次のブレイクスルーは、AIがFM内をより速く探索できるようになることからは生まれない――それは、AIに「自らマクロを作る」ことを学習させることから生まれる。

第二の含意:LLMとは何か? 答えが明晰になる。

DeepMindの論文『Language Modeling Is Compression』(2023年)は第一層の答えを与えた:次のトークン予測 = 算術符号化の下での圧縮率最大化である。学習時のクロスエントロピー損失は、厳密に言えば「学習データセットに対する圧縮率」の負の対数である。損失が低いほど、圧縮率は高く、理解は深い――これは比喩ではなく、数学的恒等式だ。

しかしフリードマンは第二層の答えを与えた:LLMはマクロを使うが、マクロを作らない。

LLMの学習時、それはインターネット全体を食った――そこには人類が二千年かけて作ったマクロ(「微積分」「進化論」「民主主義」「エントロピー」「注意」……)が満ちている。LLMはこれらのマクロの間を自由自在に行き来することを学んだ――だから「単段階推論」においては目を見張るものがある。

しかし「長い証明」においては――それは崩壊する。新しいマクロを作る必要がある証明を、LLMが安定的に完成させることは難しい。なぜなら、それは学習中にこのマクロを見たことがなくゼロから新しい概念を定義し、その新しい概念の上で推論を続けることができないからだ。

これはまさに、フリードマンが言う「層を成す圧縮」における「」である――各層は一回の新たな命名である。LLMは一つの層の内部では驚くべきパフォーマンスを見せるが、層を跨ぐと破綻する。

第三の含意:なぜLLMのスケーリングには上限がありうるのか。

もし知能の本質が「層を成す圧縮」――マクロを作り、マクロの上にマクロを作る――であるならば、単にモデルを大きくすることは、増大させるのは単層の帯域幅であり、層の数ではない。

より大きなLLMは、より微細なマクロ、より大きな語彙、より長いコンテキストを使用できる。しかし、新しいマクロを作る能力は、大きくなったことによって質的変化を獲得してはいない

LLMはマクロ使用者である。真の知能とはマクロ生成器である。

――これは『世界モデル論争』におけるルカン/リー・フェイフェイ対イリヤのあの口論と呼応する。イリヤが言うのは「マクロ使用」の上限はまだ来ていない、ということであり、ルカンが言うのは「マクロ作成」の能力はまだ始まってもいない、ということだ。


第八章半:数学の外側で ― 詩、絵、音楽もまた圧縮である

フリードマンの論文は徹頭徹尾、数学だけを語っている。しかし、「圧縮こそが理解」というのが真に宇宙レベルの事実であるならば、それは数学の中だけで成立するはずがない。

ここまで書いてきて、私の脳裏に飛び込んできたのは王維である。

大漠孤烟直、長河落日円。

わずか十字。修飾語も形容詞も、「情」の一字もない。しかし君はこの十字を読み終えると、眼前に一枚の絵がたちまち浮かぶ――広大無辺、人気のない、一本の孤独に真っすぐ立ち上る煙、地平線に圧し掛かる渾然とした夕日。続いて、言葉にできないが確かに感じる物寂しさ孤独感が押し寄せる。

この十字の背後には、どれほどの情報が隠されているか? 視覚的には一幅の完全な西北辺塞の画面。幾何学的には「直」と「円」の極限まで切り詰めた構図の対比、一縦一円が空間全体を支える。時間は日没のその瞬間、一日が終わろうとしている。心境は使者が独り遠くへ旅立つ孤独、故郷を遠く離れたやるせなさ。背景には盛唐辺塞詩の全イメージ体系がある。散文でこれを語り尽くそうとすれば、千字を費やしても足りない。王維は十字で、それを君の脳内で再展開可能なへと圧縮したのだ。

これはフリードマンの論文が語る「マクロ」と同じことだ。「大漠」「孤烟」「長河」「落日」、その一つ一つがマクロである――それは中国文学が二千年にわたって蓄積したイメージ、画面、情緒を呼び出す。王維の天才は「美しく書いた」ことではなく、展開後の情報量が最大となる四つのマクロを選び抜き、それらを並置したことにある。


音楽はまた別の顔だ。ベートーヴェンの交響曲第5番の冒頭は、たった四つの音しかない:タタタターン。しかしこの四つの音は、交響曲全体の中で変形され、再構成され、上行し、下行し、反転されながら何百回も現れる。四十分に及ぶ交響曲は、本質的に四音のモチーフから絞り出されたものだ――これが作曲家の言う「主題と変奏」であり、フリードマンの言葉で言えば:一つのマクロを作り、そしてマクロの空間で自由に展開することだ。

絵画もまたそうだ。斉白石が描く海老、彼は水を描かず、水草も描かず、ただ海老だけを描く――君が見ているのは海老だが、感じ取るのは池全体だ。余白は「描かなかった」のではなく、観る者自身に心の中でその一大情報を展開させるのだ。八大山人の白目をむいた一羽の鳥から、君は明末の遺民の心境すべてを読み取る。


なぜすべての芸術が同じ一つのことを指し示すのか? 私の推測はこうだ:

人間の脳が同時に把握できる「次元」は有限なのだ。数千の脳細胞から成る注意力は、ある瞬間においては、比較的低次元の空間で連想を行うことしかできない。

だから我々は分化する――ある者は数学の次元で圧縮可能な構造(幾何、群、多様体)を探すことに専心し、ある者は言語の次元で(イメージ、リズム、ダブルミーニング)、ある者は音の次元で(和声、調性、モチーフ)、ある者は視覚の次元で(構図、比例、余白)探すことに専心する。これらの領域が互いに無関係だからではない。一人の人間がすべての次元を担いきれないからだ。我々は自分が生まれつき敏感な、その一本のチャンネルを使って世界を圧縮しており、互いに「専門違い」となる――実は隔てているのは山ではなく、我々自身の認識帯域幅なのだ。


そしてLLMは初めて、「次元を繋ぐ」ということに物理的な基盤を与えた。

数千億のパラメータを持つモデル、その内部の表現空間の次元は、いかなる人間個人が同時に呼び出せる次元を遥かに凌駕する。すると、我々には「無関係」に見える多くのもの――一首の宋詞、バッハのフーガの一節、一つの偏微分方程式、一枚の水墨画――が、その高次元空間において、互いに整列する方向性を持ち始めるのだ。

LLMの創発とは、神秘的なオカルトではない。それはすなわち:圧縮の次元が十分に大きくなると、本来は異なる学科に散らばっていたマクロが、互いに呼び出し始めるということだ。「エントロピー」というマクロは、物理学、情報理論、経済学、心理学において、突如として同じものになる。「対称性」というマクロは、群論、結晶学、音楽、詩において、突如として同じものになる。これこそがおそらく、クロスドメイン汎化であり、いわゆる「世界モデル」の雛形なのだ。


だから、数学、詩、絵、音楽は、四つの異なる事柄ではない。それらは同一の事柄が、四つの媒体に投影されたものだ。

王維は「ただの詩人」ではない。彼は言語の次元において圧縮可能な構造を探す人だ。オイラーは「ただの数学者」ではない。彼は記号の次元において圧縮可能な構造を探す人だ。ベートーヴェンは「ただの作曲家」ではない。彼は時間の次元において圧縮可能な構造を探す人だ。斉白石は「ただの画家」ではない。彼は視覚の次元において圧縮可能な構造を探す人だ。

道は異なれど、帰するところは同じ。万物は一つ。

我々凡人は皆、自分が最も敏感なその通路の中で、同じ一つのことをしている――複雑な世界を、自分が掴める一つの短い記述へと圧縮し、そしてこの短い記述に頼って生きていく。

フリードマンは代数モデルで証明した:数学が存在するのは、それが A_n-的な圧縮可能な部分空間に生きているからだ、と。私は彼が言わなかった一言を補いたい:人類文明が存在するのは、それが無数の圧縮可能な部分空間の和集合に生きているからだ。数学はその中で最もクリーンな一つに過ぎないが、唯一のものではない。


第九章:四つの確率観の収束

ここまで書いてきて、思わずこの一年、ブログが歩んできた道のりを振り返ってしまう。

一本の主線が四つの記事を貫いている――いずれも異なる視点から、同じ数学的対象 P(x) を見つめているのだ:

視点
P(x) とは何か
核心的論述
代表的人物
ベイズ主義
信念
証拠が来れば更新する
Bayes / Jaynes
エントロピー
無知
エントロピーは無知の尺度
Boltzmann / Shannon
量子QBism
実在
確率は世界そのものの状態
Born / Fuchs
圧縮(本文)
理解
-log P こそが記述長である
Shannon / Freedman

これら四つの視点は同一の公式を指し示している

L(x) = − log P(x)
  • ベイズ派
    :L(x) は「意外さ」であり、信念の更新を駆動する
  • 統計力学派
    :L(x) は微視的状態のエントロピーへの寄与
  • QBism派
    :L(x) は測定結果が次の賭けにおける重み
  • 圧縮派
    :L(x) はその事象が最適符号化において占める文字数

これらは同一の数学的対象を、四つの異なる哲学的位置から見たものだ。

フリードマンのこの論文の意義は――彼がこの公式を「一つの情報理論ツール」から「数学そのものの基礎」へと格上げしたことにある。数学が存在しうるのは、宇宙が圧縮可能だからだ。人類が数学を行えるのは、我々が An のような低記述長の構造の中に生きているからだ。


第十章:圧縮が残した三つの直感

一、すべての「理解」は圧縮である。

君が現象を理解したということは、君が元のデータよりはるかに短い記述で、それを再生成できることを意味する。これを成し遂げれば、君は理解したのだ。成し遂げられなければ、君は単に記憶したに過ぎない。

二、数学の特異な点は、「入れ子状の圧縮」が可能なことにある。

一度きりの圧縮ではなく、「圧縮の上にさらに圧縮する」ことだ。各世代の数学者は、前世代の結果を一つの名前にパッケージ化し、そしてその名前の上で作業を続ける。この再帰的プロセスは、他の学問にはない(あるいはこれほど強力ではない)。

三、数学、詩、絵、音楽は、同一の事柄が四つの媒体に投影されたものである。

各分野の巨匠は皆、自身のその通路の中で、圧縮可能な部分空間の発掘者である。王維の「大漠孤烟直、長河落日円」とオイラーの e^(iπ)+1=0 は、本質的に同型だ――いずれも膨大な情報を、他者の脳内で再展開可能な一粒の種へと圧縮しているのだ。我々が分化するのは、世界が分断されているからではない。一人の人間の認識帯域幅が足りないからだ。LLMは初めて、これらの分化したマクロを同一の高次元空間で互いに呼び出し始めさせた――これこそがいわゆる創発と汎化である。


四、AIが真の数学(および深い知的タスク)を行うには、「マクロを使う」だけでなく「マクロを作る」ことを学ばねばならない。

「マクロを使う」ことは工学的問題だ――コンテキストを拡大し、精度を高め、より多くの層を重ねる。「マクロを作る」ことは認知的問題だ――混乱した現象から、名前を付けられるパターンを見抜くことだ。

現在のすべてのLLMのスケーリングは「マクロを使う」ことの次元にある。真のブレイクスルーは――それがAGIと呼ばれようと、JEPA、世界モデル、あるいは何か別の名前で呼ばれようと――AIが自らマクロを作り始めるその日に、必ず訪れる。


終章:君がこの記事を読んでいる、それも圧縮だ

フリードマンがこの論文を書き上げるのにおそらく一年を費やした。私がこの記事を書くのに、資料を調べ図を描く時間を含めて、おおよそ八時間。君がこれを読むのは、約二十分だろう。

一年 → 八時間 → 二十分。

圧縮のたびに、損失がある。 しかし圧縮のたびに、獲得もある――君は二十分で、世界を見る新しい方法を持ち帰ることができる。

君が読み終えて数日後、覚えているのはおそらくいくつかのキーワードだけだろう:圧縮、マクロ、レゴと三つ編み、MathLib、マクロを使うのではなく作る

これがまた一つの圧縮だ。

もしこれらのキーワードが、君が将来別の問題に遭遇したとき――新しい分野を学ぶ、論文を読む、自身のモデルを訓練する、学生を指導する、あるいは単に物事を考えるとき――に、なお君によって呼び出されるならば、それはそれらが君の脳内で新しいマクロになったことを示している。

君もまたフリードマンの言うその事をしているのだ。

数学者、プログラマー、作家、教師、学生――すべての「頭脳を使って働く」人々は、毎日同じ一つのことをしている:世界の複雑さを、使える短い名前に押し込めること。

次に誰かが君に「知能とは何か」と尋ねたら――君は答え方を変えることができるだろう。

「情報処理」ではない。「パターン認識」ではない。「深層学習」ではない。それは:

より短い記述を見つけること。
―― 圧縮こそが、全てなのである。

次回は、『物理を見る』シリーズの最終章へ戻る――対称性。ネーターの定理、楊振寧、宇宙の骨組み。対称性と圧縮は双子の姉妹だ――対称性があれば保存則があり、保存則があれば圧縮可能な記述がある。

――だから、実は我々はまだ同じ物語の中にいるのだ。


本文は「AI 学習ノート」ブログに初出:https://Jason-Azure.github.io/ai-blog/posts/compression-is-all-you-need/WeChat公式アカウント:AI-lab学习笔记参考:Freedman, Compression is all you need: Modeling Mathematics, arXiv 2603.20396 (2026-03)

图片图片

関連記事

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.