もしAIの数学能力が現在のペースで発展し続ければ、我々(数学研究者)はまもなく危機に直面するだろう。
数学界最高の栄誉であるフィールズ賞受賞者、ティモシー・ガワーズは、最新のChatGPT 5.5 Proを体験した後、学生たちに向けて赤色警報を発した。
特に博士課程の学生への影響は、差し迫っている。
事の始まりはこうだ。ケンブリッジ大学の数学の大家である彼が、最近、特別な「高速レーン」とも言える5.5 Proのアクセス権を手に入れた。
新しいおもちゃを手にしたガワーズ氏は、さっそく加法数論の未解決問題をAIに投げかけ、その実力を探ろうとした。
しかし、その後に起こったことは、彼の予想を完全に超えるものだった。
2時間も経たないうちに、GPTは「完全に博士論文に記載できる」と彼が認める数学的成果を単独で達成したのだ。
その間、ガワーズ教授は数学的な指導を一切行っていない。
彼が行った唯一のことは、次のような指示だけだった。
「うん、そのアイデアは良さそうだね。展開してみてくれる?」
「いいね。LaTeXのプレプリント形式で書いてもらえる?」
この瞬間、ガワーズ氏は現代の若者が感じる息苦しいような焦燥感を、肌で感じた。
AIがすでにこのレベルの難問を単独で攻略できるようになった今、博士課程で学ぶ若き数学者たちは、どこへ向かえばいいのか?
彼自身も、明確な答えを出せずにいる。
唯一できることは、可能な限り早く学生たちのために新たな活路を見出すことだ。
AGIが本当に到来する前に、数学を学ぶ真の価値を見つめ直し、迅速に方向転換することだ。
学生に対して責任を持つ数学科は、緊急にこの準備を進めるべきだ。
しかし、まだ焦ってはいけない。もう一人のフィールズ賞受賞者、テレンス・タオが、多くの意見を述べているからだ。
何しろ彼は、AIと数学の境界領域における先駆者であり、最近では若者がAI時代の新しい道を見つける手助けをするため、AI4S組織を共同設立したほどだ。
偶然にも、タオもまた最新の見解を発表したばかりだ。
数学的証明の「消化」問題こそが、AI時代において人間の数学者にとって最も代替不可能な価値である、というのだ。
当代随一の二人の数学者が、同じ嵐に直面し、異なる角度からの考察を示している。
しかし、タオと比較すると、今回のガワーズ氏のリアクションにはより一層注目すべき点があるだろう。
何しろタオはすでに「AIのベテランプレイヤー」であり、比較的冷静だ。
今回のガワーズ氏は、少々「腰を抜かした」ようで、ものすごい長文を一気に投稿した。
それはもう、本当に長い……。
以下は、より読みやすく整理したバージョンです。
お楽しみください。
フィールズ賞受賞者によるChatGPT 5.5 Proの数学実験
物語の起点は、実に興味深い論文だった。
加法数論の大家、メル・ナサンソンが、整数集合の和の性質に関する未解決問題を多数リストアップした論文を発表したのだ。
この種の問題は、方向性が明確で、難易度もほどほど、かつ数も多いため、本来は駆け出しの博士課程学生が練習し、最初の一流学術誌掲載を狙うための格好の素材だった。
それをガワーズ氏は、ChatGPT 5.5 Proを困らせるために使ったのだ。
彼がAIに投げかけた問題は大まかに以下のようなものだ。
整数集合Aが与えられ、k個の要素を持ち(|A|=k)、その二重和集合(簡単に言えば、集合内のあらゆる要素を二つずつ足して得られる新しい集合。2Aと記す)の要素数が分かっている場合、Aの直径は最小でいくつになるか?
ナサンソン自身は指数関数的な上界(2^k-1)を証明していたが、さらに改善できるのではないかと常々疑っていた。
ChatGPT 5.5 Proは17分5秒間、思考した。
そして、二次関数的な上界の構成を提示した。それも、理論的に最適なものだった。
その核心的なアイデアは、シドン集合(和集合のサイズが最大化される特殊な集合)と等差数列を組み合わせて構成する、というものだ。
分かりやすく言えば、まるでブロック遊びのようなものだ。AIは二つの特殊なブロックを選んだ。
一つはシドン集合と呼ばれ、その中の任意の異なる二つの要素の和が全て異なるため、和集合の規模を最大化できる。
もう一つは、我々が学校で習った等差数列だ。この二つのブロックを巧みに組み合わせることで、条件を満たす最小の直径を持つ集合を構築したのだ。
ナサンソンの元々の証明は帰納法を用いており、本質的には同様のブロックの組み合わせだが、2のべき乗を用いるような効率の悪いシドン集合を使っていた。
しかし、それはまるで大きなブロックで小さな家を建てるようなもので、どうしても空間を無駄にしてしまい、指数関数的な大きな直径を得ていたのだ。
ChatGPT 5.5 Proは、より効率的であることが知られているシドン集合に直接切り替えた。
この集合の直径は二次関数的(簡単に言えば、要素がk個の場合、直径はおおよそk²のオーダー)であり、指数関数的(2^k)なものより桁違いに小さい。これは、精密な小さなブロックで正確に家を建て、空間効率を極限まで高めたようなものだ。
「それは既存の数学ツールを組み替えただけでは?」とおっしゃる方もいるかもしれない。
全くその通りだ。
しかしガワーズ氏自身も認めているように、人間の数学研究のかなりの部分も、本質的に既存の知識と証明技法を組み合わせているのだ。
重要なのは、ナサンソン本人がこの手を思いつかなかった一方で、ChatGPTは思いついた、という点にある。
ガワーズ氏は続けて、関連する発展的な問題を尋ねた。
二重和集合を制限付き和集合(この集合の要素同士を足し合わせる際、同じ要素同士は不可とする)に置き換えた場合、他の条件は同じままで、最小直径を見つけられるか、というものだ。
この問題も何の疑念もなく解決された。
そして彼がChatGPTに二つの結果を統合して学術ノートを作成するよう依頼すると、47分後には、標準的なLaTeXのプレプリントが出来上がっていた。
そこから事態はさらに面白くなる。ガワーズ氏はさらに難易度を上げ、一般的な場合におけるk重和集合の直径の問題を尋ねた。
この問題ははるかに難しい。一般的なkに対して、どのような和集合サイズが実現可能かさえ完全には分かっておらず、基本的な構成の枠組みすら欠けているからだ。
しかし幸運なことに、MIT(マサチューセッツ工科大学)の学生アイザック・ラジャゴパルが先駆的な研究を行っており、h重和集合の直径が指数関数的に依存することを証明していた。
ガワーズ氏は、GPT 5.5 Proがアイザックの研究を基に改善できるか試そうとした。すると、AIはまさかの二段跳びの操作を見せ、さらに独自のk-解離集合の構成を生み出したのだ。
その後に起こったことを時系列でまとめてみよう。
第1ラウンド、ChatGPTは16分41秒間思考し、解離集合に基づく革新的なアイデアにより、上界を指数関数レベルから準指数関数レベルへと改善した。
第2ラウンド、ガワーズ氏がプレプリント化を依頼し、47分39秒を要した。
第3ラウンド、アイザック本人が確認し、論証は正しく見え、論理も厳密であり、k-解離集合の使い方が巧妙だと評価した。
第4ラウンド、ガワーズ氏が欲張り、ChatGPTにさらに推し進めて多項式の上界にできないか尋ねた。
第5ラウンド、ChatGPTは13分33秒間思考し、k-解離集合を微調整することで可能だが、いくつかの技術的な詳細を検証する必要があると提案した。
第6ラウンド、ガワーズ氏がChatGPT自身に検証を依頼し、9分12秒後に核心的な問題点を解決した。
第7ラウンド、プレプリント化に31分40秒。
第8ラウンド、アイザックが再び査読し、結論は基本的に成り立つと判断した。さらに特筆すべきは、一行一行が正しいだけでなく、アイデアの面でも正しい、つまりChatGPTが確かに新しいアイデアを提供したと彼が指摘したことだ。
そしてこの全過程において、ガワーズ氏の数学的なインプットはゼロだった。
彼の仕事の全ては、プロジェクトマネージャー(数学版)としての役割、すなわち――
要求を出し、方向性を確認し、成果物の提出を求めることだった。
数学そのものは、全てChatGPTが行ったのだ。
AIが数学の博士課程学生への参入障壁を引き上げた
この一件が単なるクールなデモで終われば、まだ良かった。
しかしガワーズ氏が目にしたのは、二つの迫りくる危機だった。
まず、非常に現実的な問題として、このAIが生み出した成果をどのように扱うべきか、ということだ。
もし人間の数学者が成し遂げたのであれば、これは完全に発表に値するものだ。
しかし現在、主要な作業はAIが行ったため、arXivはAI生成コンテンツを明確に拒否しており、従来の学術誌も当然これを受け入れないだろう。
では、どこに置くべきなのか?
ガワーズ氏は自ら一つの構想を提唱している。それは、AIによる数学の成果のための専用リポジトリを構築し、一定の審査プロセスを設けるというものだ。
例えば、人間の数学者が正しさを確認するか、形式化された証明アシスタントによる検証を必要とするが、その審査自体が大きな作業負担にならないようにする、といったものだ。
率直に言って、この問題には現在、答えがない。そのため、この成果はガワーズ氏のブログにリンクで存在しているに過ぎない。
成果の帰属問題以上に、ガワーズ氏が真に焦りを感じているのはここだ――
数学の養成システムが根底から揺らいでいるということだ。
博士課程の学生を研究者として訓練する最も古典的な道筋は、新人に適度な難易度の未解決問題を与えて入門させることだ。
ナサンソンの論文にあったような問題は、本来そのための完璧な素材だった。
しかし今や、ChatGPT 5.5 Proが2時間でそれを解決してしまった。
これにより、参入障壁は直接的に引き上げられた。かつては「誰も証明したことのないもの」を証明すれば良かったのが、今では「AIにも証明できないもの」を証明しなければならなくなったのだ。
ガワーズ氏は全く悲観しているわけでもなく、二つの緩衝材を提示している。
一つは、博士課程の学生もAIを使えるようになる、という道だ。
将来の研究のハードルは「AIが解けない問題」に真っ向から挑むことではなく、人間とAIの協調によって、AIが単独では達成できない成果を上げることになるかもしれない。
ガワーズ氏自身も最近、このような人間とAIの協調による数学研究を数多く行っており、AIは確かに有用な貢献を提供できるが、まだ状況を一変させるようなアイデアを単独で創出する段階にはない、と述べている。
もう一つは、AIが最も突破しやすいのは、実は組合せ数学であるという点だ。
なぜなら、組合せ論は本質的に問題からの逆方向の推論であるのに対し、数学の他の分野はアイデアからの順方向の探索である場合が多いからだ。
後者は、どのような観察が興味深いのか、どの方向を深く追求する価値があるのかを判断する必要がある。このような審美的判断はAIにとってより困難である可能性があり、現在のところは依然として人間が優位に立っている。
しかし彼は、以上のことはすべて「現在の」AIにしか当てはまらず、大規模モデルの進化があまりにも速いため、今の判断は数ヶ月で時代遅れになるかもしれない、とも強調している。
そして、さらに追い討ちをかけるようにこう指摘した。
もし人の数学をする目的が、自分の名前を永遠に定理や定義に刻むこと、「永久に名を残すこと」を追求することなら、そうした時代の恩恵は、おそらくすぐに完全に消え去るだろう。それは誰にとっても同じことだ。
ガワーズ氏は一つの思考実験で本質を突いている。
ある数学者がAIとの長時間の対話を通じて重大な問題を解決し、数学者は導き手の役割を果たしたが、主要なアイデアと全ての技術的作業はAIが行ったとする。我々はこれをその数学者の重大な業績だと見なすだろうか?
ガワーズ氏の答えは、「しない」だ。
そうであるならば、AI時代に数学を学ぶことに、いったい何の意味があるのか?
ガワーズ氏は言う。優秀なプログラマが「Vibeコーディング」を一般人より得意とするように、真に研究を行ってきた数学者もAIとの協働がより上手くなるだろう、と。問題解決プロセスそのものへの理解が深ければ深いほど、AIを使いこなす能力も高まるからだ。
数学そのものは、高度に転用可能な基盤的思考能力である。将来、数学研究者は定理に単独で名を冠する学術的栄誉を失うかもしれないが、蓄積された思考の基礎体力こそ、AI時代における最良の個人のよりどころとなるだろう。
テレンス・タオの三層ピラミッド
実のところ、AIが数学研究にもたらす衝撃について、テレンス・タオははるか以前から気づいていた。
今回、彼は一つの「ピラミッド」を提唱し、数学問題の解決を三つの構成要素に分解した。
証明生成:完全な証明を構成すること。
証明検証:証明が正しいことを確認すること。
証明消化:この証明が何を言っているのか、なぜ正しいのか、どのようなより深い構造を明らかにしているのかを、真に理解すること。
最初の二つは、AIが驚くべき速さで自動化しつつある。
しかし三つ目の――消化――は、解決には程遠い。
これが、前例のない「認知的過負荷」を引き起こすだろう。
まるで無料でばら撒かれるかのように証明が大量生成され、機械が検算までしてくれても、誰もそれを真に消化しない。
タオはこれを「証明消化不良」と呼んでいる。
これに対して、こう提案する人もいるかもしれない。
「では、第三段階も自動化してしまおう。より良い数学的な記述スタイルで証明を提示するようAIを訓練し、理解しやすくすればいい」と。
しかし、タオの意見は異なる。やみくもに「可読性」という指標を最適化すると、かえって最終産物を悪化させる可能性があるというのだ。
彼は料理に例える。
我々が食べ物を噛むのは、消化を助けるためだ。調理技術によって食べ物は柔らかくなり、噛む必要性が減少する。
しかし、もし消化プロセスを徹底的に最適化し、「噛む必要量」を最小限にまで抑えようと決めたなら、論理的な最適解はこうだ――全ての食べ物をミキサーに入れ、チューブで直接胃に流し込むことだ。
これは技術的には確かに消化問題を解決する。しかし、そんな食事を望む人は誰もいない。身体も精神も、重大な問題を引き起こすだろう。
食事の価値は、単に栄養を摂取することだけではないのだ。
五感での体験、社交の場、そして咀嚼そのものがもたらす満足感……こうした副産物こそ、人間が最も享受するものだ。
摩擦を全て最適化して排除すると、得られるのはより良い食事ではなく、一本の栄養チューブだ。
数学も同じだ。
数学を学ぶ上で、どれが「経なければならない」摩擦なのかを見極めることだ。
証明の中には、人為的に作られた「難しさ」がある。
表現が不明瞭、構造が混乱している……こうした「人為的な難しさ」は、AIを使って論文を読解することで確かに取り除ける。まるで肉を調理してから食卓に出すように。
しかし、別の種類の「自然な難しさ」もある。
それは本来、難しいものなのだ。
読者がそれを「咀嚼」することで初めて真の理解を得られ、その過程で新たなひらめきが生まれ得る。
これは、タオが以前ポッドキャストで語ったように、彼がスケジュールにわざと空白の時間を設けて「偶然の出会い」に備えるのと似ている。
ここまでで、「AIに全てを解決させ、評価基準を最適化し続け、『自然な難しさ』も考慮に入れればいいのでは?」と言う人もまだいるだろう。
だが実際のところ、全ての問題が「最適化問題」として扱えるわけではない。「無限に反復さえすれば、最終的に得られる結果が、我々の望むものである」とは限らないのだ。
人間が食べ物に対してそう考えないのと同じだ。
ミシュランのシェフが手作りした料理は、安全で、見た目が良く、消化に優れ、便利で、味も悪くない機械加工の食品よりも、今日でも珍重されている。
加工食品に使い道がないと言っているのではない。
ただ、人間の料理芸術を完全に代替しようと真剣に提案する人は誰もいないのだ。
それは「火の温もり」であり、人間が与えなければならないものなのだ。
ミキサーに飲み込まれるな
二人のフィールズ賞受賞者は、同じ嵐に直面しながら、異なるものを見ている。
ガワーズ氏が見ているのは危機だ。
かつて若き数学者のために用意されていた「入門コース」が、AIによって平らに均されている。養成システムの基盤が揺らぎ、学術発表のルールが機能しなくなっている。
新人たちの道は、いったいどこにあるのだろうか?
これに対し、テレンス・タオもまた答えを持っているわけではない。彼が提示するのは境界だ。
AIは証明を生成し、検証できる。しかし「消化」は、少なくとも今のところ、人間だけのものだ。
AIにできないからではない……。
それを手放してはいけないのだ。
これは単なる知的タスクではない。「消化」という行為は、知性そのものの核心に触れるものだからだ。
これはまさに、「意味」が問われる時代だ。
AIは我々を一歩ずつ壁際に追い詰め、何度も、果てしなく問い続ける。
人間だけに属する、最も貴重なものとは一体何なのか?
数学の領域において、それはおそらく、タオが言うところの有益な「自然な難しさ」なのだろう。
自力で咀嚼し、苦悶しながら探求しなければ、真に自分の一部とはならない知識のことだ。
おそらく、他の分野でも同じことが言えるだろう。
ミキサーはあらゆるものを粉砕できる。
しかし、人間が自ら行わなければならないことが常にあるのだ。
「マトリックス」の中で、チューブを繋がれた生物電池に成り下がってはならない。
参考リンク:
https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/ https://x.com/wtgowers/status/2052830948685676605 https://mathstodon.xyz/@tao/116551624228986501