グーグルAIが6本の数学論文を連続発表！Geminiが博士級研究に侵入、SOTAを91.9%で更新

新智元レポート

編集：桃子好睏

【新智元要約】本日、Google DeepMindの「AI数学者」Aletheiaが完全に暴走し、数学予想を攻略し、論文を独自に執筆。さらに驚くべきことに、金メダルを獲得したGeminiが18のコア研究課題を一掃しました。

次のノーベル賞受賞者は、Geminiが予約済み！

Google DeepMindは再び世界の研究コミュニティに爆弾を投下し、一気に2本の重要論文を公開――

Gemini Deep Thinkが「研究パートナー」となり、数学、物理学、計算機科学分野の研究級難題を次々と突破。

以前、AIがIMOやICPC国際大会で金メダルを獲得するのは、すでにすごいことでしたが…

今回は、Geminiが完全に開花し、本当の研究を始めました！

GoogleはGeminiベースの「AI数学者」、コードネームAletheiaを構築。博士級の難題で、複数の研究マイルストーンを達成。

これには、学術幾何学論文の独自執筆・発表に加え、「エルデシュ予想」データベースの700の未解決問題に対する体系的評価が含まれます。

IMO-ProofBenchベンチマークテストでは、Aletheiaが独走し、91.9%のスコアでSOTAを塗り替えました。

さらに破壊的なのは、人間の最も中核的なスキルである「自己訂正」を備え、自身で解決できない問題を積極的に認めることができる点です。

いわゆるミレニアム懸賞問題も、一つずつ解明される日が遠くないかもしれません。

それだけでなく、物理学と計算機科学では、Gemini Deep Thinkが専門家と連携し、18の長年停滞していた研究課題を攻略。

10年にわたるサブモジュラー最適化予想の終結、離散アルゴリズムのボトルネック突破、機械学習と組合せ最適化、情報理論と経済学など、華々しい成果は歴史に刻まれるに足ります。

今この瞬間、人間の研究ワークフローは、抜本的な変革を醸成しています。

Geminiの加速進化は、ほぼ「次元削減攻撃」とも言える方法で、複数の研究分野で暴力的に突破口を開いています。

Googleの「AI数学者」Aletheiaが登場博士級難題を粉砕

2025年夏、Gemini Deep Think（アドバンスト版）が初めてIMO金メダルを獲得し、続いてICPC大会で優勝。

今、Geminiは完全に競技の門戸を越え、人類の知性の「深海域」へ正式に侵入しました。

IMO級の競技難易度とは異なり、研究レベルの数学問題は、膨大な文献から「高度な技術」を呼び出す必要があります。

「基盤モデル」（FM）は知識豊富ですが、専門データが不足しているため、高度な学問分野を扱う際には理解が不十分になったり、場合によっては「幻覚」を生じたりしがちです。

このため、Google DeepMindは内部で、強力なGemini Deep Thinkを背負った数学研究AIエージェント――Aletheiaを構築しました。

論文リンク：https://github.com/google-deepmind/superhuman/blob/main/aletheia/Aletheia.pdf

古代ギリシャ語で、Aletheiaは「真理」を意味します。

自然言語における「エンドツーエンド」の反復的な生成、検証、解決策の修正を実現しました。

具体的には、Aletheiaは「自然言語検証器」を備えており、候補となる解決策の欠陥を指摘し、「生成-修正」の反復プロセスを実現します。

最も重要なのは、自身で解決できないことを認めることができ、この特性により研究者の効率が大幅に向上します。

Aletheia概要：研究レベルの数学問題に対して反復的な生成、検証、修正を行うことができる、Deep Think駆動の数学研究AIエージェントです。

要するに、Aletheiaを駆動する3つのコア技術柱は以下の通りです：

Gemini Deep Thinkアドバンスト版： 極めて難しい推論問題に取り組むため専用化；
斬新な推論時スケーリング則： その能力範囲は極めて広く、トップではオリンピック級難題を処理でき、ボトムでは博士級の専門演習に対応可能；
強力なツール呼び出し能力： Google検索とウェブ閲覧と深く統合し、数学研究における長年の難題を攻略。参考文献の捏造や不正確な計算はほぼ存在しません。

2025年7月にIMO金メダル水準に到達して以来、Gemini Deep Thinkの進歩は神速です。

推論時計算量（inference-time compute）の増加に伴い、IMO-ProofBench高度テストでのスコアは90%に達しました。

Google DeepMindは、オリンピック級から博士級演習問題（内部のFutureMath Basicベンチマークに基づく）に移行しても、スケーリング則が依然として有効であることを証明しました。

注目すべきは、Aletheiaはより少ない推論計算量でも、より高い推論品質を実現できることです。

2026年1月時点でのDeep Thinkの最新アドバンスト版は、オリンピック級問題におけるパフォーマンスが（2025年7月の）IMO金メダル版を大幅に上回っています。推論時のスケーリング則は博士級演習問題にも同様に適用されます。Aletheiaは推論品質でさらなる飛躍を実現し、かつ推論時計算量はさらに低くなっています。すべての結果は人間の専門家による採点です。

最初の6本の論文、AIが1本を手作業で作成、3本は既に発表

研究レベルの数学における実戦では、Aletheiaの実力は冗談ではなく、すでに多くの注目すべき「自律的突破」を達成しています。

Aletheiaが完成した最初の6本の論文には、以下のカテゴリが含まれます――

完全自律完成、人間0関与

論文「Eigenweights for arithmetic Hirzebruch Proportionality」は完全にAletheiaによって生成され、一切の人的介入はありません。

これは、算術幾何学における「固有重み」（eigenweights）と呼ばれる特定の構造定数を計算します。

論文リンク：https://arxiv.org/abs/2601.23245

人間とAIの協業

論文「Lower bounds for multivariate independence polynomials and their generalisations」は、人間とAletheiaの協力により完成され、相互作用粒子系（独立集合と呼ばれる）の境界を共同で証明しました。

論文リンク：https://arxiv.org/abs/2602.02450

大規模半自律的評価、エルデシュ予想難題を攻略

論文「Semi-Autonomous Mathematics Discovery with Gemini: A Case Study on the Erdős Problems」は、Bloomの「エルデシュ予想」データベースの700の未解決問題を評価し、そこに列挙された4つの未解決の謎を自律的に解決しました。

Erdős-1051問題では、モデルが自律的な解答を提供し、別の研究「Irrationality of rapidly converging series: a problem of Erdős and Graham」で報告された一般化成果を推進しました。

論文リンク：https://arxiv.org/abs/2601.22401

論文リンク：https://arxiv.org/abs/2601.21442

さらに、Aletheiaは以下の別の2本の論文で、中間命題に貢献しました。

論文リンク：https://arxiv.org/abs/2601.18557

論文リンク：https://arxiv.org/abs/2601.23229

特筆すべきは、以前にもGeminiによる研究レベルの数学探求の仕事はありましたが、協力規模と解決した問題数は比較的小さなものでした。

さらに、Google DeepMindは重要性とAI貢献度に基づいて「AI支援数学研究」を分類するタクソノミーを確立しました――

以下の表で、すでにレベル2（発表可能な品質）として分類されている成果は、著名なジャーナルに投稿されています。

現在、GoogleはGeminiを通じてレベル3（大きな進展）またはレベル4（画期的な突破）の成果はまだ得ていません。

本研究でカバーされるすべてのAI支援数学成果の分類表。表でレベル2としてリストされている成果は投稿済みです。

10年予想に終止符、18の主要研究課題を攻略

数学での活躍に加え、Gemini Deep Thinkは計算機科学と物理学の分野でも、大きな可能性を示しています。

論文「Accelerating Scientific Research with Gemini: Case Studies and Common Techniques」は同様のエージェント推論の考え方に基づき、特に「アドバイザー」（Advisor）モードという効率的な協業の「秘訣」をまとめています：

つまり、人間が反復的な「直感検証」（Vibe-Proving）サイクルを通じてAIを導き、直感を検証し証明を洗練させる。

論文リンク：https://arxiv.org/abs/2602.03837

さらに、Googleは「バランスド・プロンプティング」（balanced prompting）などの戦術的テクニックも詳述しています。

――確認バイアスを防ぐため、AIに証明と反証を同時に試みさせること、およびコード支援検証。

これらの方法は、モデルの深い構造的接続による異なる科学分野の横断能力と組み合わさり、理論研究の進め方を変えつつあります。

この仕事は、STOC’26会議のCS理論論文のレビュー支援にGemini Deep Thinkアドバンスト版を展開することに成功した基盤の上に成り立っています。

AI推論プロセス図：ネットワーク層が解空間を広く探索し、その後構造化された推論に収束し、最終的に自動化検証と人間によるレビューで確認される様子を示しています。

専門家との協力により18の研究課題を攻略することで、Gemini Deep Thinkアドバンスト版は、アルゴリズム、機械学習、組合せ最適化、情報理論、経済学の分野で長年存在していたボトルネックを打破する手助けをしました。

ICLR 2026に採択

論文「Accelerating Scientific Research with Gemini: Case Studies and Common Techniques」のハイライトには以下が含まれます：

数学の境界を越えてネットワークパズルを解決

「最大カット（Max-Cut）」（ネットワークの効率的分割）や「シュタイナー木（Steiner Tree）」（高次元点の接続）といった古典的な計算機科学の問題の進展は一時停滞していました。

Geminiは「思考の固定化」を打ち破ることで、これらの膠着状態を解決しました。

全く関連のない連続数学の分野から高度な道具――例えばキルシュブラウンの定理、測度論、ストーン＝ワイエルシュトラスの定理――を持ち込み、これらの離散アルゴリズムのパズルを成功裏に解決しました。

オンラインサブモジュラー最適化分野における10年予想に終止符

2015年の理論論文は、データストリームに対して一見明らかなルールを提案しました：新しく到着したアイテムを複製することは、単に元のアイテムを移動するよりも常に価値が低い。専門家は10年を費やしてこれを証明しようとしました。

Geminiは極めて厄介な「三項目組み合わせ反例」を設計し、この長年保持されていた人間の直感が間違っていることを厳密に証明しました。

機械学習の最適化

ノイズを除去するようにAIを訓練するには、通常エンジニアが数学的な「ペナルティ項」を手動で調整する必要があります。

研究者は自動調整する新しい技術を発明しましたが、なぜ有効なのか数学的に説明できませんでした。

Geminiは方程式を分析し、この手法の成功メカニズムを証明しました：実行過程で独自の「適応的ペナルティ」を密かに生成していたのです。

AI時代の経済理論のアップグレード

最近のAI生成Tokenのオークションに関する「明示原理（Revelation Principle）」は、入札が有理数に制限された場合にのみ数学的に成立していました。

範囲を連続実数に拡張すると、元の証明は無効になりました。Geminiは高度な位相幾何学と順序理論を利用してこの定理を拡張し、現実世界の連続的なオークション力学に対応できるようにしました。

宇宙ひも物理学

宇宙ひもからの重力放射を計算するには、「特異点」を含む厄介な積分の解析解を見つける必要があります。

Geminiは「ゲーゲンバウアー多項式」（Gegenbauer polynomials）を利用して新しい解法を見出しました。これは自然に特異点を吸収し、無限級数を閉じた形式の有限和に崩壊させます。

これらの成果は、情報と複雑性理論から暗号学やメカニズム設計に至るまで広がり、AIがどのように研究活動を根本的に変えつつあるかを示しています。

計算機科学分野の流動的で会議志向の出版メカニズムを考慮し、これらの成果は硬直的な分類法ではなく学術的軌跡に従って記述します。

上記の成果の約半分はトップ会議を狙っており、1本はICLR ’26に採択され、残りの大部分は将来的にジャーナルに投稿される予定です。

誤りを特定するにせよ、予想を反駁して分野の方向性を修正するにせよ、これらの成果は高水準の科学的共同研究者としてのAIの価値を浮き彫りにしています。

Geminiが研究を再構築、人間の「増幅器」到来

Googleの以前のブレークスルーを基に、この研究は汎用基盤モデルが、エージェント推論ワークフローと連動することで、強力な科学パートナーになりうることを示しています。

数学者、物理学者、計算機科学者などの専門家の指導のもと、Gemini Deep Thinkパターンは、複雑な数学、論理、推論を中核とする分野でその実用性を証明しつつあります。

私たちは科学ワークフローの根本的なシフトを目撃しています。

Geminiが進化するにつれ、それは人間の知性の「増幅器」となり、知識検索や厳密な検証などの作業を担当し、科学者に概念の深さと革新的な方向性に集中できるようにします。

証明を洗練させるにせよ、反例を見つけるにせよ、一見無関係な分野を結びつけるにせよ、AIは科学進歩の新たな章において欠かせない共同研究者になりつつあります。

参考文献：

https://deepmind.google/blog/accelerating-mathematical-and-scientific-discovery-with-gemini-deep-think/

https://mathstodon.xyz/@tao/116053101218408010

グーグルAIが6本の数学論文を連続発表！Geminiが博士級研究に侵入、SOTAを91.9%で更新

関連記事

分享網址