MemGPT、RAG、Reflexion、Voyager――現在、主要なエージェントフレームワークのほぼ全てが、「検索」をデフォルトの記憶メカニズムとして採用している。Reflexionエージェントが何千もの自己反省を蓄積すると、まるで「成長」しているように聞こえる。しかし、新しいセッションが始まるたびに、基盤モデルの重みは微動だにしない。ファイルキャビネットは大きくなる一方で、能力そのものは何も向上していないのだ。
香港中文大学と浙江大学によるこの論文は、この現象を「カテゴリー錯誤」と断じている。つまり、メモ帳を脳と取り違えているのだ。論文は、認知科学、形式化された証明、安全性という三つの次元から、ある核心的な主張を論証する。すなわち、現在デプロイされている全てのエージェントメモリは、事例ベースの検索であり、重みに基づく真の記憶ではない。そして、この混同が、証明可能な能力の上限、永続的な「凍結された初心者」のジレンマ、そして絶えず悪化するセキュリティリスクをもたらしている。
メモ帳と脳:構造的に異なる二つの道
論文は、簡潔な分析フレームワークを提示する。LLMエージェントの出力を変更する全ての技術は、本質的に二つの道しかない。
(1) θ(シータ)を変える:事前学習、ファインチューニング、強化学習などの勾配更新を通じてモデルの重みを修正し、事前分布 P(X|θ) を変化させる。知識は重み空間に圧縮され、モデルはルールを再構成して、見たことのない入力に対処できる。これは「生成的」なアプローチだ。
(2) Cを変える:プロンプト、RAG、MCPツール呼び出し、スクラッチパッドなどを通じてコンテキストウィンドウに内容を注入し、生成条件を P(X|θ, C) とする。知識はテキストとして圧縮され、その容量はコンテキスト長 L によって制限される。モデルはコンテキスト内に明示的に存在する内容しか利用できない。これは「検索的」なアプローチだ。
現在デプロイされている全てのエージェントメモリは、Cエンジニアリングである。 MemGPT、RAG、Reflexion、Voyager、全て例外なくそうだ。エージェントが経験を積む前後で、モデルの重みは完全に同一である。
[表1: LLMエージェントのメモリ分類] 論文はメモリを4つに分類する。ワーキングメモリ(コンテキストウィンドウ、現在のセッションのみ)、エピソディックメモリ(外部ストレージ、セッションを跨ぐ、事例に基づく汎化)、セマンティックメモリ(モデルの重み、永続的、ルールに基づく汎化)、経験的メモリ(モデルの重み、永続的、ファインチューニング/継続学習によって更新)。現在の全てのエージェントシステムはエピソディックメモリの行にしか存在せず、経験的メモリの行は、デプロイされたシステムにおいて系統的に欠落している。
論文は的確なアナロジーを用いている。ある人が教訓を日記に書き留めているとする。その教訓を思い出せるのは、日記を開き、かつ状況が十分に似ている時だけだ。一方、教訓を真に内面化した人は、いつでもどこでもそれを呼び起こせる。現在のエージェントメモリは、まさに前者なのである。
証明可能な汎化の天井:検索は重み学習に永遠に追いつけない
論文の理論的な核心的貢献は、「組み合わせサンプル複雑性の分離定理」である。ある領域に k 個の基本概念があり、組み合わせ演算子 ⊕ が概念のペアを正しい出力に対応付けるとする。論文は以下を証明する。
検索システムが組み合わせ的な新タスクで 1−δ の正解率を達成するには、保存すべき組み合わせ事例の数 nR = Ω(k²) が必要となる。これは本質的に、全ての概念ペアを網羅的にカバーしなければならないことを意味する。一方、パラメータ化されたシステム(ファインチューニング後の重み)は、わずか nP = O(d/δ) 個の事例しか必要としない。ここで d は組み合わせ演算子のVC次元である。両者のサンプル複雑性の比率は Ω(k²/d) となる。d=O(k) の時、比率は Ω(k) となり、d=O(1) の時には、比率は Ω(k²) にも達する。
この定理の重要な仮定は、凍結されたモデルが K 個のコンテキスト例を与えられた後でも、未見の組み合わせペアに対する正解率 α̅ が 1 未満である、という点だ。論文は付録において、ファノの不等式を用いて、演算子クラスの複雑性が log|H| > K·log|Y| を満たす限り、この仮定自体が経験的なものではなく、一つの定理であることを証明している。
コンテキストウィンドウを大きくしても、この差を解消することはできない。 より長いコンテキストは α̅ をわずかに向上させるに過ぎず、Ω(k²) という網羅的なカバレッジの必要性は常に存在し続ける。Paulsen [2026] の実験が示すように、モデルが 128kトークン のコンテキストをサポートしていても、その有効利用率は約 2万トークン で飽和してしまう。
経験的証拠も理論予測と一致している。Ovadia et al. [2024] は、RAGが稀なエンティティの再現には優れているものの、基盤モデルの能力を超える組み合わせ推論は向上させられないことを発見した。Yao et al. [2026] は、反省経験を外部に保存した場合と重みにエンコードした場合の効果を直接比較し、パラメータ化された保存が外部保存をあらゆる面で上回り、その差は未見の問題タイプへの転移が必要な時に正確に拡大することを示した。これは定理の予測と完全に合致する。
凍結された初心者と悪化するセキュリティホール
汎化の天井が静的な限界である一方、「凍結された初心者問題」が示すのは動的な帰結である。すなわち、全てのセッションが同一の凍結された重みから開始され、エージェントは永遠に .predict(C) を実行し続け、.train() を決して実行しない。認知科学における最も確固たる知見の一つは、エキスパートと初心者の違いは、どれだけ多くの事例を蓄積しているかではなく、知識表現の構造的再編成にあるということだ。物理学の初心者は問題を表面的な特徴で分類するが(「斜面の問題」)、エキスパートは深層の原理で分類する(「エネルギー保存の問題」)。純粋な検索型エージェントは、この再編成を決して成し遂げられない。
安全性の側面における問題も同様に深刻だ。永続的なメモリがない場合、プロンプトインジェクションは現在のセッションにしか影響しない。エージェントメモリがある場合、注入された内容はストレージに書き込まれ、それ以降の全てのセッションで検索される。つまり、一度限りの攻撃が永続的な侵害に変わるのだ。MINJA攻撃は 98.2% という注入成功率を達成し、注入された命令はセッションを跨いで持続的に効果を発揮しつつ、通常の機能への影響は極めて小さい。PoisonedRAGは、数百万のエントリを含む知識ベースに対し、標的となるクエリごとにわずか 5件 の敵対的テキストを仕込むだけで、90% の攻撃成功率に達することを示した。インタラクション回数 N(t) が増加するにつれて、侵害される確率 P(時刻tまでに侵害される) = 1−(1−p₀)^N(t) は 1 に収束していく。
出口:記憶を「定着」させる経路の構築
論文が処方箋として示すのは、検索を放棄することではなく、欠けているもう半分を補うことだ。生物学的知能における解決策は、CLS(補完学習システム)理論である。すなわち、海馬が迅速なエピソード記憶を担い、大脳新皮質が睡眠中にそれを、緩やかで分散的かつルールに基づいた表象へと定着させる。現在のAIエージェントは、海馬の半分しか実装していないのだ。
論文は三つのコミュニティに対し、明確な要求を突きつけている。システム構築者へ:エピソードストレージからモデルの重みへの「定着経路」を構築しなければならない。具体的なメカニズムは、定期的なファインチューニング、知識編集、テスト時学習、あるいは実行トレースからの自己蒸留などが考えられる。鍵となるのは、この経路が存在し、非同期で動作することだ。必要な構成要素――LoRA、SSR、MEMIT、TTTレイヤー――は既に存在している。これは実現可能性の問題ではなく、設計上の選択の問題である。ベンチマーク設計者へ:CGT(時間的組み合わせ汎化)、つまりエージェントが新しい概念の組み合わせを処理する能力が経験とともに向上するかどうかを測定すべきである。純粋な検索型エージェントは、この指標において横ばいになるはずだ。継続学習コミュニティへ:エージェントのシナリオは、継続学習の手法が必要とする全てのものをまさに提供している。すなわち、報酬ラベル付きの自然な経験の流れ、明確な汎化基準、そして即時の実用的価値である。
エージェントはより良い記憶を手に入れたのではない。より良いアーカイブシステムを手に入れたに過ぎないのだ。より良いアーカイブがエキスパートを生み出すことはない。重みの定着こそが、それを可能にする。
📄 原著論文タイトル
Contextual Agentic Memory is a Memo, Not True Memory
🔗 原著論文リンク