19 歳、アイビーリーグを中退した中国の若者たち、AI メモリを再構築

聞楽凹非寺より発信

量子位 | 公式アカウント QbitAI

Claude Code のソースコード漏洩の余波は、今なお AI 業界で波紋を広げています！

皮肉なことに、Claude はほぼすべての RAG（検索拡張生成）メモリプロジェクトに貢献してきたというのに、漏洩したコードが示していたのは──

彼ら自身が主流の RAG 技術を全く使っていなかったという事実でした。

これは非常に矛盾しています。Anthropic は公式ドキュメントや技術ブログで、一貫して RAG 検索をサポートしていると明言していたからです。

しかし、彼らが従来の RAG を「見捨てた」とも言えるこの手法は、ある重大な問題を浮き彫りにしています。既存の RAG ソリューションの性能が、基準に達していなかったのです。

2023 年以来、ハイブリッド検索はメモリエンジンの標準ロジックとなりました。ベクトル＋キーワード、加重ランキング……といった定石が絶えず反復されてきました。

しかし、AI メモリのシナリオが複雑になるにつれ、従来の RAG の限界は露呈しました。メモリエンジンと称しながら、実際には検索エンジンのようなことしかできず、類似テキストのマッチングはできても、真の理解や連想的推論には程遠いのです。

では、どうすればよいのか。答えは単純です──

破壊し、再構築せよ。

AI メモリの進化の道筋を振り返ると、その脈絡は極めて明確です。

第 1 世代は、日記を最初から最後まで読むが如く、全コンテキストを強引に詰め込む方式。第 2 世代は、辞書を引くようにベクトル＋キーワードでマッチングする方式ですが、類似した内容は見つかっても、真の関連性は掴めませんでした。

そして今、第 3 世代のメモリモードが登場しました。

自律的な連想、推論、そして異構造間の関連構築を可能にする認知モデルです。

中国チームの独自アーキテクチャがベンチマークを席巻

AI に推論と連想を可能にするためには、クロススケールなメモリの効果的な整理が鍵となります。

端的に言えば、AI が微細な事実と粗いコンテキストの両方を同時に処理でき、かつそれらの間を自由に行き来（関連の切り替え）できるようにすることです。

しかし、これは 2023 年から 2026 年にかけて、メモリエンジン業界全体が突破を諦めかけていた中核的なボトルネックでした。

ところが最近、平均年齢 19 歳という中国の若手チーム「FlowElement（心流元素）」が、実行可能な解決策を提示しました。

それがM-FLOWです。独自開発したグラフ・ルーティングによる Bundle Search アーキテクチャにより、ベンチマークで驚異的な優位性を示しました。

Mem0、Graphiti、Cognee といった主流手法と比較し、M-FLOW はマルチターン対話、長期記憶、マルチホップ推論の 3 大中核シナリオにおいて、顕著な性能差を見せつけました。

Mem0 公式ベンチマーク（LoCoMo）との比較で、Mem0 を 36% 上回る性能。
Graphiti 公式ベンチマーク（LongMemEval）との比較で、Graphiti を 16% 上回る性能。
長期イベント変遷テスト（EvolvingEvents）において、Cognee を 7%、Graphiti を 20% 上回る性能。

△ テストは選別を一切行わず、業界共通のベンチマークを採用

詳細な評価により、書き込み、検索、前処理、知識整理など 29 項目の能力次元において、M-FLOW がそのほぼ全てを完全にサポートしていることが明確になりました（下図はスクロールして全容を確認可能）。

特に、メモリ品質を決定づけるグラフ強化検索、照応解決、マルチスケール・インデックスなどのコア機能において卓越した性能を発揮しました。

この成果の裏側には、M-FLOW アーキテクチャがもたらすシステム的な優位性が見て取れます。

検索工程で LLM に依存せず、ミリ秒単位の応答を実現。
膨大な記憶量を持つシナリオ下でも、通常ベンチマークと遜色ない安定したパフォーマンスを維持。
業界初となる照応解決（参照表現解決）対応のメモリエンジンにより、AI の情報理解が人間の思考により近いものへ（※照応解決とは、文中の「彼」や「それ」が何を指すかを区別する能力）。

しかも、使用のハードルはほぼ皆無です。デプロイ手順も極めてシンプルで、Docker 環境さえあれば、わずか 1 行のコードで統合が完了します。

もっとも、導入が簡単だからといって、その中身がどうなっているのか気になりますよね。

M-FLOW は、いかにしてこれを成し遂げたのか？

答えは、冒頭でも述べたあの言葉に尽きます。「破壊し、再構築せよ」。

現在の業界に氾濫する同質化したメモリソリューションとは異なり、M-FLOW は LLM で検索を補助してベンチマークの点数を水増ししたり、単に機能を積み上げたりする類のモノではありません。

正確に言えば、AI メモリの組織化と活用体系そのものを根本から再構築したのです。

記憶に関連と推論を

事実、すべての RAG システムが直面する課題があります。ユーザーのクエリに対し、保存された関連知識をいかに正確に特定するか、という問題です。

主流のロジックは至って直接的で、ドキュメントをチャンク（断片）化してベクトル化し、ベクトルデータベースに格納。検索時にはコサイン類似度でランキングします。

この方式は本質的に「どのテキストがクエリと意味的に最も近いか」という 1 段階目の問いにしか答えておらず、単純な事実検索には効果的ですが、複雑なシナリオでは完全に機能不全に陥ります。その理由は以下の通りです。

答えがドキュメントをまたいで分散している：チャンク間に構造的なつながりがなく、異なるドキュメントに散らばる関連情報を統合できない。
クエリと保存の粒度が一致しない：巨視的な問いに微細な断片がヒットしたり、微視的な問いに抽象的な要約がマッチしたりする。
同一エンティティでも文脈が異なれば分断される：同じ実体について議論していても文脈が異なる 2 つのドキュメントは、ベクトル空間上で距離が遠くなり、関連付けられない。

その根本原因は、平坦なベクトル検索が、知識が本来持つ内部構造を捨て去っている点にあります。

テキストとクエリの類似度は判定できても、そのテキストが知識体系全体の中でどのトポロジカルな位置にあるのかは、全く把握できていないのです。

この点において M-FLOW は、伝統的な平坦検索に代わる「グラフ・ルーティング検索」を採用しました。その中核ロジックは階層化された知識トポロジーにあり、次のような洞察に基づいています。

単に「マッチするテキスト」を見つけるだけでなく、そのマッチ点が属する完全な知識構造を特定し、構造全体を評価すること。

逆円錐構造の設計

M-FLOW は、取り込んだすべての知識を 4 層の有向グラフとして整理し、逆円錐（inverted cone）を形成します。

この構造の方向性は直感に反しています。伝統的な知識グラフや分類ツリーでは、下に行けば行くほど具体的になります。

しかし M-FLOW では、検索の「入り口は円錐の頂点」にあり（微細な Entity や FacetPoint はベクトル検索で正確にヒットしやすい）、検索の「目標は円錐の底」にあります（Episode が最終的にユーザーに返される知識単位となります）。

情報の流れは、鋭いマッチポイントから下へ、広範な意味の着地点へと収束していくのです。

これは「上から下へ閲覧する」という伝統的な検索パラダイムを打ち破るものです。

ユーザーが階層を順に絞り込んでいくのではなく、システムが最も鋭い点で信号をキャプチャし、グラフ構造を伝わって下へ、それが属する完全なセマンティックユニットへと伝播させます。

これは微細から粗大へのプロセスです。最も鋭い点で信号を正確に捉え、その後グラフ構造を伝わって、それが属する完全なセマンティックユニットへと伝播します。

グラフ・ルーティング Bundle Search の仕組み

クエリが到着した際、システムは単に最も近いノードを見つけるだけではありません。

各エピソード（Episode）に到達しうるグラフ上の全経路を評価し、最適なエピソードを導き出すのです。

第 1 段階：円錐の頂点で広く網を張る

クエリはベクトル化され、7 つのベクトルセットで同時に検索されます。円錐の頂点から底まで、全レイヤーをカバーします。各セットは最大 100 個の候補を返します。

最も正確にヒットしやすいのは、円錐の頂点にあるノード、つまりエンティティ名やファセットポイント（FacetPoint）の主張です。

これらの微細なアンカーポイントは、セマンティクスが極めて焦点化されており、ベクトル距離が短くなります。

円錐の底にあるエピソードの要約もヒットする可能性はありますが、セマンティクスが広範であるため、マッチ精度は頂点に劣ります。

第 2 段階：グラフへの投影

これらのアンカーポイントは、知識グラフへのエントリーポイントとして利用されます。

システムはその周辺のサブグラフ（エッジ、近傍、接続関係）を抽出し、1 ホップ分だけ近傍を拡張します。

これにより、孤立していたベクトルのヒットポイント群が、連結されたトポロジカル構造へと変換されます。

第 3 段階：頂点から底へコストを伝播させる

ここが中核ステップであり、グラフ・ルーティング Bundle Search の本質です。

頂点で信号をキャプチャし、グラフのエッジを伝わって底へ伝播させ、エピソード地点でスコアを収束させる。

サブグラフ内の各エピソードについて、システムはアンカーポイントからそこへ至る全経路を評価します。

各経路のコストは、以下の 3 要素で構成されます。

開始コスト：アンカーポイントのベクトル距離（信号の鋭さ）。
エッジコスト：経路途中の各エッジのベクトル距離（接続関係とクエリの関連性）に、ジャンルペナルティを加算したもの。
見逃しペナルティ：エッジがベクトル検索でヒットしなかった場合のデフォルト高コスト。

エピソードの最終スコアは、全経路中の最小コストとなります。

常識を覆す 3 つの設計

1. エッジもセマンティクスを持ち、能動的なフィルターとなる

伝統的な知識グラフでは、エッジ（ノード間の線）は「works_at（勤務先）」「located_in（所在地）」といったタイプラベルに過ぎず、セマンティック検索には関与しません。

グラフを検索する際、エッジを巡回するか無視するしかありません。エッジ自体に検索可能なセマンティクスが含まれていないからです。

一方 M-FLOW では、すべてのエッジに自然言語による説明テキストが付随しており、これもベクトル化され検索対象となります。

つまりエッジは受動的な接続役ではなく、能動的なセマンティック・フィルターとして機能するのです。

コスト伝播フェーズにおいて、システムは 2 ノード間に接続があることだけでなく、その接続関係自体が現在のクエリとどれだけ関連しているかも把握します。

これにより、両端のノードが検索にヒットしていても、エッジ自体のセマンティクスがクエリと無関係であれば高コストと判定され、その不合理な関連経路は即座に遮断されます。

2. 平均コストではなく、経路の最小コストを採用

なぜ最小値なのか。チームが考慮したのは、ある検索の哲学です。「強力な証拠が 1 つあれば、関連性は証明される」という考え方です。

あるエピソードが 10 のファセットに関連していても、そのうち 9 つがクエリと無関係な場合があります。

従来の方式では全経路のコストを平均化するため、無関係な経路がスコアを押し上げてしまいます。

一方 M-FLOW は、最も優れた 1 つの経路のみを注視します。

1 つのファセットでも低コスト経路でクエリに接続されていれば、そのエピソードは検索対象となるべきです。

これは人間の記憶の働きにも合致します。何かを思い出す時、すべての手がかりがそれを指し示しているからではなく、ある 1 つの強力な手がかりがあるから思い出せるのです。

3. 直接ヒットをペナルティ化し、正確なアンカー経路を好む

これが最も直感に反する設計です。クエリがエピソードの要約と直接マッチした場合、システムはその経路に追加のペナルティを課します。

直接ヒットをペナルティ化する理由は、それらが多くのクエリに関連しているように「見えてしまう」からです。

例えばプロジェクト管理に関するエピソードの要約は、「プロジェクト」や「管理」という言葉を含むあらゆるクエリと、そこそこのベクトル距離を示してしまいます。

しかしこのマッチングは広範で焦点を欠いており、これこそが多くの RAG システムにおける検索ノイズの根本原因なのです。

M-FLOW システムは、円錐の頂点（ファセットポイントやエンティティ）を出発点とする正確な経路を優先するよう設計されています。

たとえ数ホップ遠回りになってもそれを優先し、直接のエピソードヒットは、より良い代替経路がない場合にのみ採用されます。

これにより、検索結果の精度が保証されます。何にでも少し関連する曖昧な要約ではなく、具体的な証拠チェーンに裏打ちされたエピソードが返されるのです。

トポロジーによる証明

なぜこのメカニズムが有効なのか。その根本的な利点は、グラフ・トポロジーが、ベクトル単独では捉えきれない知識の組織構造をエンコードしている点にあります。

多粒度でアンカーポイントが見つかります。「データベース移行で何があったか？」のような巨視的な問いの場合、システムはエピソードの要約に直接マッチします。

直接ヒットのペナルティはありますが、より正確な頂点側（ファインな側）の経路が存在しないため、この結果が採用されます。

一方、「P99 目標は 500ms 未満か？」のような正確な問いであれば、ファセットポイントに強くマッチし、頂点から 2 ホップでエピソードに到達します。開始時の距離が極めて小さいため、全体のコストは非常に低くなります。

システムが人為的に粒度を選ぶ必要はなく、逆円錐のトポロジーが、最も適切なレイヤーで自動的にアンカーポイントを見つけ出すのです。

ドキュメントを横断するエンティティの架け橋機能。「張博士は MIT に所属」という情報がドキュメント A にあり、「MIT が量子計算のブレークスルーを発表」という情報がドキュメント B にある場合、両エピソードは「MIT」という同一エンティティノードを共有します。

ユーザーが MIT を検索すると、頂点でそのエンティティがヒットし、コストが同時に 2 つのエピソードへ伝播します。これにより、LLM による追加の推論を必要とせず、グラフ構造自体が 2 つの独立したドキュメントからの関連結果を橋渡しするのです。

構造的ノイズのフィルタリング。伝統的な平坦検索では、セマンティクスは似ているがトピックは無関係なテキスト断片が上位に表示されがちです。

一方 Bundle Search では、あらゆる断片がエッジをたどって特定のエピソードに遡る必要があります。

途中のエッジがクエリのセマンティクスと無関係であれば、経路コストは急上昇し、無関係な結果は自然と沈みます。

グラフ構造それ自体が、強力なセマンティック・ノイズフィルターとして機能するのです。

コスト伝播＝推論です。グラフ上のあらゆる経路は、本質的に 1 つの推論チェーンです。

「この事実にクエリがマッチ→この事象はこのディメンションに属す→このディメンションはこのイベントに属す」。

経路コストはこの推論チェーンの緊密さを数値化したもので、システムは 2〜3 ホップ内で軽量なマルチホップ推論を完了します。検索段階で LLM を呼び出す必要はありません。

適応型信頼度

すべてのベクトルセットが、すべてのクエリに対して等しく信頼できるわけではありません。

システムは各セットについて 2 つの指標（絶対的マッチ強度と識別度）を計算し、セットを「ノード系」と「エッジ系」に分類。信頼度に基づいて動的に重み付けを行います。

例えば、あるクエリでエンティティセットの信頼度がファセットセットより明らかに高ければ、システムは自動的にエンティティ経路の影響力を高めます。

固定の重みではなく、今回の検索においてどの粒度のヒットがより信頼できるかに基づき、検索戦略をリアルタイムで調整するのです。

追加の調整メカニズム

もう 1 つの調整メカニズムとして、あるファセットとクエリのベクトル距離が極めて小さく、高度に一致している場合、システムはその経路上のエッジコストとジャンプコストを大幅に引き下げます。

論理は直感的です。あるファセットがすでにクエリとほぼ完全にマッチしているなら、そこからエピソードへの接続は信頼できると判断でき、あえてエッジの意味内容を何度も検証する必要はありません。

これらに加え、システムにはクエリ前処理、並列マルチモードスケジューリング、結果のトリミングなどのメカニズムも含まれています。

つまり総括すると、M-FLOW の検索は「ベクトル検索＋グラフ DB」の単なる積み上げではなく、グラフそれ自体が検索メカニズムとなっているのです。

中国のメモリエンジン、後発ながら世界を制すか？

国内では、外部メモリへの関心は海外ほど高くありません。しかし M-FLOW チームは同質的な機能の積み上げを避け、この分野における国産の「無」から「有」を生み出し、性能で世界をリードし、かつオープンソースを貫いています。

実は、メモリエンジンに初めて触れる人の多くが抱く素朴な疑問があります。「人間の記憶とは関連情報を探すことではないか。なぜ AI の記憶は、いつもテキストとして類似した情報を探そうとするのか？」と。

この最も普遍的な疑問こそが、AI メモリソリューションの中核的な症結なのです。

第 1 世代の全コンテキスト強引詰め込み型から、第 2 世代のベクトル＋キーワードによる検索型まで、AI は常にテキストの形態的マッチングに留まっており、真の理解や連想には遠く及んでいませんでした。

しかし M-FLOW は、グラフ構造で AI メモリの根底にあるロジックを再構築しました。メモリグラフの粒度と関連性の問題を解決し、AI メモリを「形態の類似マッチ」から「連想と推論」へと飛躍させたのです。

特筆すべきは、このプロジェクトが平均年齢 19 歳という、アイビーリーグを中退した若者たちのチームによって独立して開発された点です。

AI 業界において、天才少年たちの物語は常に注目の的。この技術的ブレークスルーの先にある未来で、彼らがどこまで歩んでいけるのか。私たちもまた、それを知りたいのです。

プロジェクトアドレス：https://github.com/FlowElement-ai/m_flow

プロダクトウェブサイト：https://m-flow.ai

企業アドレス：https://flowelement.ai

この記事が気に入ったら「いいね」「シェア」「フォロー」をお願いします！

コメント欄であなたのアイデアをお聞かせください！

— 以上 —

🌟 スターを付けて最新情報をチェック 🌟

テクノロジー最前線の進展を毎日お届けします