Tencent、AIに長期記憶と短期記憶を与える「Agent Memory」をオープンソース化

Tencentが、わずか2ヶ月で4600以上のスターを獲得したプロジェクトをオープンソース化しました。

その目的は非常に明確です。それは、AIエージェントに長期記憶と短期記憶を実装することです。

この記憶機能を実装すると、具体的にどのような効果があるのでしょうか？

評価データがその成果を明確に示しています。長期記憶に関しては、全体の精度が47.85%から76.10%に向上し、約60%もの改善が見られました。

特に、ユーザーに関する事実の再現率は30%未満から79%へと劇的に向上しました。

短期記憶のサポートにより、長時間のタスクでは最大61%ものトークン消費を削減することに成功しました。

このプロジェクトは「TencentDB Agent Memory」と呼ばれ、Tencent Cloudのデータベースチームによって開発され、5月14日に正式にオープンソース化されました。

それでは、OpenClawとHermesフレームワークにおける実際の効果を見てみましょう。

若影片無法播放，請改看來源頁。

AI記憶の何が難しいのか？

現在、AIエージェントとの新しいセッションを開始すると、基本的にエージェントは過去の情報を何も知らない状態から始まります。適切に動作させるためには、関連するコンテキストや情報を毎回伝える必要があります。

このMemory機能の目的は、まさに私たちの効率を大幅に向上させることです。

TencentDB Agent Memoryのアプローチは、主流のソリューションとは一線を画しています。その核となるアイデアは、シンボル化された短期記憶と、階層化された長期記憶です。

現在主流となっている解決策は主に三つありますが、いずれも明確な欠点があります。

第一に、すべてをコンテキストウィンドウに詰め込む方法。これは単純明快ですが、ウィンドウサイズには上限があり、詰め込みすぎるとトークンがすぐに上限に達してしまいます。

第二に、ベクトルデータベースを記憶媒体として使う方法。すべてをコンテキストに入れるよりは優れていますが、情報を保存するだけで整理・要約しないため、会話の断片が多いと再現率が低く、精度に欠けるという問題があります。

第三に、大規模言語モデル（LLM）自身に要約・圧縮させる方法。しかし、圧縮は不可逆的なプロセスであるため、重要な詳細情報が失われるリスクがあります。

Tencentオープンソースプロジェクトのコアアーキテクチャ

このプロジェクトの最も中心的な設計は、四層の漸進的記憶アーキテクチャです。L0からL3まで、ボトムアップで各層の役割が明確に異なります。

TencentDB Agent Memory L0 to L3 semantic pyramid

L0：生の対話データ。会話の全内容を、一言一句漏らさず完全な形で保存します。いわば最終的なバックアップデータであり、いつでも遡って確認できます。

L1：アトミックファクト（原子的事実）。会話から「私は火鍋が大好きだ」「バックエンドにはNextJSを使っている」といった独立した事実ノードを自動的に抽出し、タグを付けて保存します。

L2：シナリオクラスタリング。関連するアトミックファクトをシナリオごとに集約します。例えば、あるユーザーシステムに関する議論で出たすべての事実（テーブル構造、権限、APIなど）を一つのシナリオブロックにまとめ、人間が直接読めるMarkdown形式で保存します。

L3：ユーザープロファイル。下位三層に基づいて、安定したユーザープロファイルを生成します。技術的な好み、コーディングスタイル、よく使うツールチェーンといった情報を蓄積します。

Retrievable and Recoverable Drill-Down Chain

このアーキテクチャにより、コンテキストが長すぎて推論に悪影響を及ぼすこともなく、かといって重要な情報が失われることもありません。

さらに、このシステムは最上位層から元の証拠データまでの完全な追跡パスを保証します。L3で「ユーザーはTypeScriptを好む」と結論づけられた場合、その結論はL2のあるシナリオブロックに遡ることができ、シナリオブロック内の各結論はL1のアトミックファクトに、そしてアトミックファクトは最終的にL0のあなたが発した元の言葉に行き着きます。証拠の連鎖が断絶することはありません。

短期記憶の圧縮：Mermaid図の巧みな活用

四層アーキテクチャは長期記憶の問題を解決しますが、短期的なコンテキストも依然としてコストのかかる要素です。AIが一つのバグを調査するために十数回もツールを呼び出すと、コンテキストはログで埋め尽くされてしまいます。

この解決策がシンボル化記憶です。完全なログを外部ファイルに退避させ、代わりにMermaid記法を用いてコンパクトなタスク状態図を描き、それをコンテキストに挿入します。詳細が必要な場合は、ノードIDを通じて必要な情報を検索します。

Mermaidは、ごくわずかなトークンで、線形な要約リストを、状態、依存関係、そしてアドレス可能なインデックスを持つタスクトポロジー構造図へと再構成します。これにより、AIモデルは「何のタグを覚えているか」ではなく、「グラフのトポロジーからどのような構造を推論できるか」に基づいて、タスクの全体像を把握できるようになります。情報密度が高く、構造が失われず、詳細は段階的に取り出すことができます。

実際のテストでは、トークン消費量が50%以上も削減され、タスク完了率は逆に23%も向上しました。コストを削減しながら、より良い成果を上げているのです。

また、検索においては、セマンティック検索（Embedding）はあいまい検索を得意とし、キーワード検索（BM25）は正確な一致を得意とします。両方の経路から候補結果をそれぞれ再現し、RRF（Reciprocal Rank Fusion）を用いて統合・ソートすることで、セマンティック的に関連するものも、正確に一致するものも、どちらも取りこぼしません。

実証データ

設計に関する説明はここまでにして、実際の性能データを見てみましょう。Tencentは、PersonaMemベンチマークを使用して評価を行いました。以下は、ネイティブのOpenClawと、Agent Memoryを統合したOpenClawとの比較です。

指標	ネイティブ OpenClaw	Agent Memory 統合後
全体精度	47.85%	76.10%（+59%）
ユーザー事実の再現率	29.63%	79.07%（+167%）
嗜好の追跡	66.67%	83.45%（+25%）
パーソナライズ推薦	46.67%	76.36%（+64%）

「ユーザー事実の再現率」という指標の伸びは特に顕著で、30%未満から79%へと大幅に上昇しました。これは、以前はあなたがAIに話した10の事柄のうち3つしか覚えていなかったのが、今では8つも思い出せるようになったということを意味します。

PersonaMemに加えて、プロジェクトはいくつかのプログラミング関連のベンチマークでもテストされました。WideSearchタスクでは成功率が33%から50%に向上し、トークン消費は61%削減。SWE-benchでは、合格率が58.4%から64.2%に向上し、トークン消費を33%削減しました。

（注：WideSearchは情報タスクにおける検索、統合、検証能力を評価し、SWE-benchはAIモデルが現実世界のソフトウェア工学問題を解決する能力を評価するベンチマークです。）

記憶機能を追加することで、より多くのことを覚えられるようになっただけでなく、タスク処理の効率も向上し、節約できたトークンはすべて本来の作業に充てられています。

使い方

このプロジェクトは現在、OpenClawのプラグインとして公開されており、インストールは非常に簡単です。

以下の一行のコマンドを実行するだけです。

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb

インストール後、デフォルトではローカルのSQLiteとsqlite-vecをストレージバックエンドとして使用し、特別な設定なしですぐに使い始めることができます。データベースを別途インストールする必要も、外部サービスに接続する必要もなく、データはすべてローカルに保存されます。

外部のEmbeddingサービスを接続してセマンティック検索の効果を高めたい場合は、設定ファイルで指定できます。

Hermes Agentフレームワークを使用している場合、プロジェクトはDockerの統合イメージも提供しています。Hermes、Agent Memoryプラグイン、Gatewayを一つのコンテナにまとめてパッケージ化しており、`docker pull` するだけで起動できます。

対応するモデルも非常に柔軟です。新しくリリースされたv1.0.0-beta.1では、独自にAgent Memoryのアダプテーション層を開発したいユーザー向けに、迅速に開始するための方法が提供されています。

Tencent CloudデータベースのAI能力構想

TencentDB Agent Memoryは、Tencent Cloudが突如として生み出した独立したプロジェクトではありません。これは、5月29日に開催されたTencent Cloudの「データベース＋AI」発表会の一部です。

この発表会のテーマは「AIネイティブ・データベースの新たなパラダイムを再構築する」でした。その核となる考え方は、AIエージェントが新たな生産性の単位となる時代において、データベースの使命は「データを保存する」ことから、「知的エージェントの認識、記憶、意思決定、協調を支えるデータ基盤」へと進化する必要がある、というものです。

この「AIネイティブデータベース」という構想に沿って、Tencent Cloudは今回、複数のプロダクトを一挙に発表しました。

DatabaseClaw：Tencent Cloud初のデータベースAIエージェント。 一般的なAI DBAアシスタントとは異なり、単に質問に答えるだけでなく、実際に本番環境に入り込み、24時間365日体制で運用保守の責務を担うことができます。自動巡回点検、異常診断、スロークエリの原因分析など、DBAの日常業務で最も時間を取られる作業を代行できます。さらに、権限の分離、AIの行動ガードレール、アーキテクチャの安全性、全链路の監査証跡という四層の防御ラインを構築し、DBAが安心して本番データベースへの権限を委任できるようにしています。

TDSQL Boundless：新世代の分散データベース。 統一された分散アーキテクチャ上で、リレーショナルなトランザクション処理、ベクトル意味検索、全文検索など、複数のデータタイプとアクセスパターンをサポートします。異なるデータモデルへの操作を単一の接続、さらには同一のトランザクション内で完結できるため、データタイプごとに異なるデータベースを維持する必要がなくなります。

TDSQL-C：クラウドネイティブデータベースの全面アップグレード。 今回、TDSQL-Cで再構築された第三世代ストレージアーキテクチャ「AI Native Storage」は、「安定性」「耐障害性」「コスト削減」の三つを主軸としています。ビジネスに影響を与えないストレージコンポーネントのアップデートや不良ディスクの交換により、最終的には、同類のプロダクトと比較してTCO（総所有コスト）を200%以上削減する圧倒的なコストパフォーマンス、IOの揺らぎがゼロで全経路の変更が完全に無停止、RPO=0を達成する3つのアベイラビリティーゾーン（AZ）にまたがる金融グレードの強同期とデータ損失ゼロ、という質的な変化をもたらします。この第三世代ストレージアーキテクチャを基盤として、TDSQL-CはAI時代に向けたデュアルエンジンのクラウドネイティブデータベースへと体系的なアップグレードが行われています。カーネルはPGとMySQLという二つのエンジンのクラウドネイティブコンピュートノードを採用。Tencent CloudのCloudBaseが提供するBaaSプラットフォームや、Cursor、FastGPTといったAI開発者向けアプリケーションとMCPやRESTなどのプロトコルを通じてシームレスに接続し、統一的なアクセスを実現します。

これらのプロダクトを俯瞰すると、Tencent Cloudデータベースが取り組んでいることの全体像が見えてきます。それは、最下層のデータベースエンジンから、中間層の記憶や運用保守の能力、そして最上層のAI開発体験に至るまで、エージェント時代のデータインフラストラクチャ全体をAIネイティブの思想で再構築するということです。

そして、Agent Memoryはその中でも開発者に最も身近なピースです。「AIにいかにしてユーザーを記憶させるか」という、誰もが直面する普遍的な課題を直接解決します。

プロジェクトのオープンソースアドレス：https://github.com/TencentCloud/TencentDB-Agent-Memory