騰訊開源 Agent Memory，讓 AI 真正記住你

騰訊開源了一個專案，兩個月內就獲得超過 4600 顆星。

這個專案做的事情非常專一：為 AI Agent 裝上長期和短期記憶。

裝上去之後效果如何？

直接看評測數據：針對長期記憶，整體準確率從 47.85% 提升到 76.10%，大幅成長近 60%。

使用者事實回憶從不到 30% 飆升到 79%。

在短期記憶的加持下，長任務中最高能省下 61% 的 token 消耗。

這個專案叫做 TencentDB Agent Memory，由騰訊雲資料庫團隊開發，已於 5 月 14 日正式開源。

來看看它在 OpenClaw 和 Hermes 平台上的實際表現。

若影片無法播放，請改看來源頁。

AI 記憶到底難在哪裡？

現在，每當你點開一個 Agent 的新對話，系統都會預設它對你一無所知。

你必須把相關的背景或資訊重新說一遍，它才能好好做事。

記憶（Memory）的核心目的，就是為了提升我們的工作效率。

TencentDB Agent Memory 的設計思路和主流方案很不一樣。

它的核心概念是「符號化短期記憶 + 分層式長期記憶」。

開源位址：https://github.com/TencentCloud/TencentDB-Agent-Memory

目前主流的解決方案大約有三種，但都有明顯的短板。

第一種，把資料全部塞進上下文視窗。簡單粗暴，但視窗有上限，塞太多 token 會直接爆掉。

第二種，使用向量資料庫來處理記憶。比全塞進上下文好一點，但問題是只儲存卻不精煉，面對大量對話碎片時，召回率低，精確度差。

第三種，讓大型語言模型自己做摘要壓縮。但壓縮過程是不可逆的，可能導致關鍵細節遺失。

騰訊開源專案的核心架構

這個專案最核心的設計，是一套四層漸進式記憶架構。從 L0 到 L3，由底層到頂層，每一層負責的工作都不同。

L0：原始對話。完整保留，一字不漏。作為最終的保底查詢依據，隨時可以回溯查證。

L1：原子事實。自動從對話中提取獨立的事實節點，例如「我愛吃火鍋」、「我後來用 NextJS」，並打上標籤儲存。

L2：場景聚類。將相關的原子事實按場景聚合。例如，將使用者系統討論中涉及的所有事實，包括資料表結構、權限、API 介面等，合成一個場景塊。採用 Markdown 格式，人類可以直接閱讀。

L3：使用者畫像。基於底下三層的資訊，生成穩定的使用者畫像，沉澱出個人的技術偏好、程式碼風格、常用工具鏈等。

這樣既不會因為上下文過長而影響推理，也不會遺失任何關鍵資訊。

而且，系統保證從最頂層到原始證據之間，有一條完整的回溯路徑。當 L3 顯示「使用者偏好 TypeScript」時，這項結論可以追溯到 L2 的某個場景塊，而場景塊中的每一條結論又能追溯到 L1 的原子事實，原子事實最終指向 L0 中你所說過的那句話。整條證據鏈絕不斷裂。

短期記憶壓縮：巧妙運用 Mermaid 圖

四層架構解決了長期記憶問題，但短期上下文也是燒錢的大戶。當 AI 排查一個 bug 需要呼叫十幾次工具時，上下文很快就會被日誌塞滿。

解法是使用「符號化記憶」：將完整日誌卸載到外部檔案，並用 Mermaid 語法畫出一張精簡的任務狀態圖塞進上下文。當需要細節時，再透過節點 ID 進行檢索。

Mermaid 使用極少的 token，將線性摘要列表重組為一張帶有狀態、依賴關係和可定址索引的任務拓撲結構圖。這讓 AI 大型語言模型不是靠「記住什麼標籤」，而是靠「從圖的拓撲中推理出什麼結構」來理解任務全貌。資訊密度更高、結構不丟失、細節可逐層找回。

實測 Token 消耗直接砍半以上，任務完成率反而提升了 23%。既省了錢，活還幹得更好。

在檢索方面，語意檢索（Embedding）擅長模糊比對，關鍵字檢索（BM25）則擅長精準命中。系統會讓這兩條路各自召回候選結果，再透過 RRF（相互排名融合）進行排序。如此一來，語意相關的不會漏掉，精確匹配的也不會丟失。

實測數據表現

說了這麼多設計理念，來看實際跑出來的數據。騰訊使用 PersonaMem 基準測試進行評測，對比對象是原生 OpenClaw 與接入 Agent Memory 之後的 OpenClaw：

指標	原生 OpenClaw	接入 Agent Memory
總準確率	47.85%	76.10%（+59%）
使用者事實召回	29.63%	79.07%（+167%）
偏好追蹤	66.67%	83.45%（+25%）
個人化推薦	46.67%	76.36%（+64%）

使用者事實召回這個指標最驚人，從不到 30% 漲到 79%。這代表以前你跟 AI 說過的十件事，它大概只能記住三件；而現在，可以記住八件。

除了 PersonaMem，這個專案還跑了幾個與程式開發相關的基準測試：

WideSearch 成功率從 33% 提升到 50%，token 用量砍了 61%；
SWE-bench 通過率從 58.4% 提升到 64.2%，token 用量省了 33%。

WideSearchp 主要評估資訊任務中的搜尋、整合與驗證能力，而 SWE-bench 則是用於評估人工智慧模型解決真實世界軟體工程問題能力的評測基準。

加入記憶後，不僅記住了更多事情，連做任務的效率也變高了。省下來的 token 全都用在該做的正事上。

如何使用

這個專案目前以 OpenClaw 的插件形式發布，安裝非常簡單。一行指令就能搞定：

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb

安裝完成後，預設使用本機的 SQLite + sqlite-vec 作為儲存後端，零設定，開箱即用。你不需要另外安裝資料庫，也不用連接外部服務，所有數據都留在你的本機。

如果你想串接外部的 Embedding 服務來增強語意檢索效果，可以在設定檔中進行指定。

如果你使用的是 Hermes Agent 框架，該專案也提供了 Docker 一體化映像檔，將 Hermes + Agent Memory 插件 + Gateway 全部打包在一個容器裡，docker pull 下來就能直接運行。支援的模型也很有彈性。新的 1.0.0-beta.1 版本為希望自行開發 Agent Memory 適配層的使用者，提供了快速入門的方法。

騰訊雲資料庫 AI 能力版圖

TencentDB Agent Memory 不是騰訊雲憑空生出的一個獨立專案。它是 5 月 29 日騰訊雲「資料庫+AI」發布會的一部分。這場發布會的主題叫「AI 原生·重構資料庫新典範」，核心思路是：當 Agent 成為新的生產力單元，資料庫的使命就要從「儲存資料」進化為「支撐智慧體感知、記憶、決策與協作的資料底座」。

沿著 AI 原生資料庫這條路線，騰訊雲這次一口氣推出了好幾樣東西：

DatabaseClaw，騰訊雲第一個資料庫 Agent。 跟普通的 AI DBA 助手不同，它不只是回答問題，而是能真正進入生產環境承擔維運職責，7x24 小時運作。自動巡檢、異常診斷、慢 SQL 歸因，這些 DBA 日常最耗時間的工作它都能處理。而且建構了四層安全防線：權限隔離、AI 行為護欄、架構安全、全鏈路稽核，讓 DBA 敢於將生產資料庫的權限交給它。

TDSQL Boundless，新一代分散式資料庫。 在一套統一的分散式架構上，支援關聯式交易處理、向量語意檢索與全文搜尋等多種資料型態。多種存取模式、多模型資料能在同一個連線，甚至同一個交易中完成，你不用再為不同資料型態維護不同的資料庫了。

TDSQL-C，雲原生資料庫全面升級。 這次 TDSQL-C 重構的第三代儲存架構 AI Native Storage 主打三個字：穩、災、省。實現業務無感的儲存組件發布和壞盤替換，帶來的最終質變是：極致性價比，TCO 較同類產品下降 200%+；IO 零抖動，全鏈路無損變更；資料零丟失，3 AZ 金融級強同步、RPO=0。依託第三代儲存架構，TDSQL-C 還系統化地升級為面向 AI 時代的雙引擎雲原生資料庫，核心採用的是 PG 與 MySQL 雙引擎的雲原生運算節點。可一站式對接騰訊雲 CloudBase 的 BaaS 平台以及 Cursor、FastGPT 等 AI 開發者應用，並透過 MCP、REST 等協定實現統一接入。

把這些產品放在一起看，騰訊雲資料庫正在做的事是：從底層的資料庫引擎，到中間的記憶和維運能力，再到上層的 AI 開發體驗，整套 Agent 時代的數據基礎設施都在用 AI 原生的思路重新建構一遍。

而 Agent Memory 是其中與開發者關係最緊密的一環：它直接解決了「AI 要怎麼記住你」這個所有人都會遇到的問題。

開源位址：https://github.com/TencentCloud/TencentDB-Agent-Memory

點擊下方卡片，追蹤逛逛 GitHub

這個公眾號過去介紹過許多有趣的開源專案，如果你懶得一篇篇文章翻找，可以直接追蹤微信公眾號：逛逛 GitHub，在後台對話聊天就行了。

騰訊開源 Agent Memory，讓 AI 真正記住你

相關文章推薦

分享網址