實作 RAG 這一年,最後悔的就是盲目導入知識圖譜

嗨,我是 PaperAGI,主要關注 LLM、RAG、Agent 等 AI 前沿技術,每天分享業界最新成果和實戰案例。

基於知識圖譜(Knowledge Graph, KG)的檢索增強生成(RAG)在問答任務中面臨一個核心難題:三元組索引會丟失上下文語意。當文字被壓縮為(頭實體 - 關係 - 尾實體)三元組時,很多隱含的背景資訊被剝離,導致多跳推理(Multi-hop QA)效能大打折扣。多跳問答需要從多個實體、事實或關係中組合答案,對上下文理解要求極高,傳統方法的語意丟失問題在此類任務中尤為突出。

MDER-DR 雙階段框架

作者提出了一個領域無關的 KG-QA 框架,覆蓋索引和檢索推理兩個階段,由兩個核心組件協同工作:

MDER-DR 框架架構圖

MDER:智慧索引策略

傳統方法直接儲存原始三元組,而 MDER 採用四步策略生成上下文感知的實體摘要

MDER 四步策略流程圖
  • Map(映射):識別文字中的實體和關係
  • Disambiguate(消歧):解決實體指代歧義
  • Enrich(豐富):基於上下文生成三元組的自然語言描述
  • Reduce(簡化):融合實體級摘要,保留關鍵語意

關鍵優勢:避免了在檢索階段顯式遍歷圖邊,大幅提升檢索效率。

DR:迭代檢索機制

針對使用者查詢,DR 採用分解 - 解析的迭代推理策略:

DR 迭代檢索機制示意圖
  • 分解:將複雜查詢拆解為多個可解析的三元組子問題
  • 解析:在知識圖譜中錨定這些三元組,透過迭代推理逐步縮小答案範圍
  • LLM 驅動:整個流程由大語言模型驅動,具備處理稀疏、不完整和複雜關係數據的強健性

實驗結果與亮點

在標準基準測試和領域特定數據集上,MDER-DR 相比傳統 RAG 基線取得最高 66% 的效能提升,同時保持跨語言強健性。這表明該方法不僅適用於特定領域,還具備良好的泛化能力。

實驗結果對比圖表

方案優勢總結

  1. 語意保留:透過實體級摘要保留上下文細節,解決三元組索引的語意丟失問題
  2. 效率優化:避免顯式圖遍歷,檢索階段更高效
  3. 強健性強:對知識圖譜的稀疏性和不完整性具有良好適應性
  4. 領域無關:框架設計通用,可快速適配不同領域
  5. 端到端 LLM 驅動:充分利用大語言模型的推理能力,無需繁瑣的規則工程

總結

MDER-DR 為知識圖譜問答提供了一條新思路:與其在檢索時遍歷複雜的圖結構,不如在索引階段就生成富含語意的實體摘要。這種「重索引、輕檢索」的設計理念,配合迭代式查詢分解策略,有效解決了多跳問答中的語意斷層問題。

Multi-Hop Question Answering with Entity-Centric Summaries
https://arxiv.org/pdf/2603.11223

延伸閱讀


分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.