返回文章列表
RAG
论文
arXiv
2026
检索增强
大模型

2026年3月RAG前沿论文精选 | arXiv最新研究

2026年3月9日 11:0011 分钟加载中作者: Lhy099

TL;DR

本文精选2026年3月arXiv上10篇RAG(检索增强生成)前沿论文,涵盖多模态RAG、时间序列RAG、机器人RAG、自适应记忆机制等创新方向,为研究者和开发者提供最新技术洞察。


论文1:AutoThinkRAG - 复杂度感知的RAG控制

标题: AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Generation

arXiv链接: https://arxiv.org/html/2603.05551v1

发表时间: 2026年3月

研究背景

传统RAG依赖分块和向量检索,但在分散证据定位和多跳推理方面表现不佳。GraphRAG通过将检索单元间的关系建模为图来解决此问题,但仍有改进空间。

核心创新

1. 多模态文档RAG(MM-RAG)

  • 同时处理异构多模态文档(金融PDF、技术图表)
  • 需要同时解决:多模态信息处理 + 高精度推理

2. 结构化检索与推理

  • LightRAG、REANO、HopRAG:通过轻量级/临时图和多阶段检索提升效率和证据覆盖
  • GNN-RAG、TRACE、PathRAG:通过提取候选子图/路径形成结构化证据链

3. 视觉富文档处理

  • REVEAL、VDocRAG、VisDoM、MMGraphRAG:整合布局、实体和知识结构实现多页理解

论文2:RAGNav - 拓扑推理增强的RAG

标题: RAGNav: A Retrieval-Augmented Topological Reasoning Framework

arXiv链接: https://arxiv.org/html/2603.03745v1

核心思想

RAG技术通过为LLM配备可检索的外部知识库,显著提升事实准确性和推理可追溯性。本文探索构建基于RAG的语义记忆来增强甚至部分替代传统拓扑地图功能。

关键贡献

  • EmbodiedRAG:系统性地将"检索-生成"机制引入具身场景
  • 通过预处理任务相关实体和属性,检索关联信息执行自然语言机器人任务
  • 弥合拓扑地图的语义鸿沟

论文3:时间序列RAG新方法

标题: Retrieval-Augmented Generation with Covariate Time Series

arXiv链接: https://arxiv.org/html/2603.04951v1

问题定义

传统时间序列RAG方法将时间序列切片映射为静态向量嵌入,但:

  • 全局压缩掩盖绝对幅度
  • 统一处理所有点,无法捕捉物理系统的逐点相关性和协变量耦合

创新方法:双权重检索机制

1. 临界点加权(Critical Point Weighting)

  • 优先关注近期系统状态和已知未来控制

2. 协变量加权(Covariate Weighting)

  • 强调具有强因果影响的驱动变量

优势

  • 直接在原始数据空间操作
  • 完全零样本、免训练方式
  • 适用于工业时间序列预测

论文4:LIT-RAGBench - RAG生成器能力基准测试

标题: LIT-RAGBench: Benchmarking Generator Capabilities of Large Language Models in RAG

arXiv链接: https://arxiv.org/html/2603.06198v1

评测维度

能力说明
长上下文整合整合长上下文证据
多步推理执行多步推理
表格解释解释表格数据
缺失证据处理证据缺失时正确弃权

核心发现

  • 跨API和开源模型,没有模型整体准确率超过90%
  • 现有基准无法同时评估多种能力
  • LIT-RAGBench提供统一的评估框架

论文5:RAG Fusion - 规模化检索增强生成

标题: Scaling Retrieval Augmented Generation with RAG Fusion

arXiv链接: https://arxiv.org/html/2603.02153v1

核心问题

RAG系统效果高度依赖检索质量:

  • 相关证据缺失或排名不佳时,下游生成受限
  • 无论模型容量多大都无法弥补

应用场景

  • 大型企业知识库的事实问答
  • 需要访问控制、延迟和动态内容管理的场景

论文6:RAG-X - 医疗领域RAG系统诊断

标题: RAG-X: Systematic Diagnosis of Retrieval-Augmented Generation Systems

arXiv链接: https://arxiv.org/html/2603.03541v1

研究动机

RAG已成为缓解LLM事实幻觉的标准架构,但在关键医疗领域需要严格的评估和系统诊断。

实验设置

组件配置
检索BM25 + 向量相似度搜索(RRF融合)
生成模型Llama-3.1-8B、Gemma-2-9B、Qwen2.5-7B
评估指标F1分数、语义相似度、准确率

关键结果

设置F1分数语义相似度准确率
直接零样本0.210.520.35
长上下文0.340.630.54
RAG0.320.690.71

论文7:鲁棒RAG研究

标题: Towards Robust Retrieval-Augmented Generation Based on Inconsistent Information

arXiv链接: https://arxiv.org/html/2603.05698v1

研究问题

不一致的检索信息对LLM响应的影响日益受到关注。Retrieval-Augmented Generation Benchmark (RGB)作为新的RAG评估测试平台,旨在评估LLM对检索信息不一致性的鲁棒性。

评估场景

  1. 噪声鲁棒性 - 处理含噪声的检索结果
  2. 矛盾信息处理 - 处理相互矛盾的多源信息
  3. 缺失信息应对 - 处理检索不到相关信息的情况

论文8:机器人RAG - Retrieve-Reason-Act

标题: Retrieval-Augmented Robots via Retrieve-Reason-Act

arXiv链接: https://arxiv.org/html/2603.02688v1

核心创新

将RAG从文本生成扩展到机器人任务规划:

  • 检索视觉程序文档(装配手册)
  • 通过Retrieve-Reason-Act循环翻译成装配序列
  • 由模拟机器人执行

实验结果

  • 完整手册检索相比零样本基线提升**+20.4% F1**
  • 解决视觉 grounding 挑战:将抽象部件标识符映射到手册图像中的物理组件

论文9:GAM-RAG - 增益自适应记忆

标题: GAM-RAG: Gain-Adaptive Memory for Evolving Retrieval in RAG

arXiv链接: https://arxiv.org/html/2603.01783v1

核心概念

记忆增强RAG的最新进展:

方法特点
HippoRAG/HippoRAG 2将外部知识图视为非参数长期记忆
ReMindRAG缓存遍历痕迹作为可重放路径记忆
GAM-RAG增益自适应记忆机制

技术细节

  • 通过PageRank风格传播在图上读取证据
  • 新观察可通过LLM提取写入图谱
  • 相似查询重用之前有效的路径

论文10:FLANS - 多语言文化RAG

标题: FLANS at SemEval-2026 Task 7: RAG with Open-Sourced Smaller LLMs

arXiv链接: https://arxiv.org/pdf/2603.01910

任务目标

SemEval-2026 Task 7:"Everyday Knowledge Across Diverse Languages and Cultures"

方法

  • 使用开源小规模LLM(OS-sLLMs)
  • 基于Wikipedia提取的本地知识库
  • 在线实时搜索引擎 + 语言和模型路由

可持续发展

  • 探索可持续和安全的AI开发
  • 小模型性能优化
  • 未来工作:扩展语言覆盖、优化知识库质量控制

趋势总结

1. 多模态RAG成为主流

从纯文本到视觉、音频、结构化数据的统一处理

2. 自适应与动态记忆

HippoRAG、GAM-RAG等动态记忆机制兴起

3. 领域特化

医疗(RAG-X)、机器人(Retrieve-Reason-Act)、时间序列等专业领域深化

4. 鲁棒性评估受重视

LIT-RAGBench、RGB等基准测试推动RAG系统可靠性研究


论文检索时间:2026-03-09
来源:arXiv

相关文章