Agentic RAG 架构分类
从单智能体到复杂层级系统:七种核心架构详解
架构概览
Agentic RAG 系统根据复杂度和适用场景,可分为七种主要架构类型:
| 架构类型 | 复杂度 | 核心特征 | 适用场景 |
|---|---|---|---|
| 单智能体路由 | 低 | 集中决策 | 简单多源检索 |
| 多智能体系统 | 中 | 专业分工 | 高并发复杂查询 |
| 层级系统 | 高 | 多级监督 | 企业级应用 |
| 纠正式 RAG | 中 | 自我纠错 | 高准确性需求 |
| 自适应 RAG | 中 | 动态策略 | 混合复杂度查询 |
| 图增强 RAG | 高 | 关系推理 | 知识图谱场景 |
| 文档工作流 | 高 | 端到端自动化 | 企业文档处理 |
一、单智能体路由架构(Single-Agent Router)
单智能体路由是最简洁的 Agentic RAG 架构,由一个统一的智能体管理所有检索、路由和信息整合任务。
图 1:单智能体 Agentic RAG 架构
工作流程
用户查询
│
↓
┌─────────────────────────────────────┐
│ 协调智能体(Router) │
│ 分析查询 → 选择数据源 → 协调检索 │
└─────────────────────────────────────┘
│
├─→ 向量数据库(语义检索)
│
├─→ SQL 数据库(结构化查询)
│
├─→ Web 搜索(实时信息)
│
└─→ 推荐系统(个性化内容)
│
↓
LLM 整合生成 → 最终响应核心优势
- 集中简化:单一智能体处理所有任务,降低系统复杂度
- 动态路由:实时评估查询,选择最优数据源
- 灵活适配:支持多种工具类型
- 低开销:计算资源需求较少
局限性
- 当工具数量过多时,选择效率下降
- 无法并行处理复杂多领域查询
- 单点故障风险
适用场景
- 工具/数据源数量有限(<10个)
- 查询类型相对明确
- 对响应延迟敏感的应用
二、多智能体系统(Multi-Agent System)
多智能体架构将职责分配给多个专业化智能体,每个智能体专注于特定数据源或任务类型。
图 2:多智能体 Agentic RAG 架构
工作流程
用户查询
│
↓
┌─────────────────────────────────────┐
│ 主协调智能体 │
│ 接收查询 → 任务分配 │
└─────────────────────────────────────┘
│
├─────────────────────────────────┤
│ 并行处理 │
│ │
│ ┌─────────┐ ┌─────────┐ │
│ │SQL 专家 │ │语义检索 │ │
│ │智能体 │ │智能体 │ │
│ └─────────┘ └─────────┘ │
│ │
│ ┌─────────┐ ┌─────────┐ │
│ │Web 搜索 │ │推荐系统 │ │
│ │智能体 │ │智能体 │ │
│ └─────────┘ └─────────┘ │
│ │
├─────────────────────────────────┤
│
↓
结果聚合 → LLM 整合 → 最终响应核心优势
- 模块化:智能体可独立添加、删除、升级
- 并行处理:多智能体同时工作,提升吞吐量
- 专业优化:每个智能体针对特定任务优化
- 容错性:单个智能体失败不影响整体
设计挑战
- 协调复杂:需要有效的通信和同步机制
- 计算开销:多智能体运行增加资源消耗
- 数据整合:来自不同源的信息需要高效整合
适用场景
- 大规模数据源(10+)
- 高并发查询需求
- 需要专业化处理的多领域应用
三、层级架构(Hierarchical System)
层级架构通过多层智能体结构实现战略决策和资源分配,高层智能体监督低层智能体。
图 3:层级 Agentic RAG 架构
架构设计
┌─────────────────┐
│ 顶层智能体 │
│ (战略决策层) │
└────────┬────────┘
│
┌──────────────┼──────────────┐
↓ ↓ ↓
┌──────────┐ ┌──────────┐ ┌──────────┐
│中层智能体 │ │中层智能体 │ │中层智能体 │
│(领域协调) │ │(领域协调) │ │(领域协调) │
└─────┬────┘ └─────┬────┘ └─────┬────┘
│ │ │
┌────┴────┐ ┌────┴────┐ ┌────┴────┐
↓ ↓ ↓ ↓ ↓ ↓
┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐
│执行者│ │执行者│ │执行者│ │执行者│ │执行者│ │执行者│
└─────┘ └─────┘ └─────┘ └─────┘ └─────┘ └─────┘层级职责
| 层级 | 职责 | 能力 |
|---|---|---|
| 顶层 | 战略决策 | 任务评估、资源优先级、数据源排序 |
| 中层 | 领域协调 | 子任务分配、领域内优化 |
| 底层 | 任务执行 | 具体检索、数据处理 |
核心优势
- 战略优先级:顶层智能体根据可靠性和相关性排序数据源
- 可扩展性:通过分布式处理应对复杂多面查询
- 决策增强:多层监督提升准确性和连贯性
适用场景
- 企业级知识管理系统
- 多部门协作场景
- 需要审批流程的敏感应用
四、纠正式 RAG(Corrective RAG / CRAG)
纠正式 RAG 引入自我纠错机制,动态评估检索结果的相关性,并在不足时触发纠正措施。
图 4:纠正式 Agentic RAG 架构
核心机制
用户查询
│
↓
初始检索 → 相关性评估
│
┌────┴────┐
↓ ↓
相关 不相关
│ │
↓ ↓
直接使用 触发纠正
│
┌────┴────┐
↓ ↓
查询重写 外部检索
│ │
└────┬────┘
↓
重新检索
│
↓
再次评估...五大专业智能体
| 智能体 | 功能 |
|---|---|
| 上下文检索 | 从知识库获取初始文档 |
| 相关性评估 | 评估文档与查询的匹配度 |
| 查询重写 | 优化查询以提高检索精度 |
| 外部知识检索 | 当内部知识不足时访问外部资源 |
| 响应合成 | 整合信息生成最终响应 |
核心优势
- 迭代纠正:动态识别不相关结果并修正
- 动态适应:实时整合外部信息(Web 搜索)
- 事实保证:最小化幻觉和错误信息风险
适用场景
- 对准确性要求极高的应用(医疗、法律)
- 知识库可能不完整的场景
- 需要实时信息补充的应用
五、自适应 RAG(Adaptive RAG)
自适应 RAG 根据查询复杂度动态选择处理策略,实现资源的最优分配。
图 5:自适应 Agentic RAG 架构
核心原理
用户查询
│
↓
┌─────────────────────────────────────┐
│ 复杂度分类器 │
│ (小模型,低成本,快速判断) │
└─────────────────────────────────────┘
│
├─→ 简单查询 → 无检索,直接生成
│
├─→ 中等查询 → 单次检索 + 生成
│
└─→ 复杂查询 → 多步迭代检索 + 推理三级处理策略
| 复杂度 | 策略 | 资源消耗 |
|---|---|---|
| 简单 | 直接使用 LLM 内置知识 | 最低 |
| 中等 | 单次检索增强 | 中等 |
| 复杂 | 多步迭代推理 | 最高 |
分类器设计
分类器通常使用小型语言模型,基于标注数据训练:
python
class ComplexityClassifier:
def __init__(self):
self.model = load_small_model() # 如 DistilBERT
def classify(self, query):
features = self.extract_features(query)
# 特征包括:查询长度、实体数量、关系复杂度等
return self.model.predict(features)
# 返回:'simple', 'moderate', 'complex'核心优势
- 资源效率:简单查询快速处理,复杂查询深入分析
- 成本优化:避免不必要的检索操作
- 响应优化:简单问题快速响应,复杂问题充分推理
适用场景
- 查询复杂度差异大的应用
- 成本敏感的生产环境
- 需要平衡速度与质量的系统
六、图增强 RAG(Graph-Based RAG)
图增强 RAG 将知识图谱与文档检索结合,增强关系推理和多跳问答能力。
Agent-G 框架
图 6:Agent-G 框架架构
Agent-G 整合图知识库和非结构化文档检索:
用户查询
│
├─→ 图检索器 → 实体关系
│
└─→ 文档检索器 → 上下文信息
│
↓
┌─────────────────────────────────────┐
│ 批评模块 │
│ 验证数据相关性和质量 │
│ 低置信度 → 触发重新检索 │
└─────────────────────────────────────┘
│
↓
LLM 整合 → 最终响应GeAR 框架
图 7:GeAR 框架概览
GeAR 通过图扩展增强传统检索:
- 图扩展模块:将图结构数据整合到检索过程
- 智能体检索:自主选择和组合检索策略
- 多跳支持:处理需要跨多个信息节点的复杂查询
核心优势
- 增强推理:结合结构化关系与上下文信息
- 动态适应:根据查询需求调整检索策略
- 高准确性:通过批评模块验证数据质量
适用场景
- 知识图谱应用
- 需要实体关系推理的问答
- 科研文献分析(引用关系、作者网络)
七、Agentic 文档工作流(ADW)
Agentic 文档工作流将传统 RAG 扩展为端到端文档处理自动化,实现从文档解析到结构化输出的完整流程。
图 8:Agentic 文档工作流
工作流程
原始文档
│
↓
┌─────────────────────────────────────┐
│ 文档解析 │
│ 提取字段、识别结构 │
└─────────────────────────────────────┘
│
↓
┌─────────────────────────────────────┐
│ 状态维护 │
│ 跨处理阶段跟踪文档上下文 │
└─────────────────────────────────────┘
│
↓
┌─────────────────────────────────────┐
│ 知识检索 │
│ 访问外部知识库和领域规则 │
└─────────────────────────────────────┘
│
↓
┌─────────────────────────────────────┐
│ 智能编排 │
│ 应用业务规则、多跳推理 │
└─────────────────────────────────────┘
│
↓
结构化输出(报告、决策、操作建议)核心特征
| 特征 | 说明 |
|---|---|
| 状态维护 | 跨处理阶段保持文档上下文一致性 |
| 多步编排 | 协调多组件完成复杂工作流 |
| 领域智能 | 应用特定业务规则和合规要求 |
| 可扩展性 | 支持大规模文档处理 |
典型应用:发票处理
发票文档
│
↓
解析:提取供应商、金额、日期、项目明细
│
↓
检索:获取供应商合同、折扣条款
│
↓
推理:应用折扣规则、合规检查
│
↓
输出:付款建议、预算影响分析适用场景
- 企业文档自动化处理
- 合同审查和管理
- 财务报表分析
- 合规文档审核
架构选择决策树
你的应用需求是什么?
│
┌────────────┼────────────┐
↓ ↓ ↓
简单问答 复杂推理 文档处理
│ │ │
↓ ↓ ↓
单智能体 多数据源? 端到端自动化
│ │ │
│ ┌────┴────┐ │
│ ↓ ↓ │
│ 需要纠错? 知识图谱? │
│ │ │ │
│ ↓ ↓ │
│ 纠正式RAG 图增强RAG │
│ │
└────────────┬────────────┘
│
需要层级控制?
│
┌──────┴──────┐
↓ ↓
层级架构 多智能体思考题
- 如何决定使用单智能体还是多智能体架构?关键考量因素是什么?
- 纠正式 RAG 和自适应 RAG 可以结合使用吗?如何设计?
- 在实现层级架构时,如何避免信息传递过程中的损失?