Skip to content

15.5 Exa:用 LangGraph 构建 Web 研究多智能体系统

Exa Case Study

来源:How Exa built a Web Research Multi-Agent System with LangGraph and LangSmith


公司简介

Exa 是一家提供高质量搜索 API 的公司,最近推出了深度研究智能体产品,能够自主探索网络以找到用户需要的结构化信息。

核心指标:

  • 每日处理数百个研究查询
  • 交付结果耗时 15 秒至 3 分钟(取决于复杂度)

产品演进路径

Exa 的产品经历了三个阶段的演进:

搜索 API → 答案端点 → 深度研究智能体

随着架构复杂性增加,团队重新评估技术选项,最终采用 LangGraph 框架。这反映了行业趋势——复杂架构越来越多地选择 LangGraph


技术架构

三层多智能体模式

Exa Architecture

层级角色职责
规划者 (Planner)分析查询动态生成并行任务
任务 (Tasks)独立研究单元使用专门工具执行搜索
观察者 (Observer)全局上下文维护状态,输出清理后的结果

关键设计

  • 任务仅接收清理后的输出,而非中间推理状态
  • 参考了 Anthropic Deep Research 系统的设计理念

技术亮点

1. 动态任务生成

根据查询复杂度自动调整并行任务数量:

简单查询 → 少量并行任务
复杂查询 → 多个并行任务

2. 搜索片段优化

搜索结果 → 先在摘要上推理 → 仅在需要时请求完整内容

效果:显著减少 Token 使用,同时保持研究质量。

3. 结构化输出

所有级别均维持 JSON 格式输出:

json
{
  "query": "用户查询",
  "findings": [
    {"source": "URL", "content": "摘要"},
    ...
  ],
  "summary": "综合结论"
}

通过函数调用生成结构化输出,确保 API 消费者获得可靠的输出格式。


LangSmith 的价值

"理解 Token 使用情况的可观测性...LangSmith 提供的这一点非常重要。设置也超级简单。"

—— Mark Pekala, Exa 软件工程师

LangSmith 核心价值:

功能价值
Token 使用追踪为生产定价模型提供成本效率数据
简易设置快速集成,无需复杂配置
可观测性理解系统行为,优化性能

业务成果

指标效果
处理速度15 秒至 3 分钟(因复杂度而异)
Token 使用显著降低
输出格式可靠的结构化 JSON
成本效率支持生产定价模型

关键洞察

架构演进的启示

从简单 API 到复杂智能体系统的演进过程中,LangGraph 成为自然选择:

  1. 早期:简单的搜索 API 足够
  2. 中期:答案端点需要更多逻辑
  3. 后期:深度研究智能体需要多智能体编排

Token 优化策略

  • 先在摘要上推理,减少不必要的全文获取
  • 结构化输出减少冗余内容
  • 动态任务数量避免过度并行

总结

Exa 的案例展示了如何用 LangGraph 构建生产级的 Web 研究智能体:

  1. 三层架构:规划者 + 任务 + 观察者
  2. 动态调整:根据查询复杂度调整并行度
  3. Token 优化:摘要优先 + 结构化输出
  4. 可观测性:LangSmith 追踪 Token 使用和成本

这个案例为构建研究类 AI 产品提供了优秀的架构参考。


上一篇:[15.4 Bertelsmann](./15.4 Bertelsmann.md)

下一篇:[15.6 Captide](./15.6 Captide.md)

基于 MIT 许可证发布。内容版权归作者所有。