14.6 DeepAgents CLI - 命令行交互式 AI 代理
来源: LangChain DeepAgents 官方文档整理日期: 2025-12-15
🔥 2025 年三大 AI 代理工具对比
2025 年被业界普遍视为 AI 智能体商业化元年。三款代表性工具各具特色:
| 维度 | Manus | Claude Code | DeepAgents CLI |
|---|---|---|---|
| 开发商 | Butterfly Effect (Monica) | Anthropic | LangChain |
| 发布时间 | 2025 年 3 月 | 2024 年末 | 2025 年 |
| 定位 | 通用型自主 AI Agent | 开发者编码助手 | 可编程 AI 代理框架 |
| 运行环境 | 云端虚拟机 | 本地终端/IDE | 本地终端 |
| 核心特性 | 完全自主执行 | Agentic 编码 | 持久记忆系统 |
| 开源状态 | 闭源(计划部分开源) | 开源 | 开源 |
🤖 Manus - 全球首款通用型 AI Agent
参考来源: Manus 官网 | Wikipedia | OpenCV Blog
Manus(拉丁语意为"手")由新加坡 Butterfly Effect 公司(原 Monica 团队)研发,于 2025 年 3 月 6 日发布。
核心特点
完全自主执行:打破传统 AI 同步响应模式
- 下达任务后可关闭电脑,Agent 在云端独立运行
- 任务完成后主动通知用户
- 实现"人在休息,事在进行"
多智能体架构:任务拆解为规划、执行、验证三模块
用户指令 → [规划 Agent] → [执行 Agent] → [验证 Agent] → 结果输出CodeAct 机制:使用可执行 Python 代码作为行动载体
工具集成:自动调用浏览器、代码编辑器、数据库等工具
GAIA 基准测试成绩
| 任务级别 | Manus | OpenAI Deep Research |
|---|---|---|
| Level 1 (基础) | 86.5% | 74.3% |
| Level 2 (中级) | 70.1% | 69.1% |
| Level 3 (复杂) | 57.7% | 47.6% |
典型应用场景
- 📊 数据分析:股票预测模型、市场报告
- 📝 办公自动化:筛选简历、制作 PPT、生成表格
- 🏠 生活服务:房产筛选、保险比价、旅行规划
- 💻 编程开发:网页代码、小游戏开发
局限与争议
- 内测邀请码被炒至数万元,等待名单超 200 万人
- 存在循环错误、执行失败等稳定性问题
- 安全研究者对"无人监督"模式提出担忧
🛠️ Claude Code - Anthropic 官方编码工具
参考来源: Claude Code 官网 | GitHub | 官方文档
Claude Code 是 Anthropic 推出的 Agentic 编码工具,直接运行在开发者的终端和 IDE 中。
核心特点
终端原生:不是聊天窗口,而是融入你现有的工作流
bashnpm install -g @anthropic-ai/claude-code claude深度代码库理解:
- 自动分析项目结构
- 理解代码依赖关系
- 执行文件编辑、命令运行、Git 操作
MCP 协议集成:
- 连接 Google Drive 读取设计文档
- 更新 Jira 任务状态
- 接入自定义开发工具
多平台支持:
- 终端 CLI
- VS Code / Cursor / Windsurf 扩展
- JetBrains IDE 扩展
- GitHub
@claude标签
设计哲学
"Claude Code is intentionally low-level and unopinionated, providing close to raw model access without forcing specific workflows."
- 底层化:接近原始模型访问
- 不预设立场:不强制特定工作流
- 灵活可扩展:通过 Hooks、Skills、MCP 自定义
Claude Agent SDK
Claude Code 已演化为通用 Agent 框架 Claude Agent SDK,支持:
- 深度研究
- 视频创作
- 笔记整理
- 以及几乎所有 Agent 循环场景
⚖️ 三者定位对比
┌─────────────────────────────────────────────────────────────────┐
│ 自主程度 (Autonomy) │
│ ↑ │
│ │ │
│ ┌────┴────┐ │
│ │ Manus │ ← 完全自主,云端异步 │
│ └────┬────┘ │
│ │ │
│ ┌───────────────┼───────────────┐ │
│ │ │ │ │
│ ┌───────┴───────┐ ┌────┴────┐ ┌────────┴────────┐ │
│ │ DeepAgents CLI │ │ │ │ Claude Code │ │
│ │ (持久记忆+审批) │ │ │ │ (编码专精+MCP) │ │
│ └───────────────┘ │ │ └─────────────────┘ │
│ │ │ │
│ ←─────────────────────────────────────────────────────────────→ │
│ 可编程性 (Programmability) 编码专精 (Coding Focus) │
└─────────────────────────────────────────────────────────────────┘| 选择建议 | 推荐工具 |
|---|---|
| 需要完全自主、异步执行复杂任务 | Manus |
| 专注于日常编码、Git 工作流 | Claude Code |
| 需要持久记忆、可编程扩展 | DeepAgents CLI |
| 构建自定义 Agent 应用 | Claude Agent SDK / DeepAgents |
概述
DeepAgents CLI 是一个交互式命令行界面工具,用于构建具有持久记忆能力的 AI 代理。它使代理能够跨会话保持上下文,学习项目约定,并在人类审批控制下执行代码。
与传统的一次性对话不同,DeepAgents CLI 的核心优势在于:
- 记忆持久化(Memory Persistence):代理可以"记住"之前会话中学到的信息
- 项目感知(Project Awareness):理解项目结构、代码规范和部署流程
- 人机协作(Human-in-the-Loop):敏感操作需要人类确认,确保安全可控
核心功能
内置能力
| 功能 | 说明 |
|---|---|
| 文件操作 | 读取、写入、编辑项目文件 |
| Shell 命令执行 | 运行测试、管理依赖、与版本控制交互 |
| 网络搜索 | 查询互联网获取信息(需要 Tavily API Key) |
| HTTP 请求 | 与外部 API 集成 |
| 任务规划 | 分解复杂工作并跟踪进度 |
| 记忆存储 | 跨会话保留信息 |
| 人工审批 | 敏感操作需要确认才能执行 |
工作流程
+------------------+ +------------------+ +------------------+
| 用户输入任务 | --> | 代理规划任务 | --> | 执行并审批 |
+------------------+ +------------------+ +------------------+
| | |
v v v
+------------------+ +------------------+ +------------------+
| 检索相关记忆 | | 创建 Todo 列表 | | 保存新知识 |
+------------------+ +------------------+ +------------------+安装与配置
快速安装
使用 uvx(推荐,无需安装):
uvx deepagents-cli使用 pip 本地安装:
pip install deepagents-cli使用 uv 安装:
uv pip install deepagents-cliAPI Key 配置
方式一:环境变量
# Anthropic Claude(默认模型)
export ANTHROPIC_API_KEY="your-api-key"
# OpenAI(可选替代)
export OPENAI_API_KEY="your-key"
# Tavily(启用网络搜索,可选)
export TAVILY_API_KEY="your-key"方式二:.env 文件
在项目根目录创建 .env 文件:
ANTHROPIC_API_KEY=your-api-key
OPENAI_API_KEY=your-key
TAVILY_API_KEY=your-key默认模型
DeepAgents CLI 默认使用 Claude Sonnet 4。如果设置了 OPENAI_API_KEY 环境变量,也可以切换到 OpenAI 模型。
命令行使用
启动 CLI
# 默认启动
deepagents
# 使用 uvx 启动(无需安装)
uvx deepagents-cli
# 指定代理名称(使用独立记忆)
deepagents --agent backend-dev
# 自动批准模式(跳过确认提示)
deepagents --auto-approve命令行选项
| 选项 | 说明 |
|---|---|
--agent NAME | 使用指定名称的代理(独立记忆空间) |
--auto-approve | 跳过工具确认提示 |
--sandbox TYPE | 在远程沙箱中执行(modal, daytona, runloop) |
--sandbox-id ID | 复用现有沙箱 |
--sandbox-setup PATH | 在沙箱中运行设置脚本 |
代理管理命令
# 列出所有代理
deepagents list
# 显示帮助信息
deepagents help
# 重置代理记忆
deepagents reset --agent NAME
# 从另一个代理复制记忆
deepagents reset --agent NAME --target SOURCE交互模式
斜杠命令
在 CLI 交互界面中,可以使用以下斜杠命令:
| 命令 | 功能 |
|---|---|
/tokens | 显示 Token 使用情况 |
/clear | 清除对话历史 |
/exit | 退出 CLI |
Bash 前缀
使用 ! 前缀直接执行 Shell 命令:
!git status
!npm test
!ls -la
!python --version键盘快捷键
| 快捷键 | 功能 |
|---|---|
Enter | 提交输入 |
Alt+Enter | 插入换行 |
Ctrl+E | 打开外部编辑器 |
Ctrl+T | 切换自动批准模式 |
Ctrl+C | 中断当前操作 |
Ctrl+D | 退出 CLI |
记忆系统
记忆优先协议(Memory-First Protocol)
DeepAgents CLI 最强大的特性之一是其持久记忆系统。代理遵循以下协议:
- 研究阶段(Research):首先搜索记忆获取相关上下文
- 响应阶段(Response):不确定时查询记忆
- 学习阶段(Learning):自动保存新发现的信息
记忆存储位置
代理将信息存储在 ~/.deepagents/AGENT_NAME/memories/ 目录中,使用 Markdown 文件格式:
~/.deepagents/backend-dev/memories/
|-- api-conventions.md # API 设计规范
|-- database-schema.md # 数据库模式
|-- deployment-process.md # 部署流程
|-- team-preferences.md # 团队偏好记忆组织建议
按主题组织记忆文件,便于代理快速检索:
~/.deepagents/frontend-dev/memories/
|-- react-patterns.md # React 模式和最佳实践
|-- styling-guidelines.md # 样式指南
|-- testing-strategy.md # 测试策略
|-- build-config.md # 构建配置Skills 系统
什么是 Skills?
Skills(技能)是包含 SKILL.md 文件和相关资源(文档、脚本等)的文件夹。代理可以动态发现和加载这些技能,以更好地执行特定任务。
添加 Skills
# 创建 Skills 目录
mkdir -p ~/.deepagents/agent/skills
# 复制现有 Skill
cp -r examples/skills/web-research ~/.deepagents/agent/skills/查看可用 Skills
deepagents skills listSkills 在 DeepAgents CLI 启动时自动加载,扩展代理的能力。
远程沙箱执行
为什么使用沙箱?
在隔离环境中安全执行代码,避免对本地系统造成影响。适用于:
- 运行不受信任的代码
- 测试破坏性操作
- 模拟生产环境
支持的沙箱提供商
| 提供商 | 配置 |
|---|---|
| Runloop | export RUNLOOP_API_KEY="your-key" |
| Daytona | export DAYTONA_API_KEY="your-key" |
| Modal | modal setup |
使用沙箱启动
# 使用 Runloop 沙箱
uvx deepagents-cli --sandbox runloop --sandbox-setup ./setup.sh
# 使用 Daytona 沙箱
deepagents --sandbox daytona
# 使用 Modal 沙箱
deepagents --sandbox modal沙箱设置脚本示例
#!/bin/bash
set -e
# 克隆项目仓库
git clone https://x-access-token:${GITHUB_TOKEN}@github.com/username/repo.git $HOME/workspace
cd $HOME/workspace
# 配置环境变量
cat >> ~/.bashrc <<'EOF'
export GITHUB_TOKEN="${GITHUB_TOKEN}"
export OPENAI_API_KEY="${OPENAI_API_KEY}"
cd $HOME/workspace
EOF
# 安装依赖
npm install
# 或
pip install -r requirements.txt
source ~/.bashrc实际使用示例
示例 1:创建 Python 脚本
> Create a Python script that prints "Hello, World!"代理会:
- 规划任务
- 生成代码
- 显示 diff 供您审批
- 等待确认后写入文件
示例 2:代码审查
> Review the code in src/main.py and suggest improvements代理会:
- 读取文件内容
- 分析代码质量
- 提供改进建议
- 如果您同意,执行修改
示例 3:项目学习
> Learn about this project's architecture and save it to memory代理会:
- 扫描项目结构
- 读取关键文件(README、配置文件等)
- 总结项目架构
- 保存到记忆文件供未来参考
示例 4:调试问题
> The tests in tests/test_api.py are failing. Help me debug.代理会:
- 运行测试查看失败信息
- 分析错误原因
- 检索相关记忆(如 API 规范)
- 提出修复方案
- 等待您批准后执行修改
与 DeepAgents Python API 的关系
DeepAgents CLI 是 DeepAgents 框架的命令行界面封装。如果需要更多编程控制,可以直接使用 Python API:
from deepagents import create_deep_agent
from langchain.chat_models import init_chat_model
# 使用默认模型(Claude Sonnet 4)
agent = create_deep_agent(
system_prompt="你是一个专业的 Python 开发助手"
)
# 使用 OpenAI 模型
model = init_chat_model("openai:gpt-4o")
agent = create_deep_agent(model=model)
# 调用代理
result = agent.invoke({
"messages": [{"role": "user", "content": "帮我写一个快速排序算法"}]
})最佳实践
1. 为不同项目创建独立代理
# 后端开发代理
deepagents --agent backend-api
# 前端开发代理
deepagents --agent frontend-react
# 数据分析代理
deepagents --agent data-analysis每个代理拥有独立的记忆空间,不会混淆不同项目的上下文。
2. 主动教导代理
> Remember: In this project, we use snake_case for Python variables
> and camelCase for JavaScript. Always follow PEP 8 for Python code.代理会将这些规范保存到记忆中,在后续交互中自动遵循。
3. 定期整理记忆
检查 ~/.deepagents/AGENT_NAME/memories/ 目录,删除过时或不相关的记忆文件,保持记忆库的准确性。
4. 善用自动批准模式
对于低风险操作(如读取文件、运行测试),可以使用 --auto-approve 提高效率:
deepagents --agent dev --auto-approve但对于生产环境或敏感操作,建议保持手动审批。
总结
DeepAgents CLI 是一个强大的命令行 AI 代理工具,特别适合:
| 场景 | 优势 |
|---|---|
| 长期项目开发 | 持久记忆保留项目上下文 |
| 团队协作 | 通过共享记忆传递知识 |
| 复杂任务 | 任务规划和分解能力 |
| 安全执行 | 人工审批和沙箱支持 |
核心特性总结:
- 持久记忆系统 - 跨会话保留知识
- 记忆优先协议 - 先查记忆再响应
- 人机协作 - 敏感操作需确认
- Skills 扩展 - 动态加载专业能力
- 沙箱执行 - 安全隔离环境