14.6 DeepAgents CLI - 命令行交互式 AI 代理

来源: LangChain DeepAgents 官方文档整理日期: 2025-12-15

🔥 2025 年三大 AI 代理工具对比

2025 年被业界普遍视为 AI 智能体商业化元年。三款代表性工具各具特色：

维度	Manus	Claude Code	DeepAgents CLI
开发商	Butterfly Effect (Monica)	Anthropic	LangChain
发布时间	2025 年 3 月	2024 年末	2025 年
定位	通用型自主 AI Agent	开发者编码助手	可编程 AI 代理框架
运行环境	云端虚拟机	本地终端/IDE	本地终端
核心特性	完全自主执行	Agentic 编码	持久记忆系统
开源状态	闭源（计划部分开源）	开源	开源

🤖 Manus - 全球首款通用型 AI Agent

参考来源: Manus 官网 | Wikipedia | OpenCV Blog

Manus（拉丁语意为"手"）由新加坡 Butterfly Effect 公司（原 Monica 团队）研发，于 2025 年 3 月 6 日发布。

核心特点

完全自主执行：打破传统 AI 同步响应模式
- 下达任务后可关闭电脑，Agent 在云端独立运行
- 任务完成后主动通知用户
- 实现"人在休息，事在进行"

多智能体架构：任务拆解为规划、执行、验证三模块

用户指令 → [规划 Agent] → [执行 Agent] → [验证 Agent] → 结果输出

CodeAct 机制：使用可执行 Python 代码作为行动载体
工具集成：自动调用浏览器、代码编辑器、数据库等工具

GAIA 基准测试成绩

任务级别	Manus	OpenAI Deep Research
Level 1 (基础)	86.5%	74.3%
Level 2 (中级)	70.1%	69.1%
Level 3 (复杂)	57.7%	47.6%

典型应用场景

📊 数据分析：股票预测模型、市场报告
📝 办公自动化：筛选简历、制作 PPT、生成表格
🏠 生活服务：房产筛选、保险比价、旅行规划
💻 编程开发：网页代码、小游戏开发

局限与争议

内测邀请码被炒至数万元，等待名单超 200 万人
存在循环错误、执行失败等稳定性问题
安全研究者对"无人监督"模式提出担忧

🛠️ Claude Code - Anthropic 官方编码工具

参考来源: Claude Code 官网 | GitHub | 官方文档

Claude Code 是 Anthropic 推出的 Agentic 编码工具，直接运行在开发者的终端和 IDE 中。

核心特点

终端原生：不是聊天窗口，而是融入你现有的工作流
bash
```
npm install -g @anthropic-ai/claude-code
claude
```
1
2
深度代码库理解：
- 自动分析项目结构
- 理解代码依赖关系
- 执行文件编辑、命令运行、Git 操作
MCP 协议集成：
- 连接 Google Drive 读取设计文档
- 更新 Jira 任务状态
- 接入自定义开发工具
多平台支持：
- 终端 CLI
- VS Code / Cursor / Windsurf 扩展
- JetBrains IDE 扩展
- GitHub @claude 标签

设计哲学

"Claude Code is intentionally low-level and unopinionated, providing close to raw model access without forcing specific workflows."

底层化：接近原始模型访问
不预设立场：不强制特定工作流
灵活可扩展：通过 Hooks、Skills、MCP 自定义

Claude Agent SDK

Claude Code 已演化为通用 Agent 框架 Claude Agent SDK，支持：

深度研究
视频创作
笔记整理
以及几乎所有 Agent 循环场景

⚖️ 三者定位对比

┌─────────────────────────────────────────────────────────────────┐
│                        自主程度 (Autonomy)                        │
│                              ↑                                   │
│                              │                                   │
│                         ┌────┴────┐                              │
│                         │  Manus  │ ← 完全自主，云端异步          │
│                         └────┬────┘                              │
│                              │                                   │
│              ┌───────────────┼───────────────┐                   │
│              │               │               │                   │
│      ┌───────┴───────┐ ┌────┴────┐ ┌────────┴────────┐          │
│      │ DeepAgents CLI │ │         │ │   Claude Code   │          │
│      │ (持久记忆+审批) │ │         │ │ (编码专精+MCP)  │          │
│      └───────────────┘ │         │ └─────────────────┘          │
│                        │         │                               │
│ ←─────────────────────────────────────────────────────────────→ │
│    可编程性 (Programmability)           编码专精 (Coding Focus)   │
└─────────────────────────────────────────────────────────────────┘

选择建议	推荐工具
需要完全自主、异步执行复杂任务	Manus
专注于日常编码、Git 工作流	Claude Code
需要持久记忆、可编程扩展	DeepAgents CLI
构建自定义 Agent 应用	Claude Agent SDK / DeepAgents

概述

DeepAgents CLI 是一个交互式命令行界面工具，用于构建具有持久记忆能力的 AI 代理。它使代理能够跨会话保持上下文，学习项目约定，并在人类审批控制下执行代码。

与传统的一次性对话不同，DeepAgents CLI 的核心优势在于：

记忆持久化（Memory Persistence）：代理可以"记住"之前会话中学到的信息
项目感知（Project Awareness）：理解项目结构、代码规范和部署流程
人机协作（Human-in-the-Loop）：敏感操作需要人类确认，确保安全可控

核心功能

内置能力

功能	说明
文件操作	读取、写入、编辑项目文件
Shell 命令执行	运行测试、管理依赖、与版本控制交互
网络搜索	查询互联网获取信息（需要 Tavily API Key）
HTTP 请求	与外部 API 集成
任务规划	分解复杂工作并跟踪进度
记忆存储	跨会话保留信息
人工审批	敏感操作需要确认才能执行

工作流程

+------------------+     +------------------+     +------------------+
|   用户输入任务   | --> |   代理规划任务   | --> |   执行并审批     |
+------------------+     +------------------+     +------------------+
        |                        |                        |
        v                        v                        v
+------------------+     +------------------+     +------------------+
|   检索相关记忆   |     |   创建 Todo 列表 |     |   保存新知识     |
+------------------+     +------------------+     +------------------+

安装与配置

快速安装

使用 uvx（推荐，无需安装）：

bash

uvx deepagents-cli

使用 pip 本地安装：

bash

pip install deepagents-cli

使用 uv 安装：

bash

uv pip install deepagents-cli

API Key 配置

方式一：环境变量

bash

# Anthropic Claude（默认模型）
export ANTHROPIC_API_KEY="your-api-key"

# OpenAI（可选替代）
export OPENAI_API_KEY="your-key"

# Tavily（启用网络搜索，可选）
export TAVILY_API_KEY="your-key"

方式二：.env 文件

在项目根目录创建 .env 文件：

env

ANTHROPIC_API_KEY=your-api-key
OPENAI_API_KEY=your-key
TAVILY_API_KEY=your-key

默认模型

DeepAgents CLI 默认使用 Claude Sonnet 4。如果设置了 OPENAI_API_KEY 环境变量，也可以切换到 OpenAI 模型。

命令行使用

启动 CLI

bash

# 默认启动
deepagents

# 使用 uvx 启动（无需安装）
uvx deepagents-cli

# 指定代理名称（使用独立记忆）
deepagents --agent backend-dev

# 自动批准模式（跳过确认提示）
deepagents --auto-approve

命令行选项

选项	说明
`--agent NAME`	使用指定名称的代理（独立记忆空间）
`--auto-approve`	跳过工具确认提示
`--sandbox TYPE`	在远程沙箱中执行（modal, daytona, runloop）
`--sandbox-id ID`	复用现有沙箱
`--sandbox-setup PATH`	在沙箱中运行设置脚本

代理管理命令

bash

# 列出所有代理
deepagents list

# 显示帮助信息
deepagents help

# 重置代理记忆
deepagents reset --agent NAME

# 从另一个代理复制记忆
deepagents reset --agent NAME --target SOURCE

交互模式

斜杠命令

在 CLI 交互界面中，可以使用以下斜杠命令：

命令	功能
`/tokens`	显示 Token 使用情况
`/clear`	清除对话历史
`/exit`	退出 CLI

Bash 前缀

使用 ! 前缀直接执行 Shell 命令：

bash

!git status
!npm test
!ls -la
!python --version

键盘快捷键

快捷键	功能
`Enter`	提交输入
`Alt+Enter`	插入换行
`Ctrl+E`	打开外部编辑器
`Ctrl+T`	切换自动批准模式
`Ctrl+C`	中断当前操作
`Ctrl+D`	退出 CLI

记忆系统

记忆优先协议（Memory-First Protocol）

DeepAgents CLI 最强大的特性之一是其持久记忆系统。代理遵循以下协议：

研究阶段（Research）：首先搜索记忆获取相关上下文
响应阶段（Response）：不确定时查询记忆
学习阶段（Learning）：自动保存新发现的信息

记忆存储位置

代理将信息存储在 ~/.deepagents/AGENT_NAME/memories/ 目录中，使用 Markdown 文件格式：

~/.deepagents/backend-dev/memories/
|-- api-conventions.md      # API 设计规范
|-- database-schema.md      # 数据库模式
|-- deployment-process.md   # 部署流程
|-- team-preferences.md     # 团队偏好

记忆组织建议

按主题组织记忆文件，便于代理快速检索：

~/.deepagents/frontend-dev/memories/
|-- react-patterns.md       # React 模式和最佳实践
|-- styling-guidelines.md   # 样式指南
|-- testing-strategy.md     # 测试策略
|-- build-config.md         # 构建配置

Skills 系统

什么是 Skills？

Skills（技能）是包含 SKILL.md 文件和相关资源（文档、脚本等）的文件夹。代理可以动态发现和加载这些技能，以更好地执行特定任务。

添加 Skills

bash

# 创建 Skills 目录
mkdir -p ~/.deepagents/agent/skills

# 复制现有 Skill
cp -r examples/skills/web-research ~/.deepagents/agent/skills/

查看可用 Skills

bash

deepagents skills list

Skills 在 DeepAgents CLI 启动时自动加载，扩展代理的能力。

远程沙箱执行

为什么使用沙箱？

在隔离环境中安全执行代码，避免对本地系统造成影响。适用于：

运行不受信任的代码
测试破坏性操作
模拟生产环境

支持的沙箱提供商

提供商	配置
Runloop	`export RUNLOOP_API_KEY="your-key"`
Daytona	`export DAYTONA_API_KEY="your-key"`
Modal	`modal setup`

使用沙箱启动

bash

# 使用 Runloop 沙箱
uvx deepagents-cli --sandbox runloop --sandbox-setup ./setup.sh

# 使用 Daytona 沙箱
deepagents --sandbox daytona

# 使用 Modal 沙箱
deepagents --sandbox modal

沙箱设置脚本示例

bash

#!/bin/bash
set -e

# 克隆项目仓库
git clone https://x-access-token:${GITHUB_TOKEN}@github.com/username/repo.git $HOME/workspace
cd $HOME/workspace

# 配置环境变量
cat >> ~/.bashrc <<'EOF'
export GITHUB_TOKEN="${GITHUB_TOKEN}"
export OPENAI_API_KEY="${OPENAI_API_KEY}"
cd $HOME/workspace
EOF

# 安装依赖
npm install
# 或
pip install -r requirements.txt

source ~/.bashrc

实际使用示例

示例 1：创建 Python 脚本

> Create a Python script that prints "Hello, World!"

代理会：

规划任务
生成代码
显示 diff 供您审批
等待确认后写入文件

示例 2：代码审查

> Review the code in src/main.py and suggest improvements

代理会：

读取文件内容
分析代码质量
提供改进建议
如果您同意，执行修改

示例 3：项目学习

> Learn about this project's architecture and save it to memory

代理会：

扫描项目结构
读取关键文件（README、配置文件等）
总结项目架构
保存到记忆文件供未来参考

示例 4：调试问题

> The tests in tests/test_api.py are failing. Help me debug.

代理会：

运行测试查看失败信息
分析错误原因
检索相关记忆（如 API 规范）
提出修复方案
等待您批准后执行修改

与 DeepAgents Python API 的关系

DeepAgents CLI 是 DeepAgents 框架的命令行界面封装。如果需要更多编程控制，可以直接使用 Python API：

python

from deepagents import create_deep_agent
from langchain.chat_models import init_chat_model

# 使用默认模型（Claude Sonnet 4）
agent = create_deep_agent(
    system_prompt="你是一个专业的 Python 开发助手"
)

# 使用 OpenAI 模型
model = init_chat_model("openai:gpt-4o")
agent = create_deep_agent(model=model)

# 调用代理
result = agent.invoke({
    "messages": [{"role": "user", "content": "帮我写一个快速排序算法"}]
})

最佳实践

1. 为不同项目创建独立代理

bash

# 后端开发代理
deepagents --agent backend-api

# 前端开发代理
deepagents --agent frontend-react

# 数据分析代理
deepagents --agent data-analysis

每个代理拥有独立的记忆空间，不会混淆不同项目的上下文。

2. 主动教导代理

> Remember: In this project, we use snake_case for Python variables
> and camelCase for JavaScript. Always follow PEP 8 for Python code.

代理会将这些规范保存到记忆中，在后续交互中自动遵循。

3. 定期整理记忆

检查 ~/.deepagents/AGENT_NAME/memories/ 目录，删除过时或不相关的记忆文件，保持记忆库的准确性。

4. 善用自动批准模式

对于低风险操作（如读取文件、运行测试），可以使用 --auto-approve 提高效率：

bash

deepagents --agent dev --auto-approve

但对于生产环境或敏感操作，建议保持手动审批。

总结

DeepAgents CLI 是一个强大的命令行 AI 代理工具，特别适合：

场景	优势
长期项目开发	持久记忆保留项目上下文
团队协作	通过共享记忆传递知识
复杂任务	任务规划和分解能力
安全执行	人工审批和沙箱支持

核心特性总结：

持久记忆系统 - 跨会话保留知识
记忆优先协议 - 先查记忆再响应
人机协作 - 敏感操作需确认
Skills 扩展 - 动态加载专业能力
沙箱执行 - 安全隔离环境

14.6 DeepAgents CLI - 命令行交互式 AI 代理 ​

🔥 2025 年三大 AI 代理工具对比 ​

🤖 Manus - 全球首款通用型 AI Agent ​

核心特点 ​

GAIA 基准测试成绩 ​

典型应用场景 ​

局限与争议 ​

🛠️ Claude Code - Anthropic 官方编码工具 ​

核心特点 ​

设计哲学 ​

Claude Agent SDK ​

⚖️ 三者定位对比 ​

概述 ​

核心功能 ​

内置能力 ​

工作流程 ​

安装与配置 ​

快速安装 ​

API Key 配置 ​

方式一：环境变量 ​

方式二：.env 文件 ​

默认模型 ​

命令行使用 ​

启动 CLI ​

命令行选项 ​

代理管理命令 ​

交互模式 ​

斜杠命令 ​

Bash 前缀 ​

键盘快捷键 ​

记忆系统 ​

记忆优先协议（Memory-First Protocol） ​

记忆存储位置 ​

记忆组织建议 ​

Skills 系统 ​

什么是 Skills？ ​

添加 Skills ​

查看可用 Skills ​

远程沙箱执行 ​

为什么使用沙箱？ ​

支持的沙箱提供商 ​

使用沙箱启动 ​

沙箱设置脚本示例 ​

实际使用示例 ​

示例 1：创建 Python 脚本 ​

示例 2：代码审查 ​

示例 3：项目学习 ​

示例 4：调试问题 ​

与 DeepAgents Python API 的关系 ​

最佳实践 ​

1. 为不同项目创建独立代理 ​

2. 主动教导代理 ​

3. 定期整理记忆 ​

4. 善用自动批准模式 ​

总结 ​

参考资料 ​

14.6 DeepAgents CLI - 命令行交互式 AI 代理

🔥 2025 年三大 AI 代理工具对比

🤖 Manus - 全球首款通用型 AI Agent

核心特点

GAIA 基准测试成绩

典型应用场景

局限与争议

🛠️ Claude Code - Anthropic 官方编码工具

核心特点

设计哲学

Claude Agent SDK

⚖️ 三者定位对比

概述

核心功能

内置能力

工作流程

安装与配置

快速安装

API Key 配置

方式一：环境变量

方式二：.env 文件

默认模型

命令行使用

启动 CLI

命令行选项

代理管理命令

交互模式

斜杠命令

Bash 前缀

键盘快捷键

记忆系统

记忆优先协议（Memory-First Protocol）

记忆存储位置

记忆组织建议

Skills 系统

什么是 Skills？

添加 Skills

查看可用 Skills

远程沙箱执行

为什么使用沙箱？

支持的沙箱提供商

使用沙箱启动

沙箱设置脚本示例

实际使用示例

示例 1：创建 Python 脚本

示例 2：代码审查

示例 3：项目学习

示例 4：调试问题

与 DeepAgents Python API 的关系

最佳实践

1. 为不同项目创建独立代理

2. 主动教导代理

3. 定期整理记忆

4. 善用自动批准模式

总结

参考资料