Skip to content

14.6 DeepAgents CLI - 命令行交互式 AI 代理

来源: LangChain DeepAgents 官方文档整理日期: 2025-12-15


🔥 2025 年三大 AI 代理工具对比

2025 年被业界普遍视为 AI 智能体商业化元年。三款代表性工具各具特色:

维度ManusClaude CodeDeepAgents CLI
开发商Butterfly Effect (Monica)AnthropicLangChain
发布时间2025 年 3 月2024 年末2025 年
定位通用型自主 AI Agent开发者编码助手可编程 AI 代理框架
运行环境云端虚拟机本地终端/IDE本地终端
核心特性完全自主执行Agentic 编码持久记忆系统
开源状态闭源(计划部分开源)开源开源

🤖 Manus - 全球首款通用型 AI Agent

参考来源: Manus 官网 | Wikipedia | OpenCV Blog

Manus(拉丁语意为"手")由新加坡 Butterfly Effect 公司(原 Monica 团队)研发,于 2025 年 3 月 6 日发布。

核心特点

  1. 完全自主执行:打破传统 AI 同步响应模式

    • 下达任务后可关闭电脑,Agent 在云端独立运行
    • 任务完成后主动通知用户
    • 实现"人在休息,事在进行"
  2. 多智能体架构:任务拆解为规划、执行、验证三模块

    用户指令 → [规划 Agent] → [执行 Agent] → [验证 Agent] → 结果输出
  3. CodeAct 机制:使用可执行 Python 代码作为行动载体

  4. 工具集成:自动调用浏览器、代码编辑器、数据库等工具

GAIA 基准测试成绩

任务级别ManusOpenAI Deep Research
Level 1 (基础)86.5%74.3%
Level 2 (中级)70.1%69.1%
Level 3 (复杂)57.7%47.6%

典型应用场景

  • 📊 数据分析:股票预测模型、市场报告
  • 📝 办公自动化:筛选简历、制作 PPT、生成表格
  • 🏠 生活服务:房产筛选、保险比价、旅行规划
  • 💻 编程开发:网页代码、小游戏开发

局限与争议

  • 内测邀请码被炒至数万元,等待名单超 200 万人
  • 存在循环错误、执行失败等稳定性问题
  • 安全研究者对"无人监督"模式提出担忧

🛠️ Claude Code - Anthropic 官方编码工具

参考来源: Claude Code 官网 | GitHub | 官方文档

Claude Code 是 Anthropic 推出的 Agentic 编码工具,直接运行在开发者的终端和 IDE 中。

核心特点

  1. 终端原生:不是聊天窗口,而是融入你现有的工作流

    bash
    npm install -g @anthropic-ai/claude-code
    claude
  2. 深度代码库理解

    • 自动分析项目结构
    • 理解代码依赖关系
    • 执行文件编辑、命令运行、Git 操作
  3. MCP 协议集成

    • 连接 Google Drive 读取设计文档
    • 更新 Jira 任务状态
    • 接入自定义开发工具
  4. 多平台支持

    • 终端 CLI
    • VS Code / Cursor / Windsurf 扩展
    • JetBrains IDE 扩展
    • GitHub @claude 标签

设计哲学

"Claude Code is intentionally low-level and unopinionated, providing close to raw model access without forcing specific workflows."

  • 底层化:接近原始模型访问
  • 不预设立场:不强制特定工作流
  • 灵活可扩展:通过 Hooks、Skills、MCP 自定义

Claude Agent SDK

Claude Code 已演化为通用 Agent 框架 Claude Agent SDK,支持:

  • 深度研究
  • 视频创作
  • 笔记整理
  • 以及几乎所有 Agent 循环场景

⚖️ 三者定位对比

┌─────────────────────────────────────────────────────────────────┐
│                        自主程度 (Autonomy)                        │
│                              ↑                                   │
│                              │                                   │
│                         ┌────┴────┐                              │
│                         │  Manus  │ ← 完全自主,云端异步          │
│                         └────┬────┘                              │
│                              │                                   │
│              ┌───────────────┼───────────────┐                   │
│              │               │               │                   │
│      ┌───────┴───────┐ ┌────┴────┐ ┌────────┴────────┐          │
│      │ DeepAgents CLI │ │         │ │   Claude Code   │          │
│      │ (持久记忆+审批) │ │         │ │ (编码专精+MCP)  │          │
│      └───────────────┘ │         │ └─────────────────┘          │
│                        │         │                               │
│ ←─────────────────────────────────────────────────────────────→ │
│    可编程性 (Programmability)           编码专精 (Coding Focus)   │
└─────────────────────────────────────────────────────────────────┘
选择建议推荐工具
需要完全自主、异步执行复杂任务Manus
专注于日常编码、Git 工作流Claude Code
需要持久记忆、可编程扩展DeepAgents CLI
构建自定义 Agent 应用Claude Agent SDK / DeepAgents

概述

DeepAgents CLI 是一个交互式命令行界面工具,用于构建具有持久记忆能力的 AI 代理。它使代理能够跨会话保持上下文,学习项目约定,并在人类审批控制下执行代码。

与传统的一次性对话不同,DeepAgents CLI 的核心优势在于:

  • 记忆持久化(Memory Persistence):代理可以"记住"之前会话中学到的信息
  • 项目感知(Project Awareness):理解项目结构、代码规范和部署流程
  • 人机协作(Human-in-the-Loop):敏感操作需要人类确认,确保安全可控

核心功能

内置能力

功能说明
文件操作读取、写入、编辑项目文件
Shell 命令执行运行测试、管理依赖、与版本控制交互
网络搜索查询互联网获取信息(需要 Tavily API Key)
HTTP 请求与外部 API 集成
任务规划分解复杂工作并跟踪进度
记忆存储跨会话保留信息
人工审批敏感操作需要确认才能执行

工作流程

+------------------+     +------------------+     +------------------+
|   用户输入任务   | --> |   代理规划任务   | --> |   执行并审批     |
+------------------+     +------------------+     +------------------+
        |                        |                        |
        v                        v                        v
+------------------+     +------------------+     +------------------+
|   检索相关记忆   |     |   创建 Todo 列表 |     |   保存新知识     |
+------------------+     +------------------+     +------------------+

安装与配置

快速安装

使用 uvx(推荐,无需安装)

bash
uvx deepagents-cli

使用 pip 本地安装

bash
pip install deepagents-cli

使用 uv 安装

bash
uv pip install deepagents-cli

API Key 配置

方式一:环境变量

bash
# Anthropic Claude(默认模型)
export ANTHROPIC_API_KEY="your-api-key"

# OpenAI(可选替代)
export OPENAI_API_KEY="your-key"

# Tavily(启用网络搜索,可选)
export TAVILY_API_KEY="your-key"

方式二:.env 文件

在项目根目录创建 .env 文件:

env
ANTHROPIC_API_KEY=your-api-key
OPENAI_API_KEY=your-key
TAVILY_API_KEY=your-key

默认模型

DeepAgents CLI 默认使用 Claude Sonnet 4。如果设置了 OPENAI_API_KEY 环境变量,也可以切换到 OpenAI 模型。

命令行使用

启动 CLI

bash
# 默认启动
deepagents

# 使用 uvx 启动(无需安装)
uvx deepagents-cli

# 指定代理名称(使用独立记忆)
deepagents --agent backend-dev

# 自动批准模式(跳过确认提示)
deepagents --auto-approve

命令行选项

选项说明
--agent NAME使用指定名称的代理(独立记忆空间)
--auto-approve跳过工具确认提示
--sandbox TYPE在远程沙箱中执行(modal, daytona, runloop)
--sandbox-id ID复用现有沙箱
--sandbox-setup PATH在沙箱中运行设置脚本

代理管理命令

bash
# 列出所有代理
deepagents list

# 显示帮助信息
deepagents help

# 重置代理记忆
deepagents reset --agent NAME

# 从另一个代理复制记忆
deepagents reset --agent NAME --target SOURCE

交互模式

斜杠命令

在 CLI 交互界面中,可以使用以下斜杠命令:

命令功能
/tokens显示 Token 使用情况
/clear清除对话历史
/exit退出 CLI

Bash 前缀

使用 ! 前缀直接执行 Shell 命令:

bash
!git status
!npm test
!ls -la
!python --version

键盘快捷键

快捷键功能
Enter提交输入
Alt+Enter插入换行
Ctrl+E打开外部编辑器
Ctrl+T切换自动批准模式
Ctrl+C中断当前操作
Ctrl+D退出 CLI

记忆系统

记忆优先协议(Memory-First Protocol)

DeepAgents CLI 最强大的特性之一是其持久记忆系统。代理遵循以下协议:

  1. 研究阶段(Research):首先搜索记忆获取相关上下文
  2. 响应阶段(Response):不确定时查询记忆
  3. 学习阶段(Learning):自动保存新发现的信息

记忆存储位置

代理将信息存储在 ~/.deepagents/AGENT_NAME/memories/ 目录中,使用 Markdown 文件格式:

~/.deepagents/backend-dev/memories/
|-- api-conventions.md      # API 设计规范
|-- database-schema.md      # 数据库模式
|-- deployment-process.md   # 部署流程
|-- team-preferences.md     # 团队偏好

记忆组织建议

按主题组织记忆文件,便于代理快速检索:

~/.deepagents/frontend-dev/memories/
|-- react-patterns.md       # React 模式和最佳实践
|-- styling-guidelines.md   # 样式指南
|-- testing-strategy.md     # 测试策略
|-- build-config.md         # 构建配置

Skills 系统

什么是 Skills?

Skills(技能)是包含 SKILL.md 文件和相关资源(文档、脚本等)的文件夹。代理可以动态发现和加载这些技能,以更好地执行特定任务。

添加 Skills

bash
# 创建 Skills 目录
mkdir -p ~/.deepagents/agent/skills

# 复制现有 Skill
cp -r examples/skills/web-research ~/.deepagents/agent/skills/

查看可用 Skills

bash
deepagents skills list

Skills 在 DeepAgents CLI 启动时自动加载,扩展代理的能力。

远程沙箱执行

为什么使用沙箱?

在隔离环境中安全执行代码,避免对本地系统造成影响。适用于:

  • 运行不受信任的代码
  • 测试破坏性操作
  • 模拟生产环境

支持的沙箱提供商

提供商配置
Runloopexport RUNLOOP_API_KEY="your-key"
Daytonaexport DAYTONA_API_KEY="your-key"
Modalmodal setup

使用沙箱启动

bash
# 使用 Runloop 沙箱
uvx deepagents-cli --sandbox runloop --sandbox-setup ./setup.sh

# 使用 Daytona 沙箱
deepagents --sandbox daytona

# 使用 Modal 沙箱
deepagents --sandbox modal

沙箱设置脚本示例

bash
#!/bin/bash
set -e

# 克隆项目仓库
git clone https://x-access-token:${GITHUB_TOKEN}@github.com/username/repo.git $HOME/workspace
cd $HOME/workspace

# 配置环境变量
cat >> ~/.bashrc <<'EOF'
export GITHUB_TOKEN="${GITHUB_TOKEN}"
export OPENAI_API_KEY="${OPENAI_API_KEY}"
cd $HOME/workspace
EOF

# 安装依赖
npm install
# 或
pip install -r requirements.txt

source ~/.bashrc

实际使用示例

示例 1:创建 Python 脚本

> Create a Python script that prints "Hello, World!"

代理会:

  1. 规划任务
  2. 生成代码
  3. 显示 diff 供您审批
  4. 等待确认后写入文件

示例 2:代码审查

> Review the code in src/main.py and suggest improvements

代理会:

  1. 读取文件内容
  2. 分析代码质量
  3. 提供改进建议
  4. 如果您同意,执行修改

示例 3:项目学习

> Learn about this project's architecture and save it to memory

代理会:

  1. 扫描项目结构
  2. 读取关键文件(README、配置文件等)
  3. 总结项目架构
  4. 保存到记忆文件供未来参考

示例 4:调试问题

> The tests in tests/test_api.py are failing. Help me debug.

代理会:

  1. 运行测试查看失败信息
  2. 分析错误原因
  3. 检索相关记忆(如 API 规范)
  4. 提出修复方案
  5. 等待您批准后执行修改

与 DeepAgents Python API 的关系

DeepAgents CLI 是 DeepAgents 框架的命令行界面封装。如果需要更多编程控制,可以直接使用 Python API:

python
from deepagents import create_deep_agent
from langchain.chat_models import init_chat_model

# 使用默认模型(Claude Sonnet 4)
agent = create_deep_agent(
    system_prompt="你是一个专业的 Python 开发助手"
)

# 使用 OpenAI 模型
model = init_chat_model("openai:gpt-4o")
agent = create_deep_agent(model=model)

# 调用代理
result = agent.invoke({
    "messages": [{"role": "user", "content": "帮我写一个快速排序算法"}]
})

最佳实践

1. 为不同项目创建独立代理

bash
# 后端开发代理
deepagents --agent backend-api

# 前端开发代理
deepagents --agent frontend-react

# 数据分析代理
deepagents --agent data-analysis

每个代理拥有独立的记忆空间,不会混淆不同项目的上下文。

2. 主动教导代理

> Remember: In this project, we use snake_case for Python variables
> and camelCase for JavaScript. Always follow PEP 8 for Python code.

代理会将这些规范保存到记忆中,在后续交互中自动遵循。

3. 定期整理记忆

检查 ~/.deepagents/AGENT_NAME/memories/ 目录,删除过时或不相关的记忆文件,保持记忆库的准确性。

4. 善用自动批准模式

对于低风险操作(如读取文件、运行测试),可以使用 --auto-approve 提高效率:

bash
deepagents --agent dev --auto-approve

但对于生产环境或敏感操作,建议保持手动审批。

总结

DeepAgents CLI 是一个强大的命令行 AI 代理工具,特别适合:

场景优势
长期项目开发持久记忆保留项目上下文
团队协作通过共享记忆传递知识
复杂任务任务规划和分解能力
安全执行人工审批和沙箱支持

核心特性总结

  1. 持久记忆系统 - 跨会话保留知识
  2. 记忆优先协议 - 先查记忆再响应
  3. 人机协作 - 敏感操作需确认
  4. Skills 扩展 - 动态加载专业能力
  5. 沙箱执行 - 安全隔离环境

参考资料

基于 MIT 许可证发布。内容版权归作者所有。