A conceptual introduction of AI Agent -- Shanghai Liberal Software Consulting

你好，世界！

最近，AI Agent 已经成为人工智能领域最令人兴奋的方向之一。从能够自主编写代码的 Claude Code，到可以协助日常工作的 OpenClaw 和 Hermes，这些智能体正在改变我们与计算机交互的方式。然而，要真正理解这些强大工具的工作原理，最好的方法莫过于了解其基本原理和构建方法。本文将为您简要地介绍 AI Agent 的核心概念、开发流程和关键考量，希望你在使用和构建时能够做到心中有数。

AI Agent 基础概念

AI Agent（人工智能体）是一种能够使用人工智能技术自主达成目标的程序。与传统的程序不同，AI Agent 不仅仅是执行预设的指令，它能够感知环境、进行推理，并在环境中采取行动。Agent 通常运行在一个循环中，直到达到预设的目标为止。

一个典型的 AI Agent 具有以下特征：

自主性：能够在没有人类直接干预的情况下运作
反应性：能够感知环境变化并做出响应
主动性：能够采取主动行为来实现目标
社会性：能够与其他 Agent 或人类进行交互

构建一个最基本的 AI Agent，只需要四个核心组件：

主循环（Loop）：保持 Agent 持续运行的机制
LLM 连接：与强大 AI 模型（通常是大语言模型）的接口
用户输入：让用户传达目标的途径
上下文管理：保存对话历史，确保 Agent 不会遗忘关键信息

这看似简单，但它本质上是一个能够执行复杂任务的智能对话系统，在后续开发中，我们可以逐步为其添加更强大的功能。

工具系统：赋予 Agent 行动能力

工具是暴露给 LLM 的函数或程序，允许 Agent 自主调用它们来执行特定操作。工具可以是简单的函数，也可以是复杂的 API 调用。通过工具系统，Agent 从只能"说话"的聊天机器人，进化为能够"行动"的智能体。一个实用的 AI Agent 通常需要以下几类基础工具：

文件操作工具

读取文件（read_file）：允许 Agent 查看文件内容，支持指定行数和偏移量，是 Agent 理解代码库的基础。
写入文件（write_file）：让 Agent 能够创建新文件或覆盖现有文件，自动创建缺失的目录。
编辑文件（edit_file）：执行精确的字符串替换，比完全重写文件更安全，特别适合代码修改场景。

文件系统探索工具

文件搜索（glob_files）：使用模式匹配查找文件，帮助 Agent 了解项目结构。
内容搜索（grep）：使用正则表达式搜索文件内容，返回匹配行及其位置，与文件搜索工具形成互补。

系统交互工具

执行命令（run_bash）：最强大的工具，允许 Agent 执行任意 shell 命令，使其能够与系统深度交互。
网页获取（webfetch）：获取网页内容并转换为纯文本，让 Agent 获取外部信息。

现代 LLM 已经支持原生工具调用功能，通过 JSON 格式的结构化输出来请求工具执行。Agent 框架需要：

定义工具的模式（schema），包括名称、描述和参数
将工具模式传递给 LLM
解析 LLM 返回的工具调用请求
执行相应的函数并返回结果
将结果反馈给 LLM 以继续推理

任务规划：处理复杂长期任务

当 Agent 面对复杂任务时，简单的"一问一答"模式会暴露明显的局限：缺乏长期思考、容易半途而废、无法有效管理多步骤任务。为了克服这些限制，需要为 Agent 配备规划能力。这就需要实现一些规划工具，比如：

暂存器（Scratchpad）

暂存器是 Agent 的"工作记忆"，用于存储思考过程、计划方案和中间发现。使用暂存器的核心优势是：

强制 Agent 在行动前进行思考
提供持续的推理上下文
帮助 Agent 在长任务中保持一致性

待办事项列表（To-Do List）

待办列表让 Agent 能够将复杂任务分解为可管理的步骤，并跟踪每个步骤的状态。状态包括：

pending（待处理）：计划但尚未开始
in_progress（进行中）：正在处理（同一时间只允许一个）
done（已完成）：成功完成
cancelled（已取消）：不再需要
failed（失败）：尝试但未成功

待办列表可以包含重试计数，防止 Agent 在同一个失败任务上无限循环。

规划策略

策略的规划是让智能体具有自主思考能力的关键。在系统提示中，我们应为 Agent 定义清晰的规划流程，比如：

理解目标：用自己的话重新表述任务目标
调查现状：检查相关文件和代码结构
评估选项：考虑多种方法并解释选择理由
预判失败：思考可能出现的问题及诊断方法
执行单步：确定并执行下一步具体行动

当工具执行结果与预期不符时，Agent 需要重新规划：诊断问题、标记失败任务、选择恢复策略（重试、替换或重新排序）。

完成检测

Agent 不应仅凭待办列表为空就判定任务完成，而且更应该对结果作出自我验证，验证内容可以包括：

结构完整：确认所有任务项都已处理
验证通过：运行测试或检查，确保输出符合目标
消除不确定性：检查是否有未解决的疑问或假设

人机协作与安全

随着 Agent 能力的增强，其潜在风险也在增加。能够读写文件、执行命令的 Agent，如果不加约束，可能造成不可逆的损害。人机协作机制确保在关键操作前获得人类确认。

工具风险分类

不同工具具有不同的风险等级，管理相关风险非常重要。比如可以设置工具的风险等级和使用策略：

低风险（自动允许）：只读文件系统工具、规划工具
中风险（条件允许）：写文件工具（在项目目录内自动允许）
高风险（始终询问）：执行命令、网络获取、项目外写文件

权限模式

为适应不同使用场景，建议为 Agent 提供多种权限模式，以防 Agent 跑飞。比如可以设置工具权限：

default（默认）：只读和规划工具自动允许，其余需要确认
acceptEdits（接受编辑）：项目目录内的写操作自动允许，项目外需要确认
dangerouslySkipPermissions（危险跳过权限）：所有操作自动允许（仅限受控环境）

主动提问

除了被动等待权限确认，Agent 还应能够主动提问。当 Agent 遇到信息不足或多种可能性时，可以调用 `ask_question` 工具向用户请求澄清。这比盲目猜测更安全，也能避免错误方向带来的浪费。

权限检查流程

Agent 的工具调用流程应当集成权限检查：

Agent 请求调用工具
框架检查工具类型和当前权限模式
如果需要权限，向用户显示工具名称和参数
用户选择允许或拒绝
如果允许，执行工具并返回结果
如果拒绝，返回
C限被拒绝
信息，Agent 需调整策略

AI Agent 的开发是一个融合了多个领域的复杂工程，涉及大语言模型、工具系统、任务规划和安全管理等方面。通过从零构建一个基础 Agent，有助于真正理解其内部工作原理，为后续的优化和应用打下坚实基础。从最简 Agent 循环，到工具系统、任务规划，再到人机协作与安全——构成了一个相对完整的 Agent 开发路径。

实践中，我们建议以下步骤：

从简单开始：先构建最简 Agent 循环，理解核心概念
逐步增加功能：按工具、规划、安全的顺序逐步增强
重视系统提示：清晰、详细、结构化的系统提示对 Agent 行为至关重要
测试与迭代：在真实场景中测试 Agent，持续改进
安全优先：从第一天起就考虑权限和安全性，而不是事后补救

AI Agent 领域仍在快速发展，新的技术和范式不断涌现。掌握这些基础能力后，您就可以更好地理解和运用 MCP（模型上下文协议）、多 Agent 协作、自主决策等更高级的特性。希望本文能为您的 AI Agent 开发之旅提供一个清晰、实用的起点。

如果你希望自己的 AI 系统丰富多彩，那么立伯乐或许可以帮你。

让自由软件带你进入的美好自由世界！

A conceptual introduction of AI Agent — Mo 22 Juni 2026