artificial intelligence (AI) agent
是无需人工干预即可执行特定任务的自主(autonomous)智能系统。
介绍
AI Agent
在人类下达复杂指令(prompt)以后,利用感知到的环境资讯,结合指令内容,自行做出计划,将其分解成不同步骤,并采取相应行动;在执行任务以后,它还能够把行动后接收到的回馈,用以改进自己的行为,转变为下次出任务的养分。
AI Agent
有称为 AI智能体
、AI代理
- AI Model 与 AI Agent 对比
对比项 |
模型 |
Agent |
知识 |
知识有截止日期(cutoff date),仅具备训练资料中的知识。 |
可以利用外部搜寻工具,扩展知识的范围。 |
脉络 |
以单次查询回应为主,除非在指令中特别提醒,否则无法「想起」先前对话内容。 |
能够记录并管理多轮对话的历史,因此对话时较能掌握脉络。 |
工具 |
无法调用工具。 |
能够调用工具。 |
推理 |
使用者仅能尽量利用提示工程(prompt engineering)技巧引导。 |
可以调用 ReAct 等推理框架。 |
-
Agent 常见分类
- simple reflex agents
- model-based agents
- goal-based agents
- utility-based agents
- learning agents
- and so on
-
一个精简的 Agent 决策流程:
感知(Perception)
是指 Agent 从环境中收集信息并从中提取相关知识的能力
规划(Planning)
是指 Agent 为了某一目标而作出的决策过程
行动(Action)
是指基于环境和规划做出的动作
Policy
是 Agent 做出 Action
的核心决策,而 行动
又通过 观察(Observation)
成为进一步 Perception
的前提和基础,形成自主的闭环学习过程
- 相关的用函数表达式
Agent:Perception(感知)—> Planning(规划)—> Action(行动)
Agent = LLM + Planning + Feedback + Tool use
使用最多的智能体
AI 编程助手
工具名称 |
核心功能 |
智能程度 |
用户控制 |
适用场景 |
Cline |
文件操作、命令执行、上下文分析 |
高 |
强 |
综合开发辅助 |
GitHub Copilot |
智能代码补全 |
中 |
弱 |
快速补全和生成代码 |
Continue |
代码解释和重构 |
中 |
弱 |
不太好用 |
Tabnine |
基于上下文的代码补全 |
中 |
弱 |
单文件代码开发 |
- CodeGeeX
- AWS Toolkit
- 阿里通义灵码
- cline、continue、cursor、windsurf 等等
- codeium: AI Coding Autocomplete for Python
- Copilot 主要基于上下文进行插入代码的操作