初始智能体
智能体: 能够通过 传感器 感知其所处的环境,并自主通过 执行器 采取行动以达成特定目标的实体。
- 传感器:摄像头、麦克风、雷达、各类应用程序编程接口返回的数据流等。
- 执行器:物理设备(机械臂、方向盘);虚拟工具(执行一段代码、调用一个服务)
智能体的演进
- 反射智能体:单一的条件判断和执行
- 基于模型的反射智能体:条件非单一,拥有内部的 世界模型,基于此追踪和理解并做出动作
- 基于目标的智能体:有预见性,主动性
- 基于效用的智能体:评分,赋值,得出最有效的选择
- 学习智能体:基于之前决策的评分 -> 不断 强化学习,修正决策策略
传统智能体与 LLM 驱动智能体
| 对比纬度 | 传统智能体 | LLM 驱动智能体 |
|---|---|---|
| 核心引擎 | 基于显示编程的逻辑结构 | 基于预训练模型的推理引擎 |
| 知识来源 | 预定义的规则、算法、知识库 | 海量非结构化数据中间接学习、内化 |
| 工作模式 | 确定性、可预测的 | 概率性的、生成式的 |
| 泛化能力 | 弱,局限于预设框架 | 强,具备强大的涌现、范化能力 |
| 开发范式 | 规则设计、算法编程、知识工程 | 模型训练、提示工程、微调 |
智能体的类型
- 反应式智能体 - 即时性,但是短视
- 规划式智能体 - 效用性,但是耗时
- 混合式智能体 - 分层设计:底层是快速反应的模块、高层是审视模块
大语言模型驱动的智能体,是神经符号主义的。
- 内核是巨大的神经网络,具备模式识别和语言生成能力(亚符号主义 AI)
- 当他工作时,会生成一系列结构化的中间步骤,如思想、计划、API 调用。