什么是LLM Agent？其核心组成部分（LLM+Planning+Memory+Tools）如何协同工作？ LLM Agent 是一种利用大型语言模型 (LLM)作为其核心“大脑”的智能体（或称代理）。它不仅仅能理解和生成文本，还能进行自主决策、调用外部工具、从经验中学习，并执行复杂的任务以达成特定目标。其核心组成部分协同工作方式如下： 1. LLM (大型语言模型): 作为核心引擎，LLM 负责理解用户指令、自然语言、进行常识推理、生成回应、制定初步计划以及决定何时使用何种工具。 2. Planning (规划): - 任务分解: LLM首先会将一个复杂的目标分解成一系列更小、更易于管理的可执行步骤。 - 反思与调整: Agent会评估行动的结果，如果遇到问题或环境发生变化，LLM会重新审视计划并进行动态调整。 3. Memory (记忆): - 短期记忆: 用于跟踪当前任务的上下文信息，例如用户最近的指令、上一步行动的结果等。 - 长期记忆: 存储从过去经验中学习到的知识、成功的策略、失败的教训等，使得Agent能够持续改进，并在未来任务中表现更好。记忆使得Agent能够保持连贯性并进行长期学习。 4. Tools (工具): Tools 扩展了LLM的能力边界。当LLM意识到自身无法直接完成某项任务时（例如，获取实时信息、执行代码、访问数据库、操作某个应用API），它会决定调用一个合适的工具。工具执行任务后，会将结果返回给LLM，LLM再基于这个新信息继续规划和行动。协同工作流程示例: 假设用户指令是：“帮我查一下明天北京的天气，并根据天气情况建议我是否需要带伞，然后将建议发送到我的邮箱。” 1. LLM 理解与初步规划: LLM 理解任务包含：查询天气、根据天气判断是否带伞、发送邮件。 2. 工具选择与调用 (Tool Use): - LLM 决定使用“天气查询工具”获取北京明天天气。 - Agent 执行工具调用，工具返回天气信息（例如，“晴转多云，降水概率20%”）。 3. LLM 推理与决策: LLM 接收到天气信息，根据常识判断“降水概率20%”意味着不太可能下雨，因此建议“不需要带伞”。 4. 记忆更新 (Memory): Agent 可能会将这次查询和判断的过程及结果存入短期记忆，如果任务更复杂，相关的经验可能被提炼并存入长期记忆。 5. 再次工具选择与调用: LLM 决定使用“邮件发送工具”。 6. LLM 生成内容: LLM 生成邮件内容，如：“明天北京天气晴转多云，降水概率较低，建议您不需要带伞。” 7. 执行与反馈: Agent 调用邮件工具将邮件发送出去。工具返回发送成功或失败的状态。 8. 任务完成/调整: 如果发送成功，任务完成。如果失败，LLM会分析失败原因（例如邮箱地址错误），并可能尝试修正或向用户请求更正信息（体现规划的动态调整）。通过这种 LLM 驱动的规划、记忆存储与检索、以及工具调用的循环，Agent 能够自主地完成复杂任务。

视频地址

封面地址

Provider