🤖 从 Prompt 到 Agent

大模型交互范式的三次跃迁:指令工程 → 上下文编排 → 自主智能体
            %%{init: {'theme': 'base', 'themeVariables': {
                'background': '#ffffff',
                'primaryColor': '#2c7a5e',
                'primaryBorderColor': '#1f5e49',
                'primaryTextColor': '#043341',
                'lineColor': '#2c7a5e',
                'secondaryColor': '#e6f4ef',
                'tertiaryColor': '#fff',
                'textColor': '#043341',
                'fontSize': '16px',
                'fontFamily': 'Inter, system-ui, sans-serif'
            }}}%%
            timeline
                title AI 交互范式演进 · 清晰路线图
                section 提示词工程
                    2021-2022 : 精心设计指令与few-shot
                              : 单轮对话 / 无工具调用
                              : 模型为“更强的补全器”
                section 上下文增强 / 链式
                    2023-2024 : RAG 检索增强生成
                              : 思维链 CoT / ReAct
                              : 预定义工具链调用
                section 自主智能体
                    2024-2025 : 动态规划与自我反思
                              : Agent Skills 技能封装
                              : MCP 标准化连接协议
                              : 多智能体协作与长期记忆
        
📈 模型从“被动响应”走向“目标驱动” · 每个阶段文字超高对比
📝 阶段 1: 提示词工程 (Prompt Engineering) 2021 – 2022

大模型最初被视为“更强的补全器”。为了让模型输出理想结果,开发者投入大量精力设计精巧的指令、few-shot 示例和角色扮演。这个阶段模型没有记忆外部状态,也不具备行动能力,输出完全依赖静态提示。

  • 🧠 依赖“咒语”般的提示词技巧
  • 📄 无长期记忆,无工具调用
  • ⚠️ 脆弱性高,提示微调导致结果剧变
  • 🎭 代表作:ChatGPT、GPT-3.5 早期玩法
// 经典提示词模板
> 你是一位资深数据分析师。
> 请根据以下销售数据:
  一月: 240万, 二月: 210万
> 分析趋势并给出建议。
[模型输出纯文本分析]
❌ 无法查实时数据库
❌ 不会调用任何API
🔗 阶段 2: 上下文增强 & 链式编排 (RAG + Chain) 2023 – 2024

为解决知识截止和复杂任务,出现了检索增强生成(RAG)链式调用(LangChain)。模型可以先检索外部知识库,再将多步骤任务拆解为“思考-行动”链,但仍依赖硬编码流程。

  • 📚 向量数据库 + 外部文档检索
  • 🧩 思维链 CoT / ReAct 初步尝试
  • ⚙️ 预定义工具调用 (搜索/计算器)
  • 🔄 代表:LangChain, LlamaIndex
// 链式伪代码
chain = 检索文档LLM总结工具执行
if 需要天气:
  call_api(weather_api)
→ 输出最终答案
✅ 能访问有限工具
⚠️ 流程静态,无自主决策
🧠 阶段 3: 自主智能体 (Agent) 时代 2024 – 现在

智能体不仅拥有长期记忆 + 规划能力 + 工具使用 + 自我反思,还能动态决策调用哪个技能、如何组合工具。配合 Agent Skills(技能封装)MCP(模型上下文协议),Agent 能安全地连接企业数据和外部世界。

  • 🎯 目标驱动:拆解任务,自主规划
  • 🛠️ 工具集丰富:代码解释器、浏览器、API
  • 🧪 自我纠错:观察结果并调整计划
  • 🔌 MCP 标准化连接,Skills 复用封装
// Agent 循环伪代码
while 目标未完成:
  思考: 下一步动作?
  选择技能: send_report / query_db
  通过 MCP 调用工具
  观察结果 → 记忆更新
  如果失败则重新规划
✅ 自主性 & 鲁棒性飞跃

🧩 现代 Agent 核心架构 (感知-规划-行动)

            flowchart TB
                User([用户输入]) --> Memory[长期记忆 & 短期记忆]
                Memory --> Planner[规划模块 Planner]
                Planner --> |分解子目标| Executor[执行器 Executor]
                Executor --> Skills{Agent Skills 技能库}
                Skills --> |调用| MCP[MCP 协议层]
                MCP --> Tools[(外部工具 / APIs)]
                Tools --> Observer[观察者 Observer]
                Observer --> |反馈| Planner
                Observer --> |最终答案| User
                
                subgraph Skills_Layer [技能封装层]
                    Skill1[发邮件技能]
                    Skill2[SQL查询技能]
                    Skill3[报告生成技能]
                end
                Skills --- Skills_Layer
                
                subgraph MCP_Server [MCP 标准化服务器]
                    direction LR
                    Res[Resources 数据资源]
                    T[Tools 可执行工具]
                    P[Prompts 模板]
                end
                MCP --- MCP_Server
        
✨ Agent 动态循环:规划 → 执行 → 观察 → 反思 → 再规划

⚙️ Agent Skills 与 MCP:让智能体从“玩具”变“工具”

📦 Agent Skills

将原子操作(API调用、代码逻辑)封装为可复用的技能模块,类似给智能体安装“功能App”。
✅ 降低推理复杂度 ✅ 提升稳定性 ✅ 便于权限管理。

技能示例: send_report(to, format) → 调用内部邮件API + 生成PDF
🔌 MCP (Model Context Protocol)

Anthropic 提出的开放协议,标准化 LLM 与数据源/工具的交互。通过统一的 Resources / Tools / Prompts 原语,实现“即插即用”的安全连接。

MCP 服务器暴露本地文件 + 数据库 + 第三方 API,智能体无需关心实现细节。

💡 二者结合:高层 Skills 调用底层 MCP 工具,实现业务语义 + 标准化基础设施的最佳实践。

📊 核心能力对比:Prompt → RAG → Agent

维度Prompt EngineeringRAG / ChainAgent (智能体)
交互模式单轮问答多步固定流水线动态循环决策
工具使用预置工具调用(硬编码)自主选择工具 + 组合技能
记忆能力上下文窗口内向量检索记忆长期 + 短期 + 工作记忆
规划能力思维链提示任务分解 / 反思 / 重规划
可扩展性低(重新设计提示)中(增加链条步骤)高(新增 Skills 或 MCP 服务器)
典型框架OpenAI API, ClaudeLangChain, LlamaIndexAutoGPT, LangGraph, CrewAI
            quadrantChart
                title 智能体成熟度演进 (自主性 vs 任务复杂度)
                x-axis "低自主性" --> "高自主性"
                y-axis "简单任务" --> "复杂任务"
                quadrant-1 "自主智能体"
                quadrant-2 "RAG / 工作流编排"
                quadrant-3 "传统规则 / Prompt"
                quadrant-4 "半自动工具流"
                "传统规则": [0.08, 0.1]
                "Prompt(2022)": [0.22, 0.16]
                "RAG+链(2023)": [0.38, 0.58]
                "工作流Agent(2024)": [0.62, 0.42]
                "初代Agent(2024)": [0.72, 0.72]
                "MCP+Skills(2025+)": [0.82, 0.86]
        
📌 智能体正快速进入高自主性、高复杂度任务区域
📜 从 Prompt 到 Agent 的代码思维演变(伪代码对比)
// 🧾 提示词时代
response = openai.Completion.create(
  prompt="写一首关于AI的诗",
  max_tokens=200
)
// 🔗 RAG + Chain 时代
docs = vector_store.similarity_search(query)
context = format_docs(docs)
answer = llm.predict(context + query)
if need_weather: call_weather_api()
// 🤖 Agent 时代
agent = create_agent(tools=[skill1, skill2])
agent.run("分析Q2销售,发送异常提醒")
# Agent 内部循环: 规划→执行→反思→完成

🚀 关键洞察:为何 Agent 是必然趋势?