🤖 从 Prompt 到 Agent

大模型交互范式的三次跃迁：指令工程 → 上下文编排 → 自主智能体

            %%{init: {'theme': 'base', 'themeVariables': {
                'background': '#ffffff',
                'primaryColor': '#2c7a5e',
                'primaryBorderColor': '#1f5e49',
                'primaryTextColor': '#043341',
                'lineColor': '#2c7a5e',
                'secondaryColor': '#e6f4ef',
                'tertiaryColor': '#fff',
                'textColor': '#043341',
                'fontSize': '16px',
                'fontFamily': 'Inter, system-ui, sans-serif'
            }}}%%
            timeline
                title AI 交互范式演进 · 清晰路线图
                section 提示词工程
                    2021-2022 : 精心设计指令与few-shot
                              : 单轮对话 / 无工具调用
                              : 模型为“更强的补全器”
                section 上下文增强 / 链式
                    2023-2024 : RAG 检索增强生成
                              : 思维链 CoT / ReAct
                              : 预定义工具链调用
                section 自主智能体
                    2024-2025 : 动态规划与自我反思
                              : Agent Skills 技能封装
                              : MCP 标准化连接协议
                              : 多智能体协作与长期记忆

📈 模型从“被动响应”走向“目标驱动” · 每个阶段文字超高对比

📝 阶段 1: 提示词工程 (Prompt Engineering) 2021 – 2022

大模型最初被视为“更强的补全器”。为了让模型输出理想结果，开发者投入大量精力设计精巧的指令、few-shot 示例和角色扮演。这个阶段模型没有记忆外部状态，也不具备行动能力，输出完全依赖静态提示。

🧠 依赖“咒语”般的提示词技巧
📄 无长期记忆，无工具调用
⚠️ 脆弱性高，提示微调导致结果剧变
🎭 代表作：ChatGPT、GPT-3.5 早期玩法

// 经典提示词模板
> 你是一位资深数据分析师。
> 请根据以下销售数据：
一月: 240万, 二月: 210万
> 分析趋势并给出建议。
[模型输出纯文本分析]
❌ 无法查实时数据库
❌ 不会调用任何API

🔗 阶段 2: 上下文增强 & 链式编排 (RAG + Chain) 2023 – 2024

为解决知识截止和复杂任务，出现了检索增强生成(RAG)和链式调用(LangChain)。模型可以先检索外部知识库，再将多步骤任务拆解为“思考-行动”链，但仍依赖硬编码流程。

📚 向量数据库 + 外部文档检索
🧩 思维链 CoT / ReAct 初步尝试
⚙️ 预定义工具调用 (搜索/计算器)
🔄 代表：LangChain, LlamaIndex

// 链式伪代码
chain = 检索文档 → LLM总结 → 工具执行
if 需要天气:
call_api(weather_api)
→ 输出最终答案
✅ 能访问有限工具
⚠️ 流程静态，无自主决策

🧠 阶段 3: 自主智能体 (Agent) 时代 2024 – 现在

智能体不仅拥有长期记忆 + 规划能力 + 工具使用 + 自我反思，还能动态决策调用哪个技能、如何组合工具。配合 Agent Skills（技能封装） 与 MCP（模型上下文协议），Agent 能安全地连接企业数据和外部世界。

🎯 目标驱动：拆解任务，自主规划
🛠️ 工具集丰富：代码解释器、浏览器、API
🧪 自我纠错：观察结果并调整计划
🔌 MCP 标准化连接，Skills 复用封装

// Agent 循环伪代码
while 目标未完成:
  思考: 下一步动作?
  选择技能: send_report / query_db
  通过 MCP 调用工具
  观察结果 → 记忆更新
  如果失败则重新规划
✅ 自主性 & 鲁棒性飞跃

🧩 现代 Agent 核心架构 (感知-规划-行动)

            flowchart TB
                User([用户输入]) --> Memory[长期记忆 & 短期记忆]
                Memory --> Planner[规划模块 Planner]
                Planner --> |分解子目标| Executor[执行器 Executor]
                Executor --> Skills{Agent Skills 技能库}
                Skills --> |调用| MCP[MCP 协议层]
                MCP --> Tools[(外部工具 / APIs)]
                Tools --> Observer[观察者 Observer]
                Observer --> |反馈| Planner
                Observer --> |最终答案| User
                
                subgraph Skills_Layer [技能封装层]
                    Skill1[发邮件技能]
                    Skill2[SQL查询技能]
                    Skill3[报告生成技能]
                end
                Skills --- Skills_Layer
                
                subgraph MCP_Server [MCP 标准化服务器]
                    direction LR
                    Res[Resources 数据资源]
                    T[Tools 可执行工具]
                    P[Prompts 模板]
                end
                MCP --- MCP_Server

✨ Agent 动态循环：规划 → 执行 → 观察 → 反思 → 再规划

⚙️ Agent Skills 与 MCP：让智能体从“玩具”变“工具”

📦 Agent Skills

将原子操作（API调用、代码逻辑）封装为可复用的技能模块，类似给智能体安装“功能App”。
✅ 降低推理复杂度 ✅ 提升稳定性 ✅ 便于权限管理。

                    技能示例: send_report(to, format) → 调用内部邮件API + 生成PDF
                

🔌 MCP (Model Context Protocol)

Anthropic 提出的开放协议，标准化 LLM 与数据源/工具的交互。通过统一的 Resources / Tools / Prompts 原语，实现“即插即用”的安全连接。

                    MCP 服务器暴露本地文件 + 数据库 + 第三方 API，智能体无需关心实现细节。
                

💡 二者结合：高层 Skills 调用底层 MCP 工具，实现业务语义 + 标准化基础设施的最佳实践。

📊 核心能力对比：Prompt → RAG → Agent

维度	Prompt Engineering	RAG / Chain	Agent (智能体)
交互模式	单轮问答	多步固定流水线	动态循环决策
工具使用	无	预置工具调用（硬编码）	自主选择工具 + 组合技能
记忆能力	上下文窗口内	向量检索记忆	长期 + 短期 + 工作记忆
规划能力	无	思维链提示	任务分解 / 反思 / 重规划
可扩展性	低（重新设计提示）	中（增加链条步骤）	高（新增 Skills 或 MCP 服务器）
典型框架	OpenAI API, Claude	LangChain, LlamaIndex	AutoGPT, LangGraph, CrewAI

            quadrantChart
                title 智能体成熟度演进 (自主性 vs 任务复杂度)
                x-axis "低自主性" --> "高自主性"
                y-axis "简单任务" --> "复杂任务"
                quadrant-1 "自主智能体"
                quadrant-2 "RAG / 工作流编排"
                quadrant-3 "传统规则 / Prompt"
                quadrant-4 "半自动工具流"
                "传统规则": [0.08, 0.1]
                "Prompt(2022)": [0.22, 0.16]
                "RAG+链(2023)": [0.38, 0.58]
                "工作流Agent(2024)": [0.62, 0.42]
                "初代Agent(2024)": [0.72, 0.72]
                "MCP+Skills(2025+)": [0.82, 0.86]

📌 智能体正快速进入高自主性、高复杂度任务区域

📜 从 Prompt 到 Agent 的代码思维演变（伪代码对比）

                // 🧾 提示词时代

                response = openai.Completion.create(

                  prompt="写一首关于AI的诗",

                  max_tokens=200

                )
            
                // 🔗 RAG + Chain 时代

                docs = vector_store.similarity_search(query)

                context = format_docs(docs)

                answer = llm.predict(context + query)

                if need_weather: call_weather_api()
            
                // 🤖 Agent 时代

                agent = create_agent(tools=[skill1, skill2])

                agent.run("分析Q2销售，发送异常提醒")

                # Agent 内部循环: 规划→执行→反思→完成

🚀 关键洞察：为何 Agent 是必然趋势？

✅ 1. 大模型推理成本降低 → 允许循环调用
✅ 2. 外部工具生态爆炸 (API / 浏览器 / 代码)
✅ 3. MCP 等协议让连接标准化，打破数据孤岛
✅ 4. Agent Skills 提升复用性，企业级落地可行
✅ 5. 人类更希望 AI 完成“任务”而非回答“问题”