执行摘要

本报告对Agent Infrastructure(Agent基础设施)领域进行了系统性深度调研,重点关注Memory管理层次模型。通过对LangChain、LangGraph、LangSmith、Zep、MemGPT等主流技术的分析,揭示了Agent Memory从简单会话存储到复杂知识图谱演进的技术脉络。


1. Agent Infra 分层架构

1.1 Agent执行动态追踪(Trace)层

LangSmith 是LangChain团队推出的LLM应用可观测性平台,截至2025年已处理超过10亿条Trace

核心架构:

Frontend (UI) + Backend API + SDK (Python/TypeScript)
ClickHouse (Trace存储) + PostgreSQL (元数据) + Redis (缓存)

定价模式:

  • Developer计划:免费,5,000 traces/月
  • Plus计划:$39/月/席位
  • Enterprise计划:支持私有化部署

1.2 Agent Context管理层

Context生命周期:

创建(Creation) → 传递(Transfer) → 更新(Update) → 销毁(Dispose)
     │                │                │              │
  初始化状态      节点间流转      Reducer合并     会话结束

LangGraph中的Context管理:

class AgentState(TypedDict):
    messages: Annotated[list, add_messages]
    documents: list[str]
    counter: Annotated[int, add]

2. Memory管理深度分析(重点)

2.1 Memory层次模型

基于认知科学和计算机体系结构的启发,Agent Memory采用分层架构:

┌─────────────────────────────────────────────────────────┐
│              Working Memory (工作记忆)                   │
│         Context Window / Active Reasoning               │
│              ~4K-128K tokens                            │
│                   ▲                                     │
│                   │ 实时访问                             │
├───────────────────┼─────────────────────────────────────┤
│                   ▼                                     │
│            Short-term Memory (短期记忆)                 │
│     Session History / Conversation Buffer               │
│              ~10-100 messages                           │
│                   ▲                                     │
│                   │ 快速检索                             │
├───────────────────┼─────────────────────────────────────┤
│                   ▼                                     │
│            Long-term Memory (长期记忆)                  │
│  ┌───────────────┬───────────────┐                     │
│  │ Fixed Attr    │ Fuzzy Vector  │                     │
│  │ Memory        │ Memory        │                     │
│  │ (用户画像)     │ (Embedding)   │                     │
│  └───────────────┴───────────────┘                     │
└─────────────────────────────────────────────────────────┘

2.2 短期记忆(Short-term Memory)

工作记忆(Working Memory):

  • 容量有限:受限于模型上下文窗口(4K-128K tokens)
  • 访问极快:直接参与模型推理,零延迟
  • 易失性:会话结束即丢失

管理方案对比:

方案原理优点缺点
Buffer Memory保留完整历史简单完整容易超限
Window Memory滑动窗口保留最近N轮控制Token丢失早期
Summary Memory定期总结压缩保留长期上下文信息损失
Entity Memory提取关键实体结构化存储复杂度高

2.3 长期记忆(Long-term Memory)

固定属性记忆(Fixed Attribute Memory):

  • 用户基本信息(姓名、角色)
  • 偏好设置(语言、主题偏好)
  • 固定事实(公司名、职位)
  • 权限配置(可访问资源)

模糊向量记忆(Fuzzy Vector Memory):

memory_entry = {
    "content": "用户喜欢使用Python进行数据分析",
    "embedding": [0.23, -0.56, 0.89, ...],
    "metadata": {
        "user_id": "u123",
        "timestamp": "2024-01-15T10:30:00Z",
        "confidence": 0.92
    }
}

主流向量数据库对比:

数据库特点适用场景
Pinecone托管服务,易用性强快速启动,中小规模
Weaviate开源,GraphQL接口需要灵活查询
Chroma轻量,本地优先开发测试,边缘部署
Milvus企业级,高吞吐大规模生产环境
Neo4j图+向量混合需要关系推理

3. 主流技术工具深度分析

3.1 LangChain Memory模块

Memory类型对比:

Memory类型适用场景优点缺点
BufferMemory短对话简单完整容易超限
BufferWindowMemory中等对话控制Token丢失早期
SummaryMemory长对话保留概要信息损失
VectorStoreRetrieverMemory大规模语义检索需要向量DB

3.2 LangGraph 状态管理与持久化

三种记忆类型(基于认知科学):

记忆类型对应认知科学概念用途实现方式
Semantic Memory语义记忆存储事实、知识、用户偏好LangGraph Store
Episodic Memory情景记忆对话历史、任务完成记录Checkpointer
Procedural Memory程序记忆规则、指令、学习行为动态Prompt更新

性能基准:

后端性能(ops/sec)适用场景
Memory8,392开发测试
SQLite7,083本地/小规模
Redis2,950高性能缓存
PostgreSQL1,038生产环境

3.3 Zep 长期记忆服务

架构概览:

Zep是基于时间感知知识图谱的Memory服务,核心组件为Graphiti引擎:

Episode Subgraph → Semantic Entity Subgraph → Community Subgraph
     (原始数据)          (实体关系)            (社区聚合)
      Graphiti Engine
    Embedding + BM25 + 图遍历

三层子图结构:

子图功能内容
Episode Subgraph情景记忆原始消息、JSON、文本,带时间戳
Semantic Entity Subgraph语义记忆提取的实体、关系、事实
Community Subgraph社区聚合强连接实体聚类、摘要信息

双时间模型(Bitemporal Model):

时间戳含义用途
Event Time (T)事件实际发生时间时序推理、历史查询
Ingestion Time (T’)数据摄入时间审计追踪、版本控制

3.4 MemGPT 记忆管理操作系统

核心思想:

MemGPT借鉴操作系统虚拟内存管理,将LLM上下文视为有限RAM,外部存储视为无限磁盘

┌─────────────────────────────────────────────────────────┐
│                  Main Context (RAM)                     │
│  ┌────────────┐ ┌────────────┐ ┌────────────┐          │
│  │   System   │ │   Working  │ │    FIFO    │          │
│  │ Instructions│ │  Context   │ │  History   │          │
│  └────────────┘ └────────────┘ └────────────┘          │
│                      ▲                                  │
│                      │ Function Calls                    │
└──────────────────────┼──────────────────────────────────┘
              ┌────────┴────────┐
              ▼                 ▼
    ┌─────────────────┐ ┌─────────────────┐
    │ Archival Memory │ │ Recall Memory   │
    │ (向量存储)       │ │ (召回记忆)      │
    └─────────────────┘ └─────────────────┘

内存管理原语:

原语功能对应OS概念
store()将数据从主上下文存储到外部换出(Swap Out)
retrieve()从外部检索数据到主上下文换入(Swap In)
summarize()压缩历史消息页面合并
update()更新工作上下文内存写入

4. 技术对比总结

4.1 主流方案综合对比

维度LangChainLangGraphZepMemGPT
抽象层次
持久化可选原生原生原生
长期记忆需扩展Store支持核心功能核心功能
向量检索支持支持支持支持
图检索需扩展需扩展原生不支持
时间感知原生有限
学习曲线
适用场景快速原型工作流Agent企业应用长对话Agent

4.2 选型建议

场景推荐方案
快速原型/MVPLangChain + BufferMemory
复杂工作流AgentLangGraph + PostgreSQL
企业级客服AgentZep + Graphiti
个人助手/长对话MemGPT/Letta
多Agent协作AutoGen + 向量存储
前端应用集成Vercel AI SDK

5. 核心洞察(Key Insights)

Insight 1: Memory分层是Agent智能化的基础

Agent Memory正在从单一的"对话历史"向认知科学启发的分层模型演进:工作记忆(当前推理)+ 短期记忆(会话上下文)+ 长期记忆(持久知识)。

Insight 2: 时间感知将成为Memory的标配能力

Zep的双时间模型揭示了Memory的下一个进化方向——时间感知。未来的Agent Memory不仅要存储"什么",还要记录"何时"、“持续多久”、“何时失效”。

Insight 3: 检索正在从"相似性"向"语义+关系"演进

纯向量相似性检索的局限性日益明显。Zep的知识图谱+向量混合检索、MemGPT的分层换入换出,都指向一个趋势:Memory检索需要结合语义相似性、关系遍历和时序约束

Insight 4: Memory管理正从"开发者配置"走向"Agent自治"

MemGPT的OS式内存管理代表了Memory管理的未来方向——Agent自主决定记住什么、遗忘什么、何时检索

Insight 5: Memory的"存储器山"效应要求访问语义统一

不同Memory层的访问延迟差异巨大(从0ms到500ms+)。为了优化性能,需要统一的访问语义和智能的缓存策略


6. 未来趋势展望

6.1 技术演进方向

  1. 自适应Memory架构:根据任务类型自动调整Memory策略
  2. 联邦Memory:跨Agent、跨系统的Memory共享与同步
  3. 隐私保护Memory:端到端加密的个人记忆存储
  4. 多模态Memory:支持文本、图像、音频、视频的统一记忆

6.2 标准化趋势

  • Memory协议标准化:类似MCP的Memory访问协议
  • 评估基准统一:LongMemEval等基准将成为行业标准
  • 互操作性:不同Memory系统之间的数据交换格式

报告完成时间:2025年 调研范围:Agent Infrastructure, Memory Management, LangChain, LangGraph, Zep, MemGPT