AI 代理记忆

"规范作为 AI 代理的持久语义记忆。"

LeanSpec 规范作为 AI 代理的持久记忆层——提供跨会话持久的长期知识存储，并实现有效的人机协作。

记忆问题

AI 代理面临一个根本挑战：工作记忆是短暂的。

每个聊天会话都从头开始（没有先前对话的记忆）
上下文窗口有限（即使有 1M+ 令牌）
重要的决策和理由在会话之间丢失
代理重复问题或做出与过去工作不一致的决策

传统解决方案：对文档的 RAG（检索增强生成）

LeanSpec 解决方案：规范作为语义记忆 - 代理可以可靠访问的结构化、持久知识

规范作为语义记忆

借鉴认知科学研究（CoALA 论文），AI 代理受益于两种类型的记忆：

工作记忆（短暂）

什么：当前对话上下文，活动任务信息
生命周期：单个会话或任务
存储：聊天历史，上下文窗口
大小：受上下文窗口限制（100k-1M 令牌）

语义记忆（持久）

什么：长期知识、事实、决策、理由
生命周期：跨会话和任务持久
存储：LeanSpec 规范 + MCP 检索
大小：无限制（外部存储）

LeanSpec 规范 = AI 代理的语义记忆

如何工作

记忆存储（编写规范）

在与 AI 代理一起工作时，规范捕获：

做出的决策：选择了什么以及为什么
评估的权衡：考虑的选项，分析的优缺点
发现的约束：技术限制，业务需求
澄清的意图：工作背后的"为什么"
定义的成功标准：如何知道它完成了

示例：

# 功能：API 速率限制

## 问题
API 被大量请求击中，40% 的请求来自 2% 的用户。

## 解决方案
实现令牌桶速率限制（每个 API 密钥 100 req/min）。

## 为什么选择令牌桶？
- 允许突发（比固定窗口更好的用户体验）
- 久经考验（AWS、Stripe 使用）
- 使用 Redis 实现简单

## 权衡
- 增加的复杂性（Redis 依赖）
- 潜在的用户体验摩擦（用户达到限制）
- 值得：保护 98% 的用户免受 2% 滥用

## 成功标准
- [ ] 95% 的 API 请求成功（从 60% 提高）
- [ ] 响应时间 p95 < 200ms（曾是 2-3 秒）
- [ ] 零误报（合法用户被速率限制）

这成为代理可以在未来会话中引用的语义记忆。

记忆检索（AI 访问规范）

AI 代理通过以下方式访问规范记忆：

MCP 服务器集成：LeanSpec MCP 服务器提供规范搜索/检索
语义搜索：代理按主题、状态、标签查询规范
选择性加载：仅将相关规范加载到工作记忆中
交叉引用：跟随 depends_on 和 related 链接

工作流程：

人类："为什么我们选择 PostgreSQL 而不是 MongoDB？"

AI 代理：
1. 查询 LeanSpec MCP：search_specs("database decision")
2. 检索规范 023：数据库选择
3. 从语义记忆中读取决策理由
4. 响应："根据规范 023，选择 PostgreSQL 是因为..."

记忆作为上下文桥梁

规范桥接以下之间的差距：

人类记忆（为什么我们这样做，什么重要）
AI 工作记忆（当前任务，活动上下文）
代码库现实（实际实现的内容）

LeanSpec 中的记忆类型

1. 程序记忆（如何）

什么：标准模式、模板、工作流程
存储：模板，AGENTS.md 指令
示例："始终在提交前验证前置元数据"

2. 语义记忆（什么/为什么）

什么：事实、决策、理由、约束
存储：LeanSpec 规范（README、DESIGN 等）
示例："为无状态认证选择了 JWT 令牌（见规范 042）"

3. 情节记忆（何时/上下文）

什么：历史事件，何时发生了什么
存储：Git 历史，规范转换，时间戳
示例："API 重新设计（规范 038）发生在认证重构（规范 037）之后"

LeanSpec 主要提供语义记忆 - 持久知识层。

规范作为记忆的好处

对于 AI 代理

✅ 跨会话的持久上下文
✅ 可靠地检索过去的决策
✅ 与项目历史一致的行为
✅ 减少幻觉（事实来自规范，而不是猜测）
✅ 可扩展的知识（不受上下文窗口限制）

对于人类

✅ 与 AI 代理的共同理解
✅ 捕获和可访问的机构知识
✅ 简化入职（新人类和新 AI 会话）
✅ 决策审计跟踪（为什么事情是这样的）
✅ 上下文切换（离开项目几个月后返回）

对于团队

✅ 团队协调（每个人都阅读相同的记忆）
✅ 异步协作（代理从共享记忆工作）
✅ 知识连续性（不依赖于个人）
✅ 减少会议（决策被记录，而不是反复讨论）

记忆维护

像人类记忆一样，规范记忆需要维护：

主动回忆（保持最新）

随着理解的发展更新规范
清楚标记被取代的决策
归档完成的工作（压缩为摘要）

巩固（防止膨胀）

应用上下文工程策略
分区（Partition）大规范（>400 行）
精简（Compact）冗余内容
压缩（Compress）历史阶段

检索练习（验证访问）

测试 MCP 搜索检索相关规范
验证交叉引用（depends_on、related）
检查关键决策是否可查找

最佳实践

做：

✅ 捕获"为什么"和权衡（稳定的语义记忆）
✅ 随着现实改变更新规范（保持记忆准确）
✅ 在询问人类之前使用 MCP 搜索检索
✅ 交叉引用相关规范（记忆关联）
✅ 归档完成的工作（释放工作记忆）

不要做：

❌ 记录一切（记忆过载）
❌ 让规范偏离现实（损坏的记忆）
❌ 跨规范重复信息（记忆膨胀）
❌ 留下冲突信息（上下文冲突）

底线

LeanSpec 将规范从静态文档转变为 AI 代理的活跃语义记忆。

工作记忆（聊天历史）是短暂且有限的
语义记忆（规范）是持久且可扩展的
MCP 集成实现可靠的记忆检索
上下文工程保持记忆可管理

当 AI 代理可以可靠地访问过去的决策、理解理由并基于先前的工作构建时，它们成为真正的协作者，而不是会话绑定的助手。

相关：了解上下文工程以管理记忆大小，或探索 MCP 集成以了解记忆检索的技术实现。

记忆问题​

规范作为语义记忆​

工作记忆（短暂）​

语义记忆（持久）​

如何工作​

记忆存储（编写规范）​

记忆检索（AI 访问规范）​

记忆作为上下文桥梁​

LeanSpec 中的记忆类型​

1. 程序记忆（如何）​

2. 语义记忆（什么/为什么）​

3. 情节记忆（何时/上下文）​

规范作为记忆的好处​

对于 AI 代理​

对于人类​

对于团队​

记忆维护​

主动回忆（保持最新）​

巩固（防止膨胀）​

检索练习（验证访问）​

最佳实践​

底线​