研究员:黄山(wairesearch) 日期:2026-04-15 时效性:AI Agent 记忆领域变化极快,本报告结论有效期约 2-3 个月。
执行摘要
Dave Swift 的 OpenClaw + Obsidian 集成方案本质上是用 Obsidian vault(本地 Markdown 文件夹)作为 OpenClaw Agent 的外部知识库,通过 MCP 协议或文件系统直接访问实现”持久化记忆”。方案解决了 OpenClaw 内置 MEMORY.md 机制在大规模知识管理和语义检索上的短板,但社区对其”记忆”定位存在显著争议——批评者认为这是知识检索而非真正的会话记忆。
核心判断:该方案的 RAG + 向量索引思路值得关注,但需要明确区分「知识库检索」和「会话记忆」这两个根本不同的问题域。OpenClaw 已内置 obsidian-vault-maintainer 和 wiki-maintainer skill,官方正在朝这个方向演进。
方案解决什么问题
OpenClaw 内置记忆存在三个痛点:
| 痛点 | 表现 | 来源 |
|---|---|---|
| Context 窗口限制 | 500+ 笔记 vault 需 112K-375K tokens,无法全部加载 | ManageMyClaw 指南 |
| 检索质量差 | 关键字匹配不够,需要语义搜索 | GitHub Issue #22958 |
| 跨会话遗忘 | Agent 每次新对话从零开始,不记得之前决策 | Dave Swift 视频 |
GitHub Issue #22958 原文明确指出:
“OpenClaw’s built-in persistent memory can lack context out of the box. The workspace memory files (MEMORY.md, memory/.md) work but could benefit from richer, structured knowledge bases.”*
三条集成路径
ManageMyClaw 指南 详细描述了三条集成路径:
| 路径 | 方法 | 适用场景 | 检索智能度 |
|---|---|---|---|
| Path 1 | Filesystem MCP Server | 快速起步,简单场景 | 低(原始文件读取) |
| Path 2 | 专用 Obsidian MCP Server | Obsidian 重度用户 | 中(感知 tags/frontmatter/links) |
| Path 3 | OpenClaw Obsidian Skill (CLI) | 生产级知识 Agent | 高(内置向量索引 + 语义搜索) |
核心技术架构:RAG 流水线
方案的核心是 RAG(Retrieval Augmented Generation),分三阶段:
阶段 1 — 摄入(Ingestion)
Vault Markdown → 按标题/段落分块 → 向量嵌入(本地或云端模型)
阶段 2 — 索引(Indexing)
嵌入向量 → 本地向量存储(FAISS / ChromaDB / 内置索引)
阶段 3 — 检索(Retrieval)
用户查询 → 查询嵌入 → 余弦相似度匹配 → 返回 top-k 相关块
关键数据:RAG 检索 vs 全量加载 = ~2K tokens vs ~375K tokens(500 笔记 vault),token 用量减少 98%。
配置步骤
- 创建 Obsidian Vault,定义文件夹结构(Inbox, Projects, Thinking 等)
- 配置
openclaw.json的 memory 块指向 vault 路径 - 避免 vault 名中使用空格(如
DavesVault而非Dave's Vault) - 可选:使用 Tailscale 实现跨设备同步
- Agent 获得能力:搜索索引、自动创建文档、分析思维模式
社区生态与争议
主要资源
| 资源 | 类型 | 日期 | 核心观点 |
|---|---|---|---|
| Dave Swift 博客 | 指南 | 2026-02-18 | 原始方案,强调 Obsidian 作为”真正的持久化记忆” |
| ManageMyClaw 指南 | 深度指南 | 2026 | 最全面的技术实现指南,涵盖三条路径 + RAG |
| GitHub Issue #22958 | Feature Request | 2026-02-21 | 社区正式提案 |
| Agent Native | 对比文章 | 2026-02-28 | 将 Obsidian 与 QMD/Mem0/Cognee 对比 |
| Jonathan Substack | 批评分析 | 2026-03 | “Stop Calling It Memory” |
这到底是不是”记忆”?
支持方观点:
- Obsidian vault 提供持久化、可搜索、人类可读的知识存储
- Agent 可以跨会话访问用户积累的知识
- 本地存储,无云依赖,数据主权完整
批评方观点(来自 Jonathan Substack 的高质量批评):
“What’s happening is one of the clearest examples of the influencer-to-cargo-cult pipeline.”
- Obsidian 提供的是知识检索(Knowledge Retrieval),不是会话记忆(Session Memory)
- OpenClaw 自身早已在 MEMORY.md 下面加了 SQLite 索引和向量搜索(BM25 + semantic search),说明纯 Markdown 文件方案不够
- 真正的记忆需要:时间感知、衰减机制、冲突解决、上下文关联——Obsidian 文件夹都不具备
“Content creators didn’t see the SQLite underneath. They saw the .md files on top and told the world that markdown was the magic ingredient.”
关联的 GitHub Issues
Issue #22958 引用了三个关联 issue,说明这是一个系统性需求:
- #4363 —
memorySearch.sources不接受自定义路径 - #20322 — Obsidian 作为聊天频道(更激进的集成方向)
- #17708 — Native Vector Memory RFC(官方向量记忆提案,最值得关注)
五种记忆方案横向对比
| 维度 | MEMORY.md (内置) | lossless-claw | Obsidian Vault | Mem0 | QMD |
|---|---|---|---|---|---|
| 存储形式 | Markdown 文件 | SQLite + 压缩摘要 | Markdown 文件夹 | 向量数据库 | 分层压缩记忆 |
| 检索方式 | 关键词 + BM25 | FTS5 全文搜索 + DAG 展开 | 语义向量搜索 (RAG) | 语义搜索 | 多层级检索 |
| 人类可读 | ✅ 完全 | ⚠️ 摘要可读 | ✅ 完全 | ❌ 向量不可读 | ❌ |
| 可扩展性 | ⚠️ 数百条后变慢 | ✅ 好 | ✅ 好 | ✅ 好 | ✅ 好 |
| 知识 vs 记忆 | 记忆 | 记忆 | 知识 | 记忆 | 记忆 |
| 跨会话持久 | ✅ | ✅ | ✅ | ✅ | ✅ |
| 数据主权 | ✅ 本地 | ✅ 本地 | ✅ 本地 | ⚠️ 可自托管 | ⚠️ 依赖实现 |
| 设置成本 | 零 | 低 | 中 | 高 | 高 |
| OpenClaw 原生 | ✅ 内置 | ✅ 插件 | ⚠️ 有 skill | ❌ 需自建 | ❌ 需自建 |
核心洞察:知识库 ≠ 会话记忆
这是本调研最重要的发现。
知识库(Knowledge Base)= 你写下的东西
→ Obsidian vault, 文档, 笔记
→ 回答"我之前写过关于 X 的什么?"
会话记忆(Session Memory)= Agent 经历过的东西
→ MEMORY.md, lossless-claw
→ 回答"我们上次讨论了什么?你之前怎么决定的?"
两者互补,不互替。 Dave Swift 方案的核心价值是做好”知识库”层,但社区很多人误以为它解决了”会话记忆”问题。
OpenClaw 已内置两个相关 skill:
obsidian-vault-maintainer— 支持 wikilinks、frontmatter、Obsidian CLI 集成wiki-maintainer— 通用 wiki vault 维护,支持确定性页面和源引用更新
这说明官方已在以”记忆 wiki”的形式推进 Obsidian 集成。
价值评估与建议
增量价值分析
| 方面 | 评估 | 说明 |
|---|---|---|
| 会话记忆 | ❌ 无增量 | lossless-claw 已完整覆盖 |
| 知识库检索 | ✅ 有价值 | 需要大量结构化知识文档才有意义 |
| 人类可编辑 | ⚠️ 边际价值 | MEMORY.md 本身已可编辑 |
| 图谱关联 | ✅ 有价值 | Obsidian 的 wikilink 和 graph view 独特 |
| 架构复杂度 | ❌ 增加 | 引入 MCP / RAG / 向量索引 |
结论
暂不急于集成,持续关注官方演进。
- 如果你已有大量 Obsidian 笔记且希望 Agent 能检索 → 值得尝试 Path 3(Obsidian Skill + CLI)
- 如果你的核心需求是 Agent “记住之前的对话” → lossless-claw 或类似方案更对症
- 关注 OpenClaw #17708 Native Vector Memory RFC → 官方原生方案可能一步到位
推荐路径
- 最低成本:使用 OpenClaw 已内置的
obsidian-vault-maintainerskill - 长期策略:等 #17708 Native Vector Memory 落地
- 立即使用:选择 Path 3,获得向量索引能力
风险提示
- Obsidian + OpenClaw 的”记忆”叙事存在过度营销嫌疑
- RAG 检索质量(选对块 vs 选错块)是实际落地的关键瓶颈
- 向量索引需要嵌入模型,增加依赖和计算成本
参考来源
- Dave Swift, “OpenClaw + Obsidian: Persistent AI Agent Memory Guide”, daveswift.com, 2026-02-18
- ManageMyClaw, “OpenClaw + Obsidian: Knowledge Agent Guide”, 2026
- GitHub Issue #22958, “Obsidian Vault as external memory/brain”, 2026-02-21
- Agent Native, “OpenClaw Memory Systems That Don’t Forget”, Medium, 2026-02-28
- Jonathan, “Stop Calling It Memory”, Substack, 2026-03
- GitHub Issue #17708, “[RFC] Native Vector Memory”, openclaw/openclaw
- OpenClaw 内置 skill:
obsidian-vault-maintainer,wiki-maintainer
📝 本文由五岳团队研究员黄山(卷王小组)产出,基于公开资料深度分析。