深入 Node.js 内存管理：以 OpenClaw 为例的实战优化分析

Node.js 长驻服务的内存管理是一个被低估的工程挑战。不同于短生命周期的 Web 请求，7×24 运行的 AI Gateway 需要精细的内存生命周期管理——否则，一个小小的缓存泄漏就能在几天内拖垮整个服务。

本文以 OpenClaw（一个基于 Node.js 的多通道 AI Agent Gateway）为研究案例，深入分析 V8 内存模型、GC 算法，并通过源码审计揭示 6 大核心内存优化策略，最后用 69 小时的实测数据验证其有效性。

第一部分：Node.js 内存管理机制

V8 堆结构

V8 引擎将堆内存划分为多个空间，每个空间有不同的用途和 GC 策略：

┌─────────────────────────────────────────────────────┐
│                    V8 Heap                          │
├─────────────────────────────────────────────────────┤
│  New Space (Young Generation)                       │
│  ├── Semi-space From (活跃对象)                      │
│  └── Semi-space To   (复制目标)                      │
├─────────────────────────────────────────────────────┤
│  Old Space (Old Generation)                         │
│  ├── Old Pointer Space (含引用的对象)                 │
│  └── Old Data Space   (纯数据对象)                   │
├─────────────────────────────────────────────────────┤
│  Large Object Space (>128KB 的大对象)                │
├─────────────────────────────────────────────────────┤
│  Code Space (JIT 编译的机器码)                       │
├─────────────────────────────────────────────────────┤
│  Map Space (Hidden Classes / Maps)                  │
└─────────────────────────────────────────────────────┘

堆外内存 (V8 不直接管理):
┌─────────────────────────────────────────────────────┐
│  Buffer / ArrayBuffer 数据       │ C++ 堆分配       │
│  原生模块分配的内存               │ malloc/free      │
│  libuv 线程池资源                 │ 操作系统管理      │
└─────────────────────────────────────────────────────┘

各空间详解

New Space（新生代）：默认 16MB，两个等大的 Semi-space 采用 Cheney 复制算法。新对象在这里分配，经历两次 Scavenge 后存活的对象晋升到 Old Space。分配速度极快（bump pointer），GC 频率高但延迟低（1-5ms）。

Old Space（老生代）：默认约 1.4GB（64位系统），存放从 New Space 晋升的长期存活对象。内部分为 Old Pointer Space（含引用）和 Old Data Space（纯数据）。

Large Object Space：超过约 128KB 的大对象直接分配在单独页面，不会被移动，GC 时直接标记回收。

Code Space：存放 JIT 编译器（TurboFan/Maglev）生成的机器码，具有可执行权限。

Map Space：存放 Hidden Class（V8 内部叫 Map），描述对象的结构——属性名、偏移量、类型。对象形状变化会创建新 Map（transition chain）。

GC 算法体系

算法	适用空间	延迟	特点
Scavenge (Copy)	New Space	1-5ms	复制存活对象，空间换时间
Mark-Sweep	Old Space	数十-数百ms	标记清除，产生碎片
Mark-Compact	Old Space	数百ms	整理碎片，成本最高
Incremental Marking	Old Space	5-10ms/切片	分步标记，降低停顿
Concurrent Marking	Old Space	~0ms 主线程	后台线程标记

Scavenge：新生代的快速回收

触发: New Space 分配满时
延迟: 通常 1-5ms
频率: 高（每秒可能多次）

过程:
1. 从 From-space 的根对象开始扫描
2. 存活对象复制到 To-space（或晋升到 Old Space）
3. From/To 角色互换
4. 原 From-space 整体回收

晋升条件:
- 对象已经经历过一次 Scavenge
- To-space 使用率超过 25%

Concurrent Marking：现代 V8 的杀手锏

┌─────────────────┐    ┌─────────────────┐
│   主线程         │    │   GC Worker     │
│   (JS 执行)      │    │   (并发标记)     │
│                 │    │                 │
│  正常执行 JS    │    │  遍历对象图      │
│  Write Barrier  │──→ │  标记存活对象    │
│  记录变化       │    │  处理 barrier    │
└─────────────────┘    └─────────────────┘

V8 v6.2+ 将标记工作放到后台线程完成，主线程通过 Write Barrier 通知并发标记器引用变化，最终仅需短暂 STW 完成原子性操作。

Node.js 特有的内存机制

Buffer：堆外分配的核心

const buf = Buffer.alloc(1024 * 1024); // 1MB 数据在 C++ 堆外

// process.memoryUsage() 字段含义:
// - heapUsed:     V8 堆内使用量
// - external:     V8 管理但堆外分配的内存（Buffer 数据）
// - arrayBuffers: ArrayBuffer 和 SharedArrayBuffer 的数据
// - rss:          进程总物理内存（V8 堆 + 堆外 + 代码段等）

Buffer 的数据存储在 V8 堆外（C++ 堆），但描述符对象（~96 bytes）在 V8 堆内。超过 Buffer.poolSize（默认 8KB）的 Buffer 独立分配，小 Buffer 从预分配的 slab 切片。

Stream 背压：防止内存爆炸的关键

生产者 (Readable)          消费者 (Writable)
     │                         │
     │── data ──→              │
     │── data ──→   [内部缓冲]  │
     │── data ──→   [超过 HWM]  │
     │                         │
     │←── false (write返回) ───│  ← 背压信号
     │                         │
     │   [暂停读取]             │
     │                         │
     │←── 'drain' 事件 ────────│  ← 可以继续
     │── data ──→              │

highWaterMark 控制内部缓冲区阈值，当缓冲超过 HWM，write() 返回 false，生产者应暂停直到 drain 事件。pipe() 自动处理背压。

Worker Threads：独立的 V8 实例

const worker = new Worker('./heavy-task.js', {
  resourceLimits: {
    maxOldGenerationSizeMb: 512,  // Old Space 限制
    maxYoungGenerationSizeMb: 16, // New Space 限制
    codeRangeSizeMb: 64,          // Code Space 限制
    stackSizeMb: 4                // 调用栈限制
  }
});

// Worker 超限触发 'error' 事件，不影响主线程
worker.on('error', (err) => {
  // err.code === 'ERR_WORKER_OUT_OF_MEMORY'
});

每个 Worker 拥有独立的 V8 实例和 GC 周期。SharedArrayBuffer 是唯一可跨 Worker 共享的内存，transferList 可转移 ArrayBuffer 所有权（零拷贝）。

Node.js 22+ 的堆自动调整

Node.js 22+ 默认根据系统可用内存动态计算堆限制：

系统内存	堆限制
≤ 2GB	~700MB
4GB	~1.5GB
≥ 8GB	~4GB

可通过 --max-old-space-size 显式覆盖。

常见内存泄漏模式

1. 闭包引用泄漏

// 泄漏: 闭包持有不需要的大对象
function createLeak() {
  const hugeData = Buffer.alloc(1024 * 1024);
  return function() {
    console.log('hello'); // 从未使用 hugeData，但闭包持有引用
  };
}

// 修复: 只持有处理结果
function fixed() {
  const hugeData = Buffer.alloc(1024 * 1024);
  const result = processData(hugeData);
  return function() {
    console.log(result);
  };
}

2. 全局缓存无限增长

// 泄漏: 只加不删的缓存
const cache = {};
function processRequest(id, data) {
  cache[id] = data; // 永远不清理
}

// 修复: LRU 或 TTL 缓存
const cache = new Map();
const MAX_SIZE = 1000;
function processRequest(id, data) {
  if (cache.size >= MAX_SIZE) {
    const firstKey = cache.keys().next().value;
    cache.delete(firstKey);
  }
  cache.set(id, data);
}

3. 事件监听器累积

// 泄漏: 每次请求添加监听器，从不移除
function handleRequest(emitter) {
  emitter.on('data', (chunk) => { /* ... */ });
}

// 修复: once 或显式移除
function handleRequest(emitter) {
  emitter.once('data', (chunk) => { /* ... */ });
}

4. 定时器引用泄漏

// 泄漏: setInterval 引用的闭包阻止 GC
function startPolling(resource) {
  setInterval(() => {
    resource.check(); // resource 永远不被释放
  }, 1000);
}

// 修复: 保存引用，适时清除
function startPolling(resource) {
  const timer = setInterval(() => resource.check(), 1000);
  return () => clearInterval(timer);
}

第二部分：OpenClaw 架构与内存生命周期

架构概览

OpenClaw 是一个基于 Node.js 22+ 的多通道 AI 网关系统，作为 systemd 服务 7×24 运行：

┌─────────────────────────────────────────────────────────┐
│                   Gateway Process                        │
│                   (单个 Node.js 进程)                     │
├─────────────────────────────────────────────────────────┤
│                                                         │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐             │
│  │ Telegram │  │ Discord  │  │  Feishu  │  ...Channels │
│  └────┬─────┘  └────┬─────┘  └────┬─────┘             │
│       └──────────────┼──────────────┘                   │
│                      ▼                                  │
│  ┌─────────────────────────────────────┐               │
│  │        Message Router               │               │
│  │  (session-key → agent dispatch)     │               │
│  └────────────────┬────────────────────┘               │
│                   ▼                                     │
│  ┌─────────────────────────────────────┐               │
│  │        Agent Runner Runtime         │               │
│  │  (LLM 调用、工具执行、上下文管理)      │               │
│  └────────────────┬────────────────────┘               │
│                   ▼                                     │
│  ┌─────────────────────────────────────┐               │
│  │     Session Store + Transcript      │               │
│  │  (文件持久化 + 内存缓存)              │               │
│  └─────────────────────────────────────┘               │
│                                                         │
│  ┌──────────────┐  ┌──────────────┐  ┌──────────┐     │
│  │ Memory Core  │  │ Plugin System│  │Diagnostic│     │
│  │ (向量检索)    │  │ (Jiti 加载)  │  │(健康监控) │     │
│  └──────────────┘  └──────────────┘  └──────────┘     │
│                                                         │
└─────────────────────────────────────────────────────────┘

关键架构特征：

单进程模型 — 不使用 cluster 或 worker_threads 做多实例
所有通道共享同一个事件循环 — 资源效率高但需要精细管理
通过 systemd 管理 — 支持优雅重启

单次请求的内存峰值模型

内存使用
  ↑
  │         ┌──── LLM Prompt 构建 (数百KB)
  │        ╱│╲
  │       ╱ │ ╲── LLM 流式响应处理 (按块释放)
  │      ╱  │  ╲
  │     ╱   │   ╲── Session State 更新
  │    ╱    │    ╲
  │───╱─────│─────╲───── 基线 (Session 缓存 + 全局状态)
  │  ╱      │      ╲
  └─────────────────────→ 时间
       请求处理周期

峰值控制要点：

Prompt 构建时 slice 最新 100 条消息（而非全部加载）
LLM 响应流式分块（800-1200 字符/块），发送后即可 GC
Session 文件 > 5MB 不加载
自动 compaction 在 token 接近上下文窗口时触发

KeyedAsyncQueue：自清理的并发隔离

同一 session key 的请求串行执行，不同 key 并发：

class KeyedAsyncQueue {
  constructor() {
    this.tails = new Map();
  }
  
  enqueue(key, task) {
    return enqueueKeyedTask({ tails: this.tails, key, task });
  }
}

function enqueueKeyedTask(params) {
  const tail = current.then(() => void 0, () => void 0);
  params.tails.set(params.key, tail);
  // 关键: 任务完成后自动清理 tail 引用
  const cleanup = () => {
    if (params.tails.get(params.key) === tail) params.tails.delete(params.key);
  };
  tail.then(cleanup, cleanup);
  return current;
}

这确保了：空闲 session 的 queue entry 自动回收，Map 不会无限增长。

完整请求处理链

用户消息 → Channel Adapter
  ↓
Session Key 解析（轻量，无堆分配）
  ↓
Session Write Lock（KeyedAsyncQueue 串行化）
  ↓
加载 Session State（缓存命中 → 内存引用 / 未命中 → 读文件 + 解析 JSON）
  ↓
构建 LLM Prompt：
  - 系统提示（缓存，首次加载后复用）
  - Bootstrap 文件（按 sessionKey 缓存）
  - 对话历史（最近 100 条）
  - 工具定义（模块级缓存）
  ↓
LLM API 调用（流式传输，不缓冲完整响应）
  ↓
流式处理响应块 → 分段发送 → 释放已发送段
  ↓
工具调用（如有）→ 子进程 exec / 文件读写 / Web 请求
  ↓
更新 Session State → 写入缓存 + 持久化文件
  ↓
清理临时对象 → 等待 GC

第三部分：六大核心内存优化策略

通过源码审计，我们发现 OpenClaw 采用了完整的内存管理体系。以下逐一剖析每个策略的实现细节。

策略 1：分层 TTL 缓存系统（ExpiringMapCache）

这是 OpenClaw 中最核心的缓存基础设施：

function createExpiringMapCache(options) {
  const cache = new Map();
  let lastPruneAt = 0;
  
  function maybePruneExpiredEntries(nowMs, ttlMs) {
    if (!isCacheEnabled(ttlMs)) return;
    if (nowMs - lastPruneAt < resolvePruneIntervalMs(ttlMs, options.pruneIntervalMs)) return;
    for (const [key, entry] of cache.entries()) {
      if (isCacheEntryExpired(entry.storedAt, nowMs, ttlMs)) cache.delete(key);
    }
    lastPruneAt = nowMs;
  }
  
  return {
    get: (key) => {
      maybePruneExpiredEntries(nowMs, ttlMs);
      const entry = cache.get(key);
      if (isCacheEntryExpired(entry.storedAt, nowMs, ttlMs)) {
        cache.delete(key); // 惰性删除过期条目
        return;
      }
      return entry.value;
    },
    set: (key, value) => {
      maybePruneExpiredEntries(nowMs, ttlMs);
      cache.set(key, { storedAt: nowMs, value });
    }
  };
}

设计要点：

惰性删除：访问时检查过期，零开销维护
批量修剪：按间隔执行，不是每次操作都遍历
环境变量可配置：OPENCLAW_SESSION_CACHE_TTL_MS 动态调整
可禁用：ttlMs=0 时不存储

缓存全景：

缓存层	TTL/上限	淘汰策略
Session Store 缓存	45s (可配)	TTL + 惰性删除
诊断 Session 状态	30min / 2000条	TTL + LRU
消息去重 ID 缓存	可配 TTL	阈值触发 + 空scope回收
Rate Limiter 记录	windowMs + lockoutMs	60s 周期修剪
沙盒注册表	idleHours / maxAgeDays	5分钟周期修剪
Bootstrap 文件缓存	无 TTL	Session 滚动时清除
Plugin Jiti 加载器	无 TTL	常驻不卸载

策略 2：诊断驱动的内存监控

OpenClaw 实现了实时的内存压力检测系统：

const MB = 1024 * 1024;
const DEFAULT_RSS_WARNING_BYTES = 1536 * MB;        // 1.5GB
const DEFAULT_RSS_CRITICAL_BYTES = 3072 * MB;       // 3GB
const DEFAULT_HEAP_WARNING_BYTES = 1024 * MB;       // 1GB
const DEFAULT_HEAP_CRITICAL_BYTES = 2048 * MB;      // 2GB
const DEFAULT_RSS_GROWTH_WARNING_BYTES = 512 * MB;  // 10分钟增长 512MB
const DEFAULT_GROWTH_WINDOW_MS = 600 * 1000;        // 10分钟窗口
const DEFAULT_PRESSURE_REPEAT_MS = 300 * 1000;      // 5分钟防抖

function emitDiagnosticMemorySample(options) {
  const memory = normalizeMemoryUsage(process.memoryUsage());
  
  // 双维度检测：绝对值 + 增长率
  const pressure = pickThresholdPressure({ memory, thresholds })
    ?? pickGrowthPressure({ previous: state.lastSample, current, thresholds });
  
  if (pressure && shouldEmitPressure(pressure, now, repeatMs)) {
    emitDiagnosticEvent({
      type: "diagnostic.memory.pressure",
      ...pressure
    });
  }
}

监控特点：

双维度：绝对阈值 + 增长率，不遗漏任何模式
分级告警：warning / critical 对应不同响应策略
防抖：同类型告警 5 分钟内不重复
滑动窗口：10 分钟窗口检测异常增长
稳定性记录：追踪历史最大堆使用量

策略 3：对话上下文自动压缩（Compaction）

这是控制长对话内存使用的核心机制：

Token 使用量
  ↑
  │ ╭───────────────── contextWindow (如 200K tokens)
  │ │
  │ │  ╭─── threshold = contextWindow - reserve - softThreshold
  │ │  │
  │ ╱──│───────╮  ← 触发 preflight compaction
  │╱   │       │
  │    │       ╰── 旧消息被 LLM 摘要替代，token 回落
  │    │    ╱──────╮  ← 再次接近阈值
  │    │   ╱       │
  │    │  ╱        ╰── 再次压缩
  └────│──────────────────────────→ 对话轮次

function shouldRunPreflightCompaction(params) {
  const state = resolveMemoryFlushGateState(params);
  return Boolean(state && state.totalTokens >= state.threshold);
}

function resolveMemoryFlushGateState(params) {
  const contextWindow = Math.max(1, Math.floor(params.contextWindowTokens));
  const reserveTokens = Math.max(0, Math.floor(params.reserveTokensFloor));
  const softThreshold = Math.max(0, Math.floor(params.softThresholdTokens));
  const threshold = Math.max(0, contextWindow - reserveTokens - softThreshold);
  return { totalTokens, threshold };
}

Compaction 流程：

监测当前对话 token 总量
达到阈值（contextWindow - reserveTokens - softThreshold）时触发
调用 LLM 生成对话摘要
用摘要替换旧对话历史
重置 token 计数器，旧消息对象可被 GC 回收

关键配置：reserveTokensFloor 默认 20000，保留给新回复的空间。

策略 4：子进程 OOM 隔离

在内存有限的服务器上，这是保护主进程的最后防线：

const OOM_SCORE_WRAP_SCRIPT = 
  'echo 1000 > /proc/self/oom_score_adj 2>/dev/null; exec "$0" "$@"';

function prepareOomScoreAdjustedSpawn(command, args = [], options) {
  if (!shouldWrapChildForOomScore(options)) return { command, args, wrapped: false };
  
  return {
    command: "/bin/sh",
    args: ["-c", OOM_SCORE_WRAP_SCRIPT, command, ...args],
    env: hardenShellEnv(options?.env),
    wrapped: true
  };
}

隔离效果：

子进程 oom_score_adj = 1000（最高被杀优先级）
主进程保留默认 oom_score_adj = 0（受保护）
系统内存不足时，内核优先终止子进程
配合 killProcessTree 确保资源完全回收

策略 5：LLM 响应流式处理

不在内存中持有完整 LLM 响应，而是分块流式处理：

const DEFAULT_BLOCK_STREAM_MIN = 800;   // 最小块 800 字符
const DEFAULT_BLOCK_STREAM_MAX = 1200;  // 最大块 1200 字符
const DEFAULT_BLOCK_STREAM_COALESCE_IDLE_MS = 1000; // 合并空闲超时

// 按段落/句子/换行符切分流式响应
function resolveEffectiveBlockStreamingConfig(params) {
  return {
    chunking: {
      minChars: 800,
      maxChars: 1200,
      breakPreference: "paragraph", // 优先段落切分
      flushOnParagraph: true
    },
    coalescing: {
      idleMs: 1000, // 空闲 1s 后强制发送
      joiner: "\n\n"
    }
  };
}

每块 800-1200 字符，发送后即可 GC。避免了大模型输出（可能数万字符）一次性占满内存的问题。

策略 6：Timer 生命周期管理

OpenClaw 源码中大量使用 timer.unref() 模式：

// 诊断心跳
heartbeatInterval = setInterval(() => { ... }, interval);
heartbeatInterval.unref?.();

// 通道活跃检测
timer = setInterval(check, checkIntervalMs);
timer.unref?.();

// Rate Limiter 修剪
const pruneTimer = setInterval(() => prune(), pruneIntervalMs);
if (pruneTimer?.unref) pruneTimer.unref();

为什么 unref() 重要：

unref() 让定时器不计入事件循环的引用计数
当没有其他活跃工作时，进程可以正常退出
避免”僵尸定时器”阻止进程关闭
对长驻服务不影响正常运行，但确保优雅停机

第四部分：实测数据验证

采集环境：3.4GB 物理内存，无 Swap，Node.js v22.22.2
运行时长：69 小时（2天21小时）
目标进程：OpenClaw Gateway

核心指标

运行时长:     69 小时
当前 RSS:     1,131 MB
峰值 RSS:     1,168 MB
波动范围:     37 MB (3.3%)
增长率:       ≈ 0 MB/天（稳态）
泄漏速率:     无

六大策略验证结果

策略	验证状态	关键证据
TTL 缓存	✅ 有效	3天 RSS 稳定，无膨胀特征
作用域 ID 缓存	✅ 有效	峰值-当前差仅 37MB (3.3%)
沙盒修剪	⚠️ 未触发	线程11/FD64 = 无残留沙盒
Bootstrap 按需加载	✅ 有效	RssFile 仅 35MB
诊断压力检测	✅ 有效	阈值从未触发（RSS < 1.5GB）
OOM Score 隔离	✅ 有效	主进程 adj=0，子进程 adj=1000

内存稳定性评估

泄漏分析：真正的内存泄漏会表现为 RSS 单调递增。运行 69 小时后 RSS 波动仅 3.3%，且峰值在正常范围内，符合”GC 周期性回收 + 偶尔分配高峰”的健康模式。

V8 GC 健康度：当前 RSS 1.1GB 远低于 V8 堆上限 1.8GB，有充分空间执行常规 GC 而不需要触发 Full GC 或 OOM。

容量规划

┌─────────────────────────────────────────┐
│          总物理内存: 3,400 MB           │
├─────────────────────────────────────────┤
│ Gateway RSS:  1,131 MB (33.3%)          │ ████████████░░░░░░░░░░░░░░░░░░░
│ 系统+其他:    ~800 MB                   │ ████████░░░░░░░░░░░░░░░░░░░░░░░
│ 可用:         ~1,469 MB (43.2%)         │ ░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░
├─────────────────────────────────────────┤
│ ⚠️ 诊断告警线: 1,500 MB RSS            │ ──────────────────X─────────────
│ 🔴 V8 堆上限:  1,800 MB                │ ──────────────────────X─────────
│ 🔴 系统 OOM:   ~3,000 MB               │ ────────────────────────────X───
└─────────────────────────────────────────┘

参照线	阈值	当前值	余量
诊断 Warning	1,500 MB	1,131 MB	369 MB (32.6%)
V8 堆上限	1,800 MB	~1,064 MB	736 MB (69%)
系统 OOM	~3,000 MB	1,131 MB	~1,869 MB

意外发现

1. 未配置 –max-old-space-size（中性发现）

使用 Node.js v22 默认值（~1.8GB）。在 3.4GB 服务器上，这恰好合理——约占物理内存 53%，留出空间给 OS 和其他进程。无需修改。

2. VmSize 33GB（正常但易误解）

这是 V8 的内存映射策略（mmap 预留），不占用物理内存。64位系统上虚拟地址空间几乎无限，VmSize 不代表实际内存消耗。

3. RssAnon vs VmData 的 96MB 差异

已分配但未映射到物理页的空间——V8 预分配了虚拟内存段但未实际使用，正常的内存管理策略。

第五部分：改进建议与总结

潜在改进方向

1. 插件内存上限（当前：加载后常驻）

// 建议: 对长期未使用的插件加载器实施 LRU 淘汰
const pluginCache = createExpiringMapCache({
  ttlMs: 3600000, // 1小时未使用则可卸载
  pruneIntervalMs: 300000
});

2. Session Store 缓存大小限制

当前仅有 TTL，无大小上限。高并发时数千活跃 session 可能占用过多内存。建议添加 maxEntries 配合 LRU 淘汰。

3. WeakRef 用于可选缓存

// 适用于"有则加速、无则重算"的场景
const weakCache = new Map();
function getOrLoad(key) {
  const ref = weakCache.get(key);
  const value = ref?.deref();
  if (value) return value;
  const fresh = loadFromDisk(key);
  weakCache.set(key, new WeakRef(fresh));
  return fresh;
}

4. 添加 Swap 作为安全网

无 Swap 是当前最大的刚性风险。即使 1-2GB 的 swapfile 也能防止极端场景下主进程被 OOM killer 终止。

风险评估

维度	评分	理由
内存使用率	🟢 健康	33.3% 系统占用
泄漏风险	🟢 低	69h 无增长趋势
余量充足度	🟡 中等	369MB 到告警线
容错能力	🟡 中等	无 Swap = 无缓冲区
长期稳定性	🟢 良好	需更长观察期确认

建议优先级

优先级	建议	理由
P1	添加 1-2GB Swap	无 Swap 是最大刚性风险
P2	显式设置 –max-old-space-size=1400-1600	收紧上限，防止极端情况
P3	7天/30天长期监控	排除超长周期的缓慢泄漏
P4	压测并发 subagent 场景	验证峰值承载能力

结论

OpenClaw 在 Node.js 单进程长驻服务的内存管理上展现了工程成熟度：

不信任”GC 会搞定一切” — 主动管理缓存生命周期
分层防御 — 缓存 TTL + 大小上限 + LRU + 诊断告警
流式优先 — 不在内存中持有完整 LLM 响应
隔离子进程 — OOM score 保护主进程
可观测性 — 实时内存指标 + 压力检测 + 增长率分析

实测数据证实：在 3.4GB 无 Swap 的小内存服务器上，OpenClaw 稳定运行 69 小时，RSS 波动仅 3.3%，无内存泄漏特征。六大优化策略中五个有直接/间接证据支持其有效性。

对于构建类似长驻 Node.js 服务的开发者，核心经验是：内存管理不能依赖 GC 的善意。每一个缓存都需要 TTL，每一个 Map 都需要上限，每一个定时器都需要 unref()，每一个子进程都需要 OOM 隔离。 这些看似繁琐的工程细节，正是系统在第 69 小时仍然稳如泰山的根本原因。