全球 AI Agent 基础设施研究周报 · 第 1 期(2026-06-11 ~ 06-17)

全球 AI Agent 基础设施研究周报 · 第 1 期(2026-06-11 ~ 06-17)
全球 AI Agent 基础设施赛道 · 2026 第 25 周

覆盖区间:2026-06-11(周四)00:00 → 2026-06-17(周三)24:00(上海时区)。聚焦 AI Agent 基础设施赛道——运行时 / 编排层 / 框架托管,不是应用层、不是全行业泛报。本期覆盖 11 个核心对象(三大云厂托管平台 100% 必覆盖 + 模型厂商平台 + 通用框架 + 数据/开源/中国 Agent 平台)。


📌 本期 TOP 5(按对基础设施格局的信号价值排序)

  1. AWS AgentCore harness 正式 GA + Managed Knowledge Base + 原生 Web Search(6/17 AWS Summit New York) — 三大云厂里本周信息量最大的一家。harness GA 把开发门槛从”写编排循环”降到”写配置”,model-agnostic 且支持会话中途切换 provider 不丢 context,叠加托管 RAG 与”零数据外流”Web 搜索,把竞争推进到”知识接入+持续改进+边缘治理”的全栈深水区。
  2. Anthropic Claude Fable 5 / Mythos 5 发布(6/12) — “模型即长程 agent 引擎”叙事的新高度:长任务记忆增益约 Opus 4.8 的 3 倍,Stripe 用其在 5000 万行 Ruby 代码库一天完成本需两个月的全库迁移;定价 $10/$50 每百万 token,叠加 30 天强制留存新政,直接拉高 Claude Agent SDK 长程场景天花板。
  3. Databricks Agent Bricks 升级为综合性开发者 Agent 平台(DAIS 2026,6/16) — 平台已构建 10 万+ agents、年处理超 1 quadrillion tokens,新增 Kimi 支持并与 SpaceX 合作把 Grok 原生接入;”any model + any harness”中立编排 + 数据治理护城河,标志数据湖仓厂商正式转型企业 Agent 平台厂商。
  4. Google Gemini Enterprise 商业化落地提速 + ADK 2.0 Workflow Runtime — 本周”产品静默、商业活跃”:Macy’s 4 周建成对话式 AI、Randstad onboarding 快 3 倍、A2A 已 150 家组织 production 路由真实任务;ADK 2.0 新增图执行引擎与 Task API,对标 AWS Strands 导出与微软 MAF Workflow。
  5. 字节 Coze 3.0 + 开源 Coze Loop 高强度迭代 — 中国 Agent 平台做”开放编排中枢”的关键信号:扣子 3.0(6/1 上线)把 Claude Code/Codex CLI/OpenClaw 纳入同一协作空间;Coze Loop 本周补齐 trajectory/webhook/feedback 等企业级评测运维能力,”社区版引流 + 企业版变现”双轨落地。

本周怎么读

如果把本周的 Agent 基础设施动态串成一条线,会看到三股力量在同一个方向上较劲:三大云厂比拼托管平台的组件密度与商业落地,模型厂商与通用框架把竞争从开源 SDK 上移到托管平台与治理平面,数据/开源/中国平台则争抢多 Agent 的”控制平面”。下面依次展开这三条战线,最后收束本周的格局判断。


一、三大云厂:托管平台的全栈较量

云厂这一组本周信息量最大,三家路线已明显分化。先看发布最密集的 AWS。

AWS:AgentCore harness GA + 托管知识库

  • 本周动态:本周是AgentCore近期最密集的发布周——核心引爆点是 2026-06-17 AWS Summit New York(VP of Agentic AI 的 Swami Sivasubramanian 做 keynote)。本周AgentCore的更新围绕”让agent知道更多、改进更快、管控更稳”三条主线展开(原文:connecting AI agents to organizational, web, and paid knowledge; helping teams find and fix what’s going wrong in production; and enforcing controls that scale as agents grow more capable)。重磅落地项有四:①AgentCore harness 正式GA(6/17)——这是把”agent的身体”做成托管能力:harness负责跑 orchestration loop、执行工具、管理context window、跨轮持久化state、失败恢复、会话隔离。开发者不再手写循环,而是用配置定义agent的model/tools/skills/instructions,AgentCore自动组装并运行,”分钟级”产出生产级agent,自带独立隔离环境(filesystem+shell)、跨会话memory、AWS策展skills目录、web browsing。关键差异化:harness与model解耦——可任选模型并在会话中途切换provider而不丢context(如一个模型做规划、另一个写代码);需要自定义编排时一条CLI命令即可导出为Strands-based代码(Claude Agent SDK导出目标”coming soon”)。已在所有 AgentCore 可用的 AWS Commercial Regions 上线。②Amazon Bedrock Managed Knowledge Base——托管RAG管线,含native data connectors、Smart Parsing(多格式自动数据准备)、Agentic Retriever(复杂多步查询),全部与 AgentCore Gateway 集成。③Web Search on AgentCore——全托管web搜索工具,让agent基于当前、带引用的web知识作答,且零数据外流(zero data egress)于客户安全AWS环境内。④AWS WAF 新增 AI traffic monetization——内容方可对访问其内容/API的AI bot与agent定价、计量、收款(边缘侧授权)。整体路线判断:AWS正把AgentCore从”原语集合”推向”端到端托管agent平台”,harness GA是把开发门槛从”写编排循环”降到”写配置”的关键一跃,model-agnostic + 中途切换provider是直接对标对手锁定的杀招。
  • 关键数据:harness GA 日期 = 2026-06-17(来源:https://aws.amazon.com/about-aws/whats-new/2026/06/amazon-bedrock-agentcore-harness-generally-available/ ,2026-06-17);AgentCore model-agnostic 支持 OpenAI/Gemini/Claude/Nova/Llama/Mistral(来源:https://aws.amazon.com/bedrock/agentcore/faqs/ );可用区域=所有 AWS Commercial Regions where AgentCore is available(来源同harness公告)。
  • 原文链接:https://aws.amazon.com/blogs/aws/top-announcements-of-the-aws-summit-in-new-york-2026/ ;https://aws.amazon.com/blogs/machine-learning/new-in-amazon-bedrock-agentcore-build-agents-with-broader-knowledge-and-continuous-learning/ ;https://aws.amazon.com/about-aws/whats-new/2026/06/amazon-bedrock-agentcore-harness-generally-available/
  • 影响判断:这是三大云厂里本周信息量最大的一家。harness GA + Managed Knowledge Base + 原生Web Search 把”知识接入—编排—持续改进”补成闭环,直接抬高Google/Microsoft的对标门槛;”零数据外流”web search与WAF的AI内容计费是企业合规与内容经济两个新战场的卡位信号。

Microsoft:Benchmarks 预览,打“可信可评测”牌

  • 本周动态:本周窗口内(6/11–6/17)微软的”重磅级”发布主要发生在Build 2026之后的常规节奏里——注意:Microsoft Build 2026本身是6月2–3日(背景,非本周),本周是其后续GA/preview的落地与文档化。①Benchmarks in Microsoft Foundry(preview)正式上线(Azure Charts记录 2026-06-15 13:00 UTC,社区博客约6/13发布)——这是把”标准化模型与agent质量检查”做进Foundry:开发者可挑选推理类基准(如 GPQA Diamond、MuSR)针对某个agent(及其版本)运行,在更换底层模型/系统提示/工具集时把基准分当作”稳定标尺”作横向对比;从agent详情页的Evaluation标签可打开同一向导并scope到该agent(来源:techcommunity.microsoft.com benchmarks-in-microsoft-foundry-preview 文章)。②A Guided Tour of the New Microsoft Foundry Labs(Azure Charts记录 2026-06-15 23:41 UTC)——Foundry Labs作为实验性能力的入口被重新梳理。③本周内仍在兑现Build 2026承诺的关键节点:hosted agents的Tracing与Evaluation”将于2026年6月晚些时候GA”(来源:devblogs Foundry agent-service-build2026),即本窗口正处于该GA落地前夕;incoming A2A(agent对外暴露A2A端点)处于public preview。背景补充(非本周,6/8):Foundry的agent安全能力在Microsoft Defender for Cloud中正过渡到 Microsoft Agent 365 license(Azure Updates记录 2026-06-08)。技术路线判断:微软的差异化在”开放信任栈”——Build 2026推出的开源评测ASSERT、开放标准Agent Control Specification(ACS)、Rubric评估器,加上本周的Benchmarks(preview),构成”policy→evaluation→runtime control→production confidence”闭环;同时Microsoft Agent Framework(MAF) 已GA(1.0,4月),本周GitHub仍在主推 Foundry Hosted Agents(”2行代码部署托管”)、Workflow图编排、A2A/Azure Functions/Durable Task hosting,跨Python与.NET双栈、支持Foundry/Azure OpenAI/OpenAI/GitHub Copilot SDK。整体看微软把”可信、可观测、跨框架”作为对AWS/Google的卡位点。
  • 关键数据:Benchmarks(preview) 上线 = 2026-06-15 13:00 UTC(来源:https://azurecharts.com/updates?search=1&service=147 );Foundry Labs guided tour = 2026-06-15 23:41 UTC(同上);hosted agents Tracing/Eval GA = “later in June 2026”(来源:https://devblogs.microsoft.com/foundry/agent-service-build2026/ );MAF GitHub 提供 Python+.NET 双栈、Foundry Hosted Agents “2行代码”部署(来源:https://github.com/microsoft/agent-framework );Star数=未能从页面文本提取(需直查stargazers页)。
  • 原文链接:https://azurecharts.com/updates?search=1&service=147 ;https://devblogs.microsoft.com/foundry/agent-service-build2026/ ;https://github.com/microsoft/agent-framework ;https://learn.microsoft.com/en-us/azure/foundry-classic/agents/whats-new
  • 影响判断:微软本周无”惊雷级”独立大发布,但Benchmarks(preview)把”agent质量可量化、可回归”做进托管平台,正面回应企业”agent上线后好坏无从判断”的痛点;叠加6月晚些时候hosted agent Tracing/Eval GA,微软在”可观测+可评测”这条线上对AWS AgentCore Observability、Google Agent评估形成正面竞争。注意classic Agents已宣布2027-03-31退役,迁移压力是客户侧近期变量。

Google:商业落地提速,ADK 升至 2.0

  • 本周动态:本窗口内(6/11–6/17)Google的”产品级release notes”在Vertex AI官方页面上无新增条目(gen-AI release notes最近一条为5/26 Extensions弃用,再上为4月,本周静默);但生态与商业化侧在本周非常活跃,主战场是 Google Cloud London Summit 2026(约6/16–6/17) 与持续的客户落地:①Macy’s “Ask Macy’s” AI Agent——基于 Gemini Enterprise 在”4周”内构建上线的对话式AI(来源:Google Cloud Press Corner,2026-06-17 LONDON/PRNewswire 稿,新方案为含Myprotein在内品牌带来”significant performance uplift”)。②Randstad Digital × Google Cloud(2026-06-11)——用 Gemini Enterprise 让工程师onboard速度最高快3倍。③Smals(比利时公共部门)(2026-06-11)——用Google公有云强化IT基础设施。④背景(非本周,但本周仍在Marketplace推进):Oracle AI Database Agent for Gemini Enterprise 进入preview(Cloud Next 2026公布,Google Marketplace上架)。产品架构层面需厘清:Google已把原”Vertex AI / Agent Builder”统一演进为 Gemini Enterprise Agent Platform(Cloud Next 2026,2026-04发布,背景),围绕 Build / Scale / Govern / Optimize 四支柱组织:Build含ADK、Agent Studio、Agent Garden、Managed Agents API(config-driven、REST-first、托管sandbox);Scale含Agent Runtime(亚秒级冷启动、长时运行agent)、Sessions、Memory Bank、Code Execution;Govern含Agent Registry、Agent Identity、Agent Gateway+Model Armor、Governance Policies、AI威胁扫描;Optimize含Agent evaluation(Multi-Turn AutoRaters、Online Evaluation)、Unified Trace Viewer、prompt优化。开发框架侧 ADK 仍在快速迭代——GitHub google/adk-python README显示已进入 2.0(含BREAKING CHANGES),新增 Workflow Runtime(图执行引擎:routing/fan-out-in/loops/retry/state/human-in-the-loop/嵌套workflow)与 Task API(结构化agent-to-agent委派),发布节奏”约双周一次”,Apache 2.0、Python 3.10+。A2A协议背景:A2A已从最初50+伙伴扩展到”150家组织在production路由真实任务”(来源:thenextweb Cloud Next报道,背景)。技术/商业路线判断:Google本周打法是”用客户logo和落地速度(4周建Macy’s、3倍onboarding)讲商业化故事”,而非发新组件,反映其Gemini Enterprise Agent Platform已过”发布期”进入”采用证明期”。
  • 关键数据:Macy’s “Ask Macy’s”=4周构建、Gemini Enterprise驱动(来源:https://www.googlecloudpresscorner.com ,2026-06-17);Randstad Digital onboarding”最高快3倍”(来源:同上,2026-06-11);A2A=150家组织production(来源:https://thenextweb.com/news/google-cloud-next-ai-agents-agentic-era ,背景);Agent Engine定价=2026-01-28起 Sessions/Memory Bank/Code Execution开始计费、Runtime已降价(来源:https://docs.cloud.google.com/vertex-ai/generative-ai/docs/release-notes ,背景2025-12-16);ADK已至2.0含Workflow Runtime+Task API(来源:https://github.com/google/adk-python )。
  • 原文链接:https://www.googlecloudpresscorner.com ;https://docs.cloud.google.com/gemini-enterprise-agent-platform/overview ;https://github.com/google/adk-python ;https://docs.cloud.google.com/vertex-ai/generative-ai/docs/release-notes
  • 影响判断:Google本周”产品静默、商业活跃”,与AWS Summit NY的”产品轰炸”形成鲜明对比——说明Google把Cloud Next 2026的平台红利转化为客户落地(零售Macy’s、人力Randstad、公共部门Smals、伙伴Oracle),用”4周/3倍”这类可量化ROI对冲AWS的功能密度。ADK 2.0的Workflow Runtime+Task API是开发者侧对标AWS Strands导出、微软MAF Workflow的关键一手。

三大云厂:格局正在怎么变

本周最强信号来自AWS的”功能轰炸”对Google”商业静默”的镜像对比:AWS Summit New York(6/17)一口气把 AgentCore harness GA、Managed Knowledge Base、原生Web Search(零数据外流)、WAF AI内容计费四件套打包推出,把竞争焦点从”能不能托管agent”推进到”知识接入+持续改进+边缘治理”的全栈深水区;Google则反其道而行,本周不发新组件,转而用 Macy’s(4周上线)、Randstad(onboarding快3倍)等客户logo证明 Gemini Enterprise Agent Platform 的落地ROI;微软居中,以 Benchmarks(preview)+即将GA的hosted agent Tracing/Eval 卡位”可信·可评测”。三家路线已清晰分化:AWS拼组件密度与model-agnostic中途切换、Google拼商业落地与A2A生态(150家production)、微软拼开放信任栈(ASSERT/ACS/Rubric/Benchmarks)。共同趋势是”harness/runtime托管化+知识接入+可观测评测”正成为三家标配战场,agent平台竞争正式进入”生产可靠性与治理”的下半场。



二、模型厂商与通用框架:从 SDK 走向托管平台

云厂在拼托管入口,模型厂商和通用框架这一组则在把竞争从“开源库”抬向“托管平台 + 治理平面”。先看 OpenAI。

OpenAI:从 Swarm 到 Agents SDK

  • 本周动态:本周OpenAI侧Agent基础设施的可见动态集中在三条线。①openai-agents-python v0.17.5 于2026-06-11发布(GitHub release页确认,UTC 06-11 04:11),延续”约周更”节奏。本次为纯维护性版本:核心修复包括 fix: expose sandbox error retryability(#3581)、把 tool-end hook 结果类型化为 object(#3518)、SpeechGroupSpanData __slots__ 采用 tuple 形式(#3534)、Modal sandbox extra 升级到 1.4.3(#3538);其余为文档/测试改进(新增 MongoDB session 示例、MCP 参数 docstring 修订、_openai_retry 覆盖率从77%→95%)。无新组件 GA,无 API 破坏性变更,说明 SDK 已进入稳定打磨期,重心在 sandbox 沙箱、MCP 传输与 Realtime 语音的可靠性。②平台侧:6/11 ChatGPT/Codex 大版本(Codex app 26.609 / CLI 0.140.0)落地,新增 rate-limit reset banking、Developer mode(受控 Chrome DevTools Protocol 访问做性能剖析与网络/控制台调试)、/init 生成 AGENTS.md 脚手架、Enterprise 版 Windows 上的 Computer Use;6/16 Codex app 能力扩展至 EEA/UK/瑞士(含 macOS/Windows Computer Use、Chrome 扩展、Memories、Chronicle 研究预览)。③模型与API:Responses API 持续作为主力调用面,GPT-5.5(复杂推理/编码)与 GPT-5.4 mini/nano 经 Responses API + Client SDK 提供;6/12 ChatGPT 端正式下线 GPT-5.2(Instant/Thinking/Pro)并迁移至 GPT-5.5。Assistants API 仍处于”2026年内弃用、由 Responses API 吸收全部能力”的既定路线(背景)。技术/商业判断:OpenAI 的 Agent 战略已明显从”开发者 SDK 原语”上移到”产品化 Codex + Responses API 托管面”,Computer Use 的区域合规扩张(EEA/UK/瑞士)是本周最具商业意义的信号——把桌面操作能力推向受监管市场。
  • 关键数据:openai-agents-python v0.17.5 发布于 2026-06-11(https://github.com/openai/openai-agents-python/releases ,06-11 04:11 UTC);Codex CLI rust-v0.140.0、Codex app 26.609 于 2026-06-15 前后(https://releasebot.io/updates/openai );GPT-5.2 于 2026-06-12 在 ChatGPT 下线(同源)。Stars/营收本周未在官方源公开 → 未公开。
  • 原文链接:https://github.com/openai/openai-agents-python/releases ;https://releasebot.io/updates/openai ;https://developers.openai.com/api/docs/models
  • 影响判断:①SDK 进入稳定期、平台层(Codex+Responses)成为创新主战场,预示 OpenAI 把”Agent 基础设施”定义为托管产品而非纯库。②Computer Use 向欧洲受监管区扩张,是与 Anthropic Computer Use 正面竞争的合规护城河动作。③Assistants→Responses 的统一仍在推进,开发者迁移压力将在 2026 下半年集中释放。

Anthropic:MCP 与 Agent SDK 双线推进

  • 本周动态:本周Anthropic侧是B组最重磅的一周,主线是6/12 同时发布 Claude Fable 5 与 Claude Mythos 5(Anthropic 官方 news,原文见下)。Fable 5 是“Mythos 级、面向通用安全使用”的旗舰模型,号称在几乎全部能力基准上 SOTA,软件工程、知识工作、视觉、科研均领先;定价 $10/百万输入 token、$50/百万输出 token,不到 Claude Mythos Preview 的一半。对 Agent 基础设施的直接含义:①长任务自主性大幅提升——官方称 Fable 5 能比以往任何 Claude 模型工作更久,在带文件型持久记忆的长任务中表现提升是 Opus 4.8 的三倍;早期客户 Stripe 报告 Fable 5 在 5000 万行 Ruby 代码库中一天完成本需团队两个月的全库迁移,直接利好 Claude Agent SDK 的长程 agentic 场景。②Computer Use/视觉:Fable 5 成为视觉新 SOTA,可从截图重建 Web app 源码、用纯视觉极简 harness 通关 Pokémon FireRed,意味着 Computer Use 类 agent 的脚手架需求下降。③新数据留存政策:对 Mythos 级模型一二三方流量强制 30 天留存(不用于训练,仅用于防御新型 jailbreak/跨请求攻击),这是 agent 部署侧合规的新变量。安全侧 Fable 5 引入分类器,命中网络安全/生物化学/蒸馏类请求时自动回退至 Opus 4.8,官方称 >95% 会话不触发回退;Mythos 5 仅限 Project Glasswing 网络防御伙伴(与美政府合作)。订阅制 6/12–6/22 免费含 Fable 5,6/23 起需用量额度。Claude Agent SDK(Python)本周高频迭代:GitHub release 显示 06-11/06-12(×3)/06-13/06-15/06-16/06-17 多次发版,其中 v0.2.101 于 2026-06-13 发布(PyPI claude-agent-sdk 0.2.101,捆绑 Claude CLI 2.1.177),核心是把 system/task_updated 终态事件类型化为 TaskUpdatedMessage(含 task_id/patch/status/session_id/uuid),修复后台任务在无 TaskNotificationMessage 时消费者挂起的问题,并新增 TERMINAL_TASK_STATUSES 便于活动任务记账(#1016)——表明 SDK 正强化“后台/长时 agent 任务”的可靠生命周期管理。MCP 侧本周无重大协议版本跳变,MCP Apps(向 Claude/ChatGPT 等宿主交付交互式 UI)持续为生态背景(背景,非本周)。
  • 关键数据:Fable 5 / Mythos 5 发布 2026-06-12,定价 $10/$50 每百万 token;claude-agent-sdk v0.2.101 发布 2026-06-13,捆绑 Claude CLI 2.1.177;>95% 会话无安全回退、长任务记忆增益约 Opus 4.8 的 3 倍。来源:https://www.anthropic.com/news/claude-fable-5-mythos-5 、https://github.com/anthropics/claude-agent-sdk-python/releases 、https://pypi.org/project/claude-agent-sdk/0.2.101/ 。GitHub Stars 本周未在官方源核实 → 未公开。
  • 原文链接:https://www.anthropic.com/news/claude-fable-5-mythos-5 ;https://github.com/anthropics/claude-agent-sdk-python/releases
  • 影响判断:①Fable 5 把“模型即长程 agent 引擎”的叙事推到新高度,记忆/视觉/自主性提升将直接拉高 Claude Agent SDK 在编码与科研 agent 的天花板。②30 天强制留存政策是企业 agent 部署的新合规摩擦点,可能影响金融/医疗客户选型。③SDK 高频迭代聚焦后台任务生命周期,印证 Anthropic 把“可靠长时运行”作为对抗 OpenAI Codex 托管化的差异点。

LangChain:从框架走向托管平台

  • 本周动态:LangChain 生态本周三条线同时推进。①开源版本:GitHub release 显示 langgraph 1.2.5 于 2026-06-12 发布(#8062),主要为修复类(merge lc_versions config metadata #8052、空 thread 上 deltaChannel 的 updateState bug #8011,并将 Python 类型检查迁到 ty);langgraph-cli 0.4.30 于 2026-06-16 发布(#8101,新增“兼容 API 版本区间”支持 #8023);cli 0.4.29(06-11,支持以 HTTPS 跑 dev server 传 certfile/cert key #8031)。sdk-py 近期密集引入 v3 streaming primitives、WebSocket 流传输、RemoteGraph v3 streaming(多为 6月初,背景)。②平台/产品化:官方博客本周重点是 LangSmith Fleet(前身为 Agent Builder)的推出,配套 6/16 发文《Why Fleet Has Both General Purpose Chat and Specialized Agents》;LangSmith 线近期还推出 LangSmith Engine(5/13)、“给 agent 配专属计算机”沙箱能力(6/5)、《How We Made Coding Agent Spend Predictable》(6/15,成本可预测)、《How to Choose the Right Sandbox for Your Agent》(6/12)——主线是把 LangSmith 从“可观测/评估”升级为“agent engineering platform + Deployment”一站式。③安全事件:Check Point 本周披露 LangGraph 三个已修复漏洞构成的 RCE 链:CVE-2025-67644(SQLite checkpoint 的 SQL 注入,CVSS 7.3,<3.0.1)+ CVE-2026-28277(msgpack 不安全反序列化,CVSS 6.8,langgraph<1.0.10)可链式达成远程代码执行,另有 CVE-2026-27022(Redis checkpoint RediSearch 查询注入,CVSS 6.5)。仅影响使用 SQLite/Redis checkpointer 且暴露 get_state_history() 的自托管部署;LangChain 托管平台(LangSmith Deployment)不受影响。④客户案例:6/12 发布 Box AI 案例(企业内容平台用 Deep Agents 走向 AI-native)、6/3 Harmonic 用 Deep Agents 重构 Scout 并借 LangSmith 将留存率提升 4 倍。技术/商业判断:LangChain 正把重心从开源框架转向“托管平台(LangSmith Deployment/Fleet)+ 可观测 + 成本控制”的商业化闭环,且用“托管版不受 RCE 影响”作为推动客户从自托管迁往托管的有力话术。
  • 关键数据:langgraph 1.2.5 发布 2026-06-12、langgraph-cli 0.4.30 发布 2026-06-16(https://github.com/langchain-ai/langgraph/releases );CVE-2025-67644 CVSS 7.3 / CVE-2026-28277 CVSS 6.8 / CVE-2026-27022 CVSS 6.5(https://thehackernews.com/2026/06/langgraph-flaw-chain-exposes-self.html ,2026-06);Harmonic 留存率 4x(LangChain 博客 6/3)。Stars/营收本周未公开。
  • 原文链接:https://github.com/langchain-ai/langgraph/releases ;https://www.langchain.com/blog ;https://thehackernews.com/2026/06/langgraph-flaw-chain-exposes-self.html
  • 影响判断:①LangSmith Fleet/Engine + Deployment 标志 LangChain 完成从“开源库”到“agent engineering platform”的商业定位转型,与 LangGraph Platform 托管化互补。②RCE 漏洞链是本周生态负面信号,但反而强化了“用托管版规避自托管安全负担”的商业逻辑。③Box AI/Harmonic 等企业 logo 落地,表明 Deep Agents + LangSmith 在企业级 agent 落地上势头稳固。

CrewAI:双层路线打企业数据栈

  • 本周动态:CrewAI 本周核心动态是开源框架 v1.14.7 于 2026-06-11 发布(GitHub release,UTC 06-11 17:13,经数个 rc/alpha 收敛而来)。本次为本周期最重要的功能版本,方向明确指向”企业平台化 + 多后端可插拔”:①可插拔默认后端——memory/knowledge/rag/flow 均支持 pluggable default backends,locking backend 可覆盖,意味着企业可把记忆/知识/RAG 接到自有基础设施;②对话式 Flow——新增 chat API for conversational flows、conversational flow traces、handle_turn,把 CrewAI 从”任务编排”扩展到”对话式 agent”;③企业数据栈集成——新增原生 Snowflake Cortex LLM provider、Databricks 集成指南、Snowflake 集成指南,直击企业数据平台;④Flow DSL 重构——把 flow.py 拆分为 DSL/definition/runtime,FlowDefinition 由 DSL 元数据构建,flow 条件求值改为按事件无状态,提升并发隔离与可维护性;⑤可观测——surface 真实 finish_reason/sampling params/response.id 到 LLM events,更新 OpenTelemetry collector 文档。企业版(AMP/Agent Control Plane):5/28 版本新增 Agent Control Plane (ACP, Beta) 文档与导航、企业版分类化 release notes、Skills Repository(5/21 引入,后移至 experimental + CREWAI_EXPERIMENTAL gate),并强化 StdioTransport 防环境变量泄露、checkpoint 序列化健壮性——这些是 CrewAI 平台化(AMP/ACP)持续推进的具体抓手(部分为背景)。安全侧本版解决 aiohttp/docling/docling-core 的 pip-audit CVE。技术/商业判断:CrewAI 正沿”开源 framework → Enterprise AMP/Agent Control Plane”双层路线推进,本周 Snowflake/Databricks 原生集成是把多 agent 系统嵌入企业数据栈的关键卡位,Agent Control Plane 是其对标 LangSmith Deployment 的托管/治理平面。
  • 关键数据:crewAI v1.14.7 发布 2026-06-11(https://github.com/crewAIInc/crewAI/releases );新增 Snowflake Cortex LLM provider、Databricks 集成、chat API for conversational flows(同源 release notes);ACP(Beta) 文档于 5/28 版本加入(同源,背景)。GitHub Stars/Enterprise 营收/客户 logo 本周未在官方源核实 → 未公开。第三方称”65% 企业已用 AI agent、81% 已规模化或扩张”(agilesoftlabs 博客 6月,非官方,仅供参考)。
  • 原文链接:https://github.com/crewAIInc/crewAI/releases
  • 影响判断:①v1.14.7 的可插拔后端 + Snowflake/Databricks 原生集成,是 CrewAI 把企业数据栈作为护城河的明确信号。②对话式 Flow(chat API)扩展了 CrewAI 的产品边界,从批处理任务走向交互式 agent。③Agent Control Plane (ACP) 持续 Beta 推进,显示 CrewAI 正补齐”托管+治理”平面以对标 LangSmith Deployment 与 OpenAI/Anthropic 的托管化。

模型厂商与框架:托管化是不可逆趋势

四大对象共同指向一个清晰主线:Agent 基础设施正从”开源 SDK 原语”全面转向”托管平台 + 治理平面”的商业化竞赛。OpenAI 用 Codex+Responses API 把创新上移到托管产品层、SDK 进入稳定期;Anthropic 用 Fable 5 把”模型即长程 agent 引擎”推到新高度,并以 SDK 后台任务可靠性 + 30 天强制留存政策构筑长时运行差异;LangChain 完成从”开源库”到”agent engineering platform”(LangSmith Fleet/Engine/Deployment)的定位转型,并借自托管 RCE 漏洞链反向强化托管版价值;CrewAI 则沿”开源 framework → Enterprise AMP/Agent Control Plane”双层路线,用 Snowflake/Databricks 原生集成卡位企业数据栈。协议生态层面,MCP 已成既定底座(OpenAI/Anthropic SDK 均深度内建),本周无协议跳变但 MCP Apps/A2A 仍是生态焦点;框架托管化已是不可逆趋势——四家无一例外都在把”可靠长时运行 + 可观测 + 合规治理”作为托管平台的核心卖点,纯开源库的商业天花板正被快速压缩。



三、数据、开源与中国平台:争夺控制平面

看完模型厂商的托管化,再把视线移到数据平台、开源阵营与中国力量这一组。先看本期事件量最大的 Databricks。

Databricks:Agent Bricks 升为开发者平台

  • 本周动态:本期最大事件——Databricks 在 Data + AI Summit 2026(DAIS,6月16日旧金山开幕) 官方博客发布《Agent Bricks: Data + AI Summit 2026》,宣布将 Agent Bricks 从”实验性 agent 搭建工具”全面扩展为面向开发者的综合性 Agent 平台(developer agent platform)。原文关键数据与摘录:自去年 DAIS 首发以来,平台上已构建 10万+(100k+)agents,每年处理 超过 1 quadrillion(千万亿)tokens;客户包括 AstraZeneca、7-Eleven、Fox Corporation、Block 等已在 Agent Bricks 上发布生产级 agent。Databricks 提出核心论点”the missing 99%”:真正的 agent 主循环只占工作量的 1%,其余 99% 是 token 容量、部署、安全、评测、监控、上下文、共享等”隐藏技术债”。平台围绕三大支柱重构:①Choice(选择)——单一平台内集成全部前沿闭源与开源模型,原生纳入安全边界,新增 Kimi 支持,并宣布与 SpaceX 合作把 Grok 模型原生接入 Databricks(除已有 OpenAI、Anthropic、Gemini、Qwen 外);支持任意 agent harness,包括开源框架 LangGraph、Agno、CrewAI 以及 Claude Code SDK、OpenAI Agent SDK,并提供其上周末刚开源的 meta-harness Omnigent 的托管版用于编排多 harness;②Context(上下文)——研究团队在 agentic search、memory scaling、可编程 scratchpad(Memex)、评测(MemAlign)、grounded reasoning(OfficeQA benchmark)等方向落地;用 RL 训练出在 Genie 相关任务上”质量更高且每查询成本远低于 Opus/Sonnet”的自定义数据 agent;③Control(控制)——针对 agent 误删代码库、prompt injection 泄密、成本爆炸(员工”tokenmaxing”)等风险提供安全部署与成本控制。技术/商业判断:Databricks 的差异化在于”数据+AI 统一治理”——agent 既消费数据(工具/上下文)又生产数据(输出/动作/推理轨迹/记忆),全部需治理与分析,这是其相对纯 agent 框架厂商的护城河。配套生态信号强烈:Monte Carlo 已推出对 Agent Bricks 的零插桩原生可观测性(同时支持 Knowledge Assistant 托管模板与 Mosaic AI Agent Framework 自定义 agent)。
  • 关键数据:100k+ agents 已构建、1 quadrillion+ tokens/年(https://www.databricks.com/blog/agent-bricks-dais-2026 ,2026-06-16/17);新增 Kimi 模型支持、与 SpaceX 合作接入 Grok(同上);Omnigent meta-harness 上周末开源(同上);Monte Carlo 原生可观测性(https://montecarlo.ai/blog-agent-bricks-support ,2026-06-16前后)。
  • 原文链接:https://www.databricks.com/blog/agent-bricks-dais-2026 (已 web_fetch 全文);产品页 https://www.databricks.com/product/artificial-intelligence/agent-bricks
  • 影响判断:①Databricks 正式从”数据湖仓厂商”转型为”企业 Agent 平台厂商”,与 Snowflake、微软 Fabric 等正面竞争 agent 基础设施层;②”any model + any harness”的中立编排策略 + 原生 MCP 支持,意在做企业 agent 的”控制平面”而非锁定某框架;③与 SpaceX/xAI 的 Grok 合作是模型供给侧的重要信号,表明前沿模型正快速向企业数据平台聚合。

Dify:密集开发 Agent v2 + 可观测

  • 本周动态:本周 Dify 无大版本发布(最近稳定版仍是 v1.14.2,2026-05-19),但 GitHub 主干处于”密集开发期”——本周(06-11→06-18)main 分支提交量被 API 上限 100 截断(即 ≥100 commits/周),强烈信号表明一个全新 “Agent App / Agent v2” 产品线正在合入。从本周 commit 流可清晰读出技术路线:①新增 Agent App 后端(”feat: stream Agent App backend deltas”、”feat: app deploy #35670”);②”Agent v2”运行时(”feat(agent): wire knowledge base retrieval into runtime”、”feat(agent): add Agent Stub drive commands”);③Agent roster 可观测性 API(”feat: add agent roster observability APIs”、”sync generated observability contracts”);④Service API 的 OpenAPI 契约完善、LLM 轮询(polling)支持(”feat(api): LLM polling support”);⑤i18n 多语言持续同步。也就是说,Dify 正从”workflow/chatflow 编排平台”向”原生多 Agent(roster)+ 内建可观测性”演进,对标 Coze 的多 Agent 协作与 Coze Loop 的评测/监控能力。生态侧本周一条具体落地:日本理光(Ricoh)将基于 Dify 的 Self-MoA 文档阅读 workflow 加入其本地部署 LLM Kit(On-Prem LLM Kit),印证 Dify 在日本企业私有化市场的渗透。背景(非本周):Dify 仓库描述已更新为 “Production-ready platform for agentic workflow development”,定位明确转向 agentic。
  • 关键数据:GitHub Stars 145,640、Forks 22,904(https://github.com/langgenius/dify ,2026-06-18 直查);最新发布 v1.14.2(https://github.com/langgenius/dify/releases ,2026-05-19);本周 main commits ≥100(API 直查截断,2026-06-18);理光 On-Prem LLM Kit 集成(https://jp.ibtimes.com/ricoh-adds-self-moa-document-reading-workflow-prem-llm-kit-101703 ,约2026-06-17)。
  • 原文链接:https://github.com/langgenius/dify (Stars/commits 直查);https://github.com/langgenius/dify/releases
  • 影响判断:①Dify 用 14.5万 Stars 维持开源 LLM 应用平台头把交椅,但本周”无发版、重开发”说明下一代 Agent 产品仍在路上,面对 Coze 3.0 已上线的多 Agent 协作存在追赶压力;②”Agent roster + 内建可观测性”是把 Coze Loop/LangSmith 类能力收编进核心平台的策略,意在让开源用户少装一层;③理光案例显示其商业化主战场之一在日本/亚太私有化部署。

字节 Coze:Loop 补齐企业级运维

  • 本周动态:本周覆盖区间内 Coze 无新的大版本发布,但其开源运维平台 Coze Loop 处于高强度活跃开发——GitHub coze-dev/coze-loop 本周(06-11→06-17)合入 7 个 commits,方向集中在企业级评测/运维能力:新增 trajectory(轨迹)OpenAPI(#552)、metadata 系统标签(#548)、实验 webhook 通知(#544)、feedback 反馈指标(#543),并修复了”Redis 抖动导致实验调度失败后卡死”的稳定性问题(#550)。这与 Coze 的商业化主线一致:Coze Loop 是原付费”企业罗盘”的开源版,主打 Agent 全生命周期评测/Trace/监控,本周更新明显在补齐企业生产环境所需的可观测与通知能力。对照之下,核心开源仓库 coze-studio 本周无提交(最后 push 停在 2026-04-20),最新 release 仍为 v0.5.1(2026-02-05),开源主仓进入维护节奏。背景(非本周,6月初):扣子于 2026-06-01 正式上线 3.0,三端(手机 iOS/Android、桌面 Mac/Windows、网页 coze.cn)全量更新,定位从”智能体构建工具”升级为”开放、协同、全栈式 AI 应用开发平台”,核心是多人 + 多 Agent 协作——可在”项目空间”召集不同 Agent 协同从想法到交付;并支持把本地 Claude Code、Codex CLI、OpenClaw 一键接入同一项目空间协作,亦可新建运行在扣子云电脑上的”云端 Agent”长期在线;提供金融/自媒体/医疗/法律/科研等行业技能包、一键加载、多端同步(财联社 2026-06-01)。出海侧:海外版 coze.com 本周无重大公开动态可证实,标”未公开”。
  • 关键数据:coze-studio Stars 21,000、Forks 3,054,最新 release v0.5.1(2026-02-05),本周 0 commits(https://github.com/coze-dev/coze-studio ,2026-06-18 直查);coze-loop Stars 5,528、Forks 764,本周 7 commits(https://github.com/coze-dev/coze-loop ,2026-06-18 直查);扣子 3.0 上线 2026-06-01(https://www.cls.cn/detail/2387208 ,财联社,背景非本周)。
  • 原文链接:https://github.com/coze-dev/coze-loop (本周 commits 直查);https://github.com/coze-dev/coze-studio ;扣子 3.0 https://www.53ai.com/news/coze/2026060185314.html
  • 影响判断:①本周 Coze 的”重心”在企业级运维(Coze Loop 评测/Trace/webhook),而非开源主仓功能更新,反映字节”社区版引流 + 企业版变现”的双轨打法正落到运维层;②coze-studio 主仓本周静默 + 上一发版停在 2 月,说明字节把产品创新主要放在闭源在线版(扣子 3.0)而非开源版,开源更像生态卡位;③Coze 3.0 把 Claude Code/Codex CLI/OpenClaw 纳入同一协作空间,是”中国 Agent 平台做开放编排中枢”的关键信号,对 Dify 多 Agent 路线形成正面压力。

n8n:开源自动化进入安全打磨期

  • 本周动态(动态对象池·本周有发版故纳入):n8n 本周保持高频迭代,覆盖区间内连续发布多个版本,其中重点是 2.27.0(2026-06-16) 大版本与随后的 2.26.4/2.26.5/2.26.6、2.27.1(均 06-15→06-17)补丁。2.27.0 引入一次数据库迁移(为 execution_entity 表加索引,大实例迁移可能耗时数分钟、过程中数据库仍可用),并包含多项修复:API 将条件凭据字段由”禁止”改为”可选”、把 task-runner-launcher 升级到 1.4.7 以清除 stdlib CVE、为客户端 OAuth 流加入 RFC 8707 resource 参数、允许使用私有凭据发布 workflow、”computer use”在客户端停止时的断连状态修复等。后续补丁多为安全与稳定性:1.123.56/1.123.57 修复 hono、vue-i18n、@grpc/grpc-js 等依赖的多个安全问题;2.27.1 调整 COOP 响应头默认值并修复数据库连接恢复期间的查询挂起。整体看本周 n8n 以安全加固 + 企业稳定性为主线,未见重大融资或全新 AI 产品发布。背景(非本周):n8n 主打”fair-code”工作流自动化 + 原生 AI,400+ 集成。
  • 关键数据:GitHub Stars 192,968、Forks 58,639(https://github.com/n8n-io/n8n ,2026-06-18 直查);2.27.0 发布 2026-06-16、2.26.6 发布 2026-06-17(https://github.com/n8n-io/n8n/releases ,直查)。
  • 原文链接:https://github.com/n8n-io/n8n/releases
  • 影响判断:①n8n 以近 19.3万 Stars 稳居开源自动化/Agent IDE 体量第一,本周节奏说明其已进入”企业级安全合规打磨”阶段而非概念扩张;②”computer use”相关修复显示其在持续做 agent 操作电脑类能力;③对中国 Agent 平台(Coze)与 Dify 而言,n8n 代表西方开源自动化生态的成熟度标杆。

开源 vs 闭源:谁来做控制平面

  1. 本周主轴是”Agent 平台化 + 可观测性下沉”:Databricks 把 Agent Bricks 升级为”开发者 Agent 平台”并喊出”missing 99%”(基础设施才是真问题);Dify 主干密集合入 Agent v2 + roster 可观测性;Coze Loop 本周补 trajectory/评测/webhook。三方不约而同把”评测/监控/治理”做进核心平台——agent 竞争正从”能不能搭”转向”能不能在生产环境安全可控地跑”。
  2. 开源 vs 闭源的分工愈发清晰:字节把创新放在闭源在线版(扣子 3.0,6/1 上线多人多 Agent 协作),开源 coze-studio 主仓本周静默、发版停在 2 月——开源是”生态卡位”,闭源是”商业变现”。Databricks 则走”托管平台 + 开源 harness(Omnigent)”混合路线。纯开源阵营里 Dify(14.5万★)与 n8n(19.3万★)仍靠社区体量领跑。
  3. 中国 Agent 平台出海/开放编排是关键变量:Coze 3.0 把 Claude Code、Codex CLI、OpenClaw 等第三方/开源 Agent 纳入同一”项目空间”协作,是中国平台争做”Agent 开放编排中枢”的明确信号,与 Databricks 的”any model + any harness”中立编排殊途同归——谁能成为多 Agent 的”控制平面”,谁就掌握下一阶段入口。海外版 coze.com 本周无可证实公开动态,出海进展仍待观察。
  4. 数据/版本可信度备注:Coze 官方 release_note 页面为 JS 渲染、本次未能抓到结构化正文,国内动态以财联社/53AI 等二手源 + GitHub 一手直查交叉验证;Stars/commits 均为 2026-06-18 GitHub API 实时直查。

📖 相关阅读

上一篇
从源码深挖 Claude Code 的 cache_edits:一次「既删旧又保缓存」的外科手术
下一篇
AWS Strands Agents 上下文压缩机制:源码级深度解读
喜欢这些内容?📡 订阅 RSS 获取更新。
🔍
💡 输入关键词搜索文章
支持中文分词,搜索标题、内容、标签