全球 AI Agent 赛道周报 · 第 3 期（2026-06-15 ~ 06-21）

覆盖区间　2026-06-15（周一）00:00 → 06-21（周日）24:00｜上海时区 覆盖范围　4 大板块 28 个 Agent 对象（编码 Agent/CLI · 通用框架 · 垂直企业 · 浏览器操作+中国）全部信息严格限定在上述自然周内；窗口外动态仅作背景标注，不计入「本周动态」。

本周一句话　编码 Agent 赛道在资本、经济学、技术路线三条线同时进入「生产级深水区」——竞争焦点从「模型能力」全面转向「模型 × 工具 × 算力 × 数据 × 治理」的全栈较量。

🔥 本周 TOP 5

1. SpaceX 600 亿美元收购 Cursor 母公司｜ 2026-06-16

SpaceX（xAI 母公司）在 IPO 数日后宣布以 600 亿美元全股票收购 Anysphere，当日 SpaceX 市值一度冲至 2.97 万亿美元、超越亚马逊成全球第五大公司；交易不动用 IPO 募资，预计 2026 Q3 完成。SpaceX 在招股书中称 Cursor 逾 100 万开发者的编码请求与设计决策数据可改进 Grok 模型。PitchBook 分析师认为交易无法缩小 xAI 与 Anthropic/OpenAI 的模型差距，但「获得开发者比赢得模型竞赛更快变现」。

↳ 为什么重要：前沿模型巨头通过收购直接获得「开发者每日信赖的工具+数据飞轮」，验证「拥有分发入口比赢模型竞赛更快变现」的逻辑，是编码 Agent 赛道资本整合的里程碑。

来源：The Guardian · CNBC

2. Cognition 完成超 10 亿融资、估值 260 亿｜ 2026-06-17

Devin 母公司 Cognition 完成超 10 亿美元新一轮融资、估值达 260 亿美元（较 9 月翻倍有余），Lux Capital、General Catalyst、8VC 领投，Founders Fund 等参投。最硬的数据：收入运行率从去年 5 月的 3,700 万美元飙升至 4.92 亿美元（约 13 倍），客户含 Goldman Sachs、Mercedes-Benz 及美国政府多部门；CEO Scott Wu 称公司 90%+ 内部代码已由 Devin 编写。同期 Devin Desktop 获 NVIDIA 加入多 Agent 研究预览。

↳ 为什么重要：3,700 万→4.92 亿美元是 2026 年最猛的应用层 Agent 营收曲线之一，估值翻倍验证「AI 软件工程师」品类的资本热度。

来源：Economic Times / Bloomberg · Devin Desktop

3. Anthropic 暂停 Agent SDK 计费拆分｜ 2026-06-15

Anthropic 原计划于 6/15 将 Claude Agent SDK、claude -p（headless）、GitHub Actions、经 ACP 认证的第三方 App（Zed/JetBrains 等）用量从 Pro/Max/Team/Enterprise 订阅池剥离、改按标准 API 费率独立计费，以终结「订阅补贴 Agent 用量 15–30×」的结构。但 6/15 当天 Anthropic 确认暂停该变更、维持现状，称将「重新设计以更好支持用户用订阅构建」。

↳ 为什么重要：Agent 算力的定价模型尚未稳定——机器速度的 token 消耗与人类速度的订阅定价之间存在结构性矛盾，「all-you-can-eat 订阅能否撑过 Agent 时代」成为全行业共性张力。

来源：Ars Technica · Digital Applied

4. 智谱 GLM-5.2 + ZCode 3.0 自研内核｜ 2026-06-13 落地 6/16-20

智谱推出 GLM-5.2（总参数约 753B、MoE/DSA、1M 上下文、MIT 开源上线 Hugging Face）与 ZCode 3.0——后者全面切换自研 ZCode Agent 内核，放弃此前套用 Claude Code/Cline 的第三方实现，宣布「后续不再内置其他 Agent 适配」。官方 benchmark：SWE-Bench Pro 62.1（前代 58.4）、Terminal Bench 2.1 81.0、AIME 2026 99.2。公告明确影射 Anthropic 收紧访问：「前沿智能不应被少数规则随时收回」。

↳ 为什么重要：国产编码 Agent 从「套壳 Claude Code」走向「模型+Agent 垂直整合」（iOS 式闭环），并把「开源」从技术选择抬升为企业级「业务连续性/自主可控」叙事。

来源：DataLearner · Hugging Face

5. Harvey 突破 3 亿 ARR + 开源法律基准 LAB ｜ 2026-06-16

法律 AI Harvey 披露已突破 3 亿美元 ARR（去年 8 月还是 1 亿、3 倍增长）、960 名员工、2,000 家客户、月处理约 13 万亿 tokens，累计融资 12 亿美元、估值 110 亿美元。同期开源 Legal Agent Benchmark（LAB）——首个衡量 AI Agent 真实法律任务的开源基准，覆盖 1,200+ 任务、24 个执业领域、75,000+ 评分标准。CEO 抛出「我花了 10 亿美元买 token，ROI 在哪？」的「Token 清算」行业之问。

↳ 为什么重要：垂直 Agent 商业化标杆，开源 LAB 是从「应用层」向「研究机构」卡位的战略动作，「Token 清算」点出长程 Agent 工作流的核心矛盾——谁能证明每 token 的 ROI 谁就赢。

来源：Sourcery · Harvey LAB

🧭 三大维度趋势

学术研究

Agent 自进化进入主流：Google ADK 2.3.0 引入 GEPARootAgentOptimizer，Hermes 用 DSPy + GEPA（ICLR 2026 Oral） 自动进化 skills/prompt——无需 GPU、单次约 $2-10。prompt/agent 自动优化从研究走向工程一等公民。
垂直专属基准成卡位工具：Harvey 开源 LAB（1,200+ 任务/24 领域/75,000+ 评分标准），方法论借鉴 SWE-bench/Terminal Bench。国产模型（GLM-5.2、Kimi K2.7）则普遍存在「自报基准、缺独立第三方复现」的短板。

Agent 工程

企业级安全治理成框架原语：OpenAI Agents SDK 0.17.6 新增工具输入预审批护栏、Google ADK 2.3.0 全面 mTLS + E2B 远程沙箱、Anthropic 自托管沙箱公开测试、Codex CLI Noise 端到端加密 relay——「把执行环境还给客户、把智能环留在云端」成为企业生产范式。
自研内核 vs 开放生态分化：智谱 ZCode 3.0 走「模型+自研内核闭环」，Kimi/OpenCode 走「专用模型+兼容 Claude Code/Cline 开放生态」；LangGraph 1.2.6 深化 v3 streaming + RemoteGraph 做生产级分布式运行时。

商业化与落地

应用层 Agent 集体跨过门槛：Cognition 收入运行率 3,700 万→4.92 亿美元、Harvey ARR 3 亿、Replit ~1.5 亿、Sierra >1.5 亿同步进入陡峭营收曲线。OpenAI 拿下三星全球级部署（Codex 全球周活 >500 万）。
地缘政治成 Agent 资产硬约束：Meta 对 Manus 的 20 亿美元收购在中国发改委监管下被强制拆解、原投资人计划 20 亿原价回购，标志中美 AI 资产跨境流动全面政治化。

💻 编码 Agent / CLI

速查表

对象	热度	本周关键词
Claude Code 🔥	重大	Artifacts 实时共享画布 + auto 模式破坏性命令护栏
OpenAI Codex 🔥	重大	Record & Replay + Noise 加密 relay + 三星部署
OpenClaw 🟢	一般	pre-release 109 PR：运行时可靠性+安全边界+渠道交付
Hermes Agent 🔥	重大	v0.17.0 自进化 GEPA + iMessage 通道 + Composer 接入
Cursor 🔥	重大	详见 TOP5（SpaceX 收购）+ 云子 Agent/SDK/Bugbot
Cognition 🟢	一般	Security in Devin Review + Windsurf 更名 Devin Desktop
OpenCode 🟢	一般	高频 immutable release + MCP 健壮性 + 多模型接入

深度正文

Claude Code（Anthropic）★

本周动态：本周Claude Code最重磅动作是正式推出 Artifacts（制品）功能（面向Claude Team / Enterprise订阅用户）。该功能把一次Claude Code会话的工作产物转化为”实时、可交互、可分享”的自定义HTML网页——可以是仪表盘、应用设计稿或内部小工具，团队成员能在同一URL上实时看到Claude自主或在用户指导下工作时页面的更新。技术上它是无状态画布（stateless canvas）：官方文档直言”An artifact is a capture of work, not an application（制品是工作的快照，而非应用）”。每个Artifact是单个自包含HTML页面，渲染上限16 MiB，被严格CSP包裹——屏蔽所有外部网络请求（不能加载外部脚本/字体/样式，fetch/XHR/WebSocket全禁），所有CSS/JS必须内联，图片须用data URI嵌入。默认私有、仅同组织认证成员可见、不能公开到互联网，管理员有org级开关、RBAC与留存策略+合规API。Claude Code创建者Boris Cherny在X发文称已用它做”代码可视化讲解、系统图、动画预览、数据分析与团队共享仪表盘”，称其为”game changer”。同期GitHub release高频迭代（6/15~6/20几乎每日发版）：6/15加入Tool(param:value)权限规则语法（如Agent(model:opus)屏蔽Opus子Agent）、嵌套.claude/skills目录加载、auto模式下子Agent spawn现在先经分类器评估再启动（堵住越权漏洞）；6/17加入/config key=value即时设置语法、Bun运行时升级至1.4、子Agent面板优化（空闲30s自动隐藏）；6/19强化auto模式安全：破坏性git命令（git reset --hard、git clean -fd、git stash drop）在用户未要求丢弃本地改动时被拦截，terraform/pulumi/cdk destroy非指定stack时被阻止。技术路线判断：Anthropic在”安全自治（auto mode护栏）+ 企业协作（Artifacts）”两条线同时加码，刻意与OpenAI的”持久后端”路线区隔，主打临时、高安全的技术工作流，不碰后端持久化。
关键数据：
- Artifacts渲染上限 16 MiB｜单HTML自包含、CSP禁外部请求 — 来源 https://venturebeat.com/data/anthropics-claude-code-artifacts-update-brings-live-shared-dashboards-and-interactive-workspaces-to-enterprises （2026-06-19报道）；官方文档 https://code.claude.com/docs/en/artifacts
- GitHub release迭代日期：6/15、6/16、6/17、6/19、6/20均有发版 — 来源 https://github.com/anthropics/claude-code/releases （2026-06-22读取）
- Bun运行时升级至1.4（6/17）— 同上release页
原文链接：
- https://github.com/anthropics/claude-code/releases
- https://venturebeat.com/data/anthropics-claude-code-artifacts-update-brings-live-shared-dashboards-and-interactive-workspaces-to-enterprises
- https://claude.com/blog/artifacts-in-claude-code （官方博客）
影响判断：Artifacts把CLI编码Agent从”产代码”升级为”产可分享的实时工作界面”，直击”工程师向非技术stakeholder汇报”的摩擦点，是Agent产品向”协作层/工作面”上探的标志。与OpenAI Codex的”Sites”功能形成两周内的针锋相对，说明编码Agent竞争焦点正从模型能力转向”企业工作面争夺战”。auto模式破坏性命令护栏的持续加码，则是自治Agent走向生产环境的必要信号。

OpenAI Codex / Codex CLI ★

本周动态：本周Codex三条线（app/mobile/CLI）齐进。6/18 Codex app 26.616 推出 Record & Replay（macOS）——把一次”演示过的工作流”录制成可复用skill（初期不含EEA/英国/瑞士，需开启Computer Use），并新增自动化运行历史的批量操作、以及本地与远程主机间的thread handoff（可把一个会话迁移到连接主机上的同名项目继续，Codex能代为协调交接）。6/16 Codex app能力扩展至EEA/英国/瑞士：Computer Use（macOS/Windows）、Codex Chrome扩展、Memories（这些地区默认关闭）、Chronicle（ChatGPT Pro的macOS研究预览，从近期屏幕上下文构建记忆）。6/15 ChatGPT iOS 1.2026.160：加入工作区文件浏览器、目录选择器、diff展开/折叠、MCP审批选项、消息中LaTeX渲染。CLI侧（GitHub openai/codex）：6/18发布0.141.0（稳定），核心是远程执行器改用经认证、端到端加密的Noise relay通道（#26242/#26245），跨平台远程执行保留执行器原生工作目录与shell，选定执行器插件可按线程激活其stdio MCP服务器，MCP默认工具超时提升至300秒（#28234）；6/19-6/21持续发0.142.0-alpha系列（alpha.2~alpha.10）。背景（非本周但相关）：6/2上线的 Sites 功能——OpenAI托管的网站/仪表盘/内部工具/Web应用，支持D1关系数据库与R2对象存储等持久后端，走”PaaS”路线，与Anthropic无状态Artifacts形成对照。技术路线判断：Codex正全力押注”多端协同+远程执行+企业治理“——Noise加密relay、跨主机handoff、access token、Bedrock接入，均指向”在企业基础设施里大规模、可审计地跑Agent”。
关键数据：
- Codex app 26.616（2026-06-18，Record & Replay）｜26.609（6/11）｜26.608（6/9）— 来源 https://developers.openai.com/codex/changelog
- CLI 0.141.0 稳定版（2026-06-18），含Noise relay #26242/#26245、MCP工具超时→300s #28234；0.142.0-alpha.2~alpha.10（6/18-6/21预发布）— 来源 https://github.com/openai/codex/releases
- ChatGPT iOS 1.2026.160（2026-06-15）— 同changelog
- 模型背景：GPT-5.3-Codex与GPT-5.2已于5/26弃用，现役GPT-5.5/5.4/5.4 mini — changelog
原文链接：
- https://developers.openai.com/codex/changelog
- https://github.com/openai/codex/releases
影响判断：Record & Replay把”人类演示→可复用Agent技能”的录制范式带入主流编码Agent，是降低Agent定制门槛的关键一步；Noise端到端加密relay + 跨主机handoff则是Codex在”企业级远程Agent执行”上的硬基建投入。Codex的”Migrate to Codex”导入Claude Code/Cowork配置（6/9）+ Sites的PaaS化，显示OpenAI意图直接抢夺Anthropic开发者与企业工作面，两家进入贴身肉搏的产品节奏。

OpenClaw（Agent OS）★

本周动态：OpenClaw本周保持其标志性的”高频滚动发布”节奏，6/21发出新的pre-release（覆盖v2026.6.9-beta.1..HEAD共109个合并PR）。本期非单一爆点功能，而是围绕”Agent运行时可靠性、安全边界、渠道交付“的系统性硬化。要点：①Agent回合与会话状态更可靠——保留待处理的子Agent完成通知、保持聊天历史transcript非空、维持media index对齐、重启休眠的follow-up drain、一致解析compaction模型别名（#94349/#92383/#94257/#95039/#90885）；②Codex与审批流增强——Codex app-server SecretRefs、线程上下文、有界回合文本、路由审批上下文、类型化SDK审批/会话helper（#94324/#94756等），显示OpenClaw作为”Agent OS”深度集成Codex作为后端执行器；③渠道交付更丰富——Telegram/Discord/Slack保留更丰富的进度/推理/线程输出，处理结构化发送错误，支持Slack快捷方式（#94891/#94856/#78536）；④安全与网络边界——SSH隧道preflight限定loopback、移除device-backed节点配对、doctor暴露易失SQLite状态、拒绝不安全的chat/tool/package/response长度（#94607/#95066/#95078）；⑤新CLI/状态工作流——从chat重命名会话(/name)、显式compact会话、显示会话时长、消息发送/轮询的dry-run预览（#88581/#88988/#94684）；⑥cron安全——递归错误backoff遵守配置下限、隐式隔离投递要求显式目标、默认cron runMode改为”due”而非”force”（#94453）。背景：最新stable为v2026.6.1（6/3 tagged）。技术路线判断：OpenClaw不追单点功能噱头，而是把”自治Agent长期稳定运行+企业级安全治理+多渠道一致交付”做成护城河——这与业界（微软把Agent治理视为Zero Trust问题、Databricks强调治理与评估）的方向一致。
关键数据：
- 本期pre-release（2026-06-21）覆盖109个合并PR（v2026.6.9-beta.1..HEAD）— 来源 https://github.com/openclaw/openclaw/releases （2026-06-22读取）
- 最新stable v2026.6.1（2026-06-03 tagged）— 来源 https://fast.io/resources/openclaw-changelog-guide/ （2周前，需交叉验证）
- cron默认runMode：force→due（#94453）— release页
原文链接：
- https://github.com/openclaw/openclaw/releases
- https://releasebot.io/updates/openclaw （二手聚合）
影响判断：OpenClaw代表”Agent OS”路线——不是单个编码Agent，而是承载多Agent、多渠道、多模型的运行时底座。本周对Codex后端的深度集成（SecretRefs/审批上下文）说明它定位为”编排层”，把Claude Code/Codex等当作可插拔执行器。其对会话状态完整性、安全边界、cron安全的持续投入，是”让Agent能7×24无人值守可靠运行”的关键工程，这正是自治Agent从demo走向生产的胜负手。

Hermes Agent（Nous Research，自进化）★

本周动态：本周Hermes有两条重磅in-window动态。(1) 6/19发布 Hermes Agent v0.17.0（v2026.6.19）”The Reach Release”：自v0.16.0以来约1,475 commits、~800 merged PRs、1,693文件变更、235,390行新增、245位社区贡献者、300+ issue关闭。核心亮点：①新增iMessage通道（基于Photon托管线路池，hermes photon login即用，无需Mac中继/BlueBubbles桥，定位为BlueBubbles继任者）；②加入Raft agent网络（作为外部Agent通过wake-channel桥接，隐私契约设计——wake载荷仅含元数据不含消息体）；③后台/异步子Agent——delegate_task(background=true)派发后台子Agent并立即返回handle，完成时结果作为新turn重新进入对话；④image_generate支持图生图编辑（image-to-image，不止从零生成）；⑤Automation Blueprints——无需学cron语法，按名选自动化、Hermes追问所需参数，一份蓝图在dashboard/CLI/messenger多端原生渲染；⑥接入Cursor的Composer模型——grok-composer-2.5-fast进入xAI OAuth模型选择器（上下文窗口校准至完整200k），用xAI Grok订阅即可驱动Composer；⑦memory工具重大升级——新增operations数组，对最终字符预算原子化应用add/replace/remove批量编辑；⑧dashboard全功能profile构建器+安全登录、Skills Hub浏览器重构（含安全扫描）、curator成本优化（默认不再每次跑LLM consolidation）。(2) 自进化仓库 hermes-agent-self-evolution（约6/17更新）：用 DSPy + GEPA（Genetic-Pareto Prompt Evolution，ICLR 2026 Oral，MIT许可） 自动进化优化Hermes的skills/工具描述/系统prompt/代码——无需GPU训练，全靠API调用，单次优化约$2-10。GEPA读取执行trace理解”为何失败”而非”是否失败”，再提出定向改进，产出PR交人工审核。Phase 1（SKILL.md进化）已实现，Phase 2-5规划中。约束门：全测试套件100%通过、Skills≤15KB、工具描述≤500字符、语义不漂移、所有变更必经人工PR审核绝不直接commit。eval数据可用合成数据或真实session history（含Claude Code、Copilot、Hermes）。
关键数据：
- v0.17.0：~1,475 commits / ~800 PRs / 1,693文件 / 235,390插入 / 50,730删除 / 245贡献者 / 300+ issue（2026-06-19）— 来源 https://github.com/nousresearch/hermes-agent/releases
- v0.16.0：874 commits / 542 PRs / 399 issue（含2 P0/62 P1/16安全）/ 170贡献者（2026-06-05，桌面应用首发，背景）— 同上
- grok-composer-2.5-fast上下文窗口200k — release页
- 自进化：DSPy+GEPA，单次优化$2-10，无GPU；约束Skills≤15KB/工具描述≤500字符 — 来源 https://github.com/NousResearch/hermes-agent-self-evolution
原文链接：
- https://github.com/nousresearch/hermes-agent/releases
- https://github.com/NousResearch/hermes-agent-self-evolution
- https://www.turingpost.com/p/hermes （二手对比）
影响判断：Hermes是”自进化Agent”路线的最激进实践——把GEPA这类前沿prompt进化研究（ICLR 2026 Oral）直接产品化为”无需GPU、$2-10一次”的技能自我优化管道，且坚持”人工PR审核、绝不直接commit”的安全护栏，是”自改进+可控”平衡的范本。v0.17.0单版本1400+ commits的迭代密度+开源+多渠道触达，显示Nous在用极致开源速度与”自托管/数据隐私”叙事对抗闭源大厂。自进化能从Claude Code/Copilot的真实session history学习，预示跨Agent经验迁移将成新战场。

Cursor（Anysphere）

本周动态：本周Cursor有”资本+产品”双爆点。(1) 6/16 SpaceX以600亿美元全股票收购Cursor母公司Anysphere——本周编码Agent赛道最大事件。SpaceX（xAI母公司）IPO数日后宣布该协议，当日SpaceX市值一度冲至2.97万亿美元、超越亚马逊成全球第五大公司。交易以股票支付、不动用IPO募资，预计2026 Q3完成。背景：SpaceX 4月已锁定”600亿收购或100亿合作”二选一期权。分析师观点分化：PitchBook的Harrison Rolfes认为交易无法”缩小xAI与Anthropic/OpenAI模型差距”，但获得Cursor逾100万开发者”是比赢得模型竞赛更快的企业AI营收路径”；SpaceX在招股书称Cursor开发者数据（编码请求、设计决策）可改进Grok。Anysphere背后有a16z、Thrive、Nvidia、Google。(2) 产品侧6/18多项更新：①Automations增强——/automate技能（自然语言即配置触发器/指令/工具）、Slack emoji触发、5个新GitHub触发器、自动化computer use工具（云Agent自产demo）；②云环境配置+云子Agent——/in-cloud独立VM起云子Agent、/babysit远程迭代准备PR、本地与云会话handoff；③Bugbot提速——现由Composer 2.5驱动，平均审查从~5分钟降至~90秒、便宜~22%、每次多发现10% bug（0.62 vs 0.56）；④Cursor SDK——自定义工具、auto-review、JSONL store、无限嵌套子Agent。背景（非本周）：6/16 keynote传出Origin代码平台、>1.5万亿参数自研模型、Cursor Mobile（二手abit.ee/YouTube，未取到一手，标争议）。技术路线判断：Cursor正从”AI编辑器”转向”agentic云端编排平台”，加上SpaceX算力后盾补齐最大短板。
关键数据：
- 收购额600亿美元全股票，2026 Q3完成；SpaceX市值峰值2.97万亿超亚马逊2.65万亿 — 来源 https://www.theguardian.com/science/2026/jun/16/spacex-ai-coding-anysphere-cursor-amazon-market-valuation-xai （2026-06-16）；CNBC交叉验证 https://www.cnbc.com/video/2026/06/16/spacex-to-buy-cursor-ai-parent-company-anysphere-in-60-billion-deal.html
- Cursor用户>100万开发者 — Guardian同文
- Bugbot：~90s（原~5min）、便宜~22%、每次0.62 bug（原0.56），Composer 2.5驱动 — 来源 https://cursor.com/changelog （2026-06-18）
- Origin/1.5T模型/Cursor Mobile（6/16 keynote，二手未一手验证，标争议）
原文链接：
- https://cursor.com/changelog
- https://www.theguardian.com/science/2026/jun/16/spacex-ai-coding-anysphere-cursor-amazon-market-valuation-xai
影响判断：SpaceX收购Cursor是编码Agent赛道资本整合里程碑——前沿模型巨头（xAI/Grok）通过收购直接获得”开发者每日信赖的工具+数据飞轮”，验证”拥有分发入口比赢模型竞赛更快变现”。叠加Cursor向云Agent编排转型，2026下半年编码Agent竞争将是”模型×工具×算力×数据”的全栈较量。

Cognition（Devin / Windsurf）

本周动态：本周Cognition主打”安全审查”与”产品整合”。(1) 6/18发布 Security in Devin Review：在Devin Review中为每个PR增加安全审查，声称能捕捉模式匹配扫描器遗漏的auth bypass与逻辑缺陷。其差异化在于”理解整个代码库”：每个发现按严重程度分类、标CWE ID、基于真实代码库，且不止报警还直接写fix并开为merge-ready PR。能捕获三类模式匹配扫描器遗漏的漏洞：破损授权（如密码修改端点因缺失token静默创建guest session导致账户接管）、业务逻辑缺陷（退款超额、折扣可重复使用）、链式发现（单独低危组合成关键路径）。(2) Windsurf正式更名为 Devin Desktop（公告6/2，本周持续迭代）：本周发版 v3.2.19/v3.2.23（6/18）、v3.2.16（6/16，新增Devin插件系统扩展Devin Local，企业preview/opt-in）。背景：6/12起Devin移除Claude Fable 5访问（因Anthropic公告及美国政府指令），保留Opus 4.8与GPT-5.5。技术路线判断：Cognition将Windsurf完全收编进Devin品牌（一个IDE+Agent Command Center管理本地/云Agent舰队），并把”代码审查（尤其安全）”作为核心差异化点，走”Agent不只写代码，还验证代码”的路线。
关键数据：
- Devin Desktop最新 v3.2.19（2026-06-18）；v3.2.16（6/16，Devin插件系统）；累计122个发布 — 来源 https://www.havoptic.com/tools/windsurf （2026-06-22读取）
- Security in Devin Review发布 2026-06-18 — 来源 https://devin.ai/blog/security-in-devin-review
- Devin移除Claude Fable 5访问（2026-06-12起）— 来源 https://devin.ai/blog/
原文链接：
- https://devin.ai/blog/security-in-devin-review
- https://devin.ai/blog/
- https://www.havoptic.com/tools/windsurf （Devin Desktop changelog）
影响判断：在AI生代码扩大攻击面的背景下，”安全审查内建PR流程”是编码Agent从”产代码”走向”保产质”的关键一步。Cognition把Windsurf收编进Devin、并以全仓理解的深度审查与GitHub扫描器差异化，是其在”企业级代码质量/安全”细分赛道的明确押注。Fable 5下架事件则揭示模型供应受监管/地缘政治影响的新变量。

OpenCode（SST / Anomaly）

本周动态：OpenCode（主维护于github.com/sst/opencode，已迁至anomalyco/opencode组织）本周保持高频immutable release（6/13、14、17、21均有发版），主调为多模型接入+MCP健壮性+桌面端打磨。要点：①6/21：尊重配置的agent step limits（到极限强制输出最终文本而非中途失败）、为GLM-5.2增加high/max thinking变体、修复Devstral模型检测、停止包裹follow-up消息以保prompt缓存有效；②6/17：OpenAI兼容provider接受之前验证失败的MCP工具schema、Cloudflare AI Gateway修复、会话timeline加载提速；③6/10（较大版）：fff-backed文件搜索提速、Cohere North/MiniMax M3 thinking/Claude Fable reasoning支持、WSL-backed桌面支持、会话从context-overflow恢复。背景数据：二手源称OpenCode约160,000 GitHub Stars、7.5M月活开发者（需一手核实）。技术路线判断：OpenCode走”终端原生、模型中立、MCP优先”的开源路线，不绑定单一模型供应商，本周大量MCP兼容性修复体现其”做好Agent与工具生态连接层”的定位。
关键数据：
- 本周release日期：6/13、6/14、6/17、6/21（immutable）— 来源 https://github.com/sst/opencode/releases （2026-06-22读取，重定向至anomalyco/opencode）
- GLM-5.2 high/max thinking变体（6/21 #32446）— 同release页
- 约160,000 Stars / 7.5M月活开发者（二手，未一手验证）— https://byteiota.com/opencode-open-source-ai-coding-agent-guide-2026/
原文链接：
- https://github.com/sst/opencode/releases
影响判断：OpenCode代表编码Agent的”开源中立”阵营——与闭源大厂的纵向整合（Cursor被SpaceX收、Windsurf被Cognition收）形成对比，其价值在于”不锁定任何模型/厨商”。本周密集的MCP兼容性打磨+多新模型（GLM-5.2/Cohere North/MiniMax M3）接入，表明其定位为”模型与工具的中立连接层”，在大厂生态圈地运动中是重要的开源变量。

板块洞察（Agent 框架赛道趋势）

本周编码Agent赛道出现三个拐点信号：①资本整合加速——SpaceX 600亿收购Cursor（6/16）是标志性事件，验证”拥有开发者入口+数据飞轮比赢模型竞赛更快变现”，叠加Windsurf被Cognition收编为Devin Desktop，赛道正从”百花齐放”进入”巨头站队”；②竞争焦点从模型能力转向”企业工作面争夺”——Anthropic Artifacts（无状态画布）vs OpenAI Sites（PaaS持久后端）的两周内针锋相对，说明”代码之上的协作与分享层”成为新战场；③安全与自治同步加码——Claude Code的auto模式破坏性命令拦截、Codex的Noise加密relay、Devin的安全审查、OpenClaw的边界硬化、Hermes的”人工PR审核不直接commit”，集体指向”自治Agent走向生产环境”的必要护栏。最具前瞻信号是Hermes的自进化管道（GEPA, ICLR 2026 Oral）——把prompt/技能/代码的进化优化降至”无GPU、$2-10一次”且能从Claude Code/Codex的真实session学习，预示“跨Agent经验迁移+自动技能进化”将是下一个技术拐点。一句话：编码Agent正从”更好的代码生成器”进化为”可自改进、可协作、可治理的生产力平台”，2026下半年是全栈能力（模型×工具×算力×数据×安全）的决战。

🧩 通用 / 自主 Agent 框架

速查表

框架	热度	本周关键词
LangChain / LangGraph 🟢	一般	1.2.6 回归修复 + v3 streaming/RemoteGraph 深化
Microsoft AutoGen ⚪️	静默	本周无 release，重心并入 Microsoft Agent Framework
CrewAI 🟢	一般	v1.14.8a 预发布：JSON-first / FlowDefinition 低代码
Google ADK 🔥	重大	v2.3.0：GEPA 自优化器 + E2B 远程沙箱 + mTLS
OpenAI Agents SDK 🟢	一般	v0.17.6：工具输入预审批护栏 + SDK-only 数据
Dify ⚪️	静默	本周无 release，main 向 2.0 演进（14.6 万 Stars）
LlamaIndex ⚪️	静默	本周无 release，多模态合成方向（5 万 Stars）

深度正文

LangChain / LangGraph

本周动态：LangGraph 在本周窗口内持续高频迭代。GitHub releases 显示 langgraph 1.2.6 于 2026-06-18 20:58 发布（PR #8139），核心是两条回归修复：①修复嵌套 subgraph 未能继承父 checkpoint_ns 的回归（该回归始于 1.2.3，PR #8053）；②修复 v3 stream abort 时未取消正在运行的 subgraph（closes #8029, PR #8057），并附带依赖升级（tornado 6.5.5→6.5.6）与 README 结构标准化。配套 langgraph-cli 0.4.30 于 2026-06-16 19:46 发布（PR #8101），新功能为”支持兼容的 API version 区间”（feat(cli): support compatible api version ranges, #8023）。从提交流可见 LangGraph 1.2.x 系列正密集围绕 v3 streaming（SSE/WebSocket 传输）、RemoteGraph 远程图、子Agent命名（lc_agent_name） 三条主线推进——这恰是 context engineering + 子Agent编排的工程化落地：v3 流式原语、消息与 tool-call 投影（projections）、流重连加固（harden streaming reconnects）都指向把 LangGraph 做成生产级分布式 Agent 运行时。值得注意 CLI 还新增”部署时追踪 ADK/其他库使用”（#7939），显示 LangChain 在生态竞品兼容上的姿态。整体属”稳态高频维护+流式架构深化”，非里程碑式大版本，但工程密度极高。
关键数据：langgraph 1.2.6（2026-06-18，来源 https://github.com/langchain-ai/langgraph/releases ）；langgraph-cli 0.4.30（2026-06-16，同源）；本窗口前序版本 1.2.5（2026-06-12）。
原文链接：https://github.com/langchain-ai/langgraph/releases
影响判断：LangGraph 已从”图编排库”演进为面向生产的分布式 Agent 运行时，v3 流式+RemoteGraph+子Agent命名是关键信号。高频 patch 节奏（一周两版）说明其商业化 LangGraph Platform 对稳定性的强需求，赛道仍由其领跑工程标准。

Microsoft AutoGen

本周动态：本周无重大公开动态。 核查 microsoft/autogen GitHub releases，最新稳定版仍为 python-v0.7.5，发布时间 2025-09-30（非本窗口；为 2025 年旧版），本周（2026-06-15~21）该仓库无新 release。原因判断：微软已将 AutoGen 的研究路线与 Semantic Kernel 合并为统一的 Microsoft Agent Framework，AutoGen 原仓库进入低频维护/收敛状态，新特性开发主战场已迁移。0.7.5 版内容（背景，非本周）主要是 GPT-5 reasoning_effort 参数支持、Anthropic thinking 模式、GraphFlow 环检测修复、RedisMemory 线性记忆等。本周该项目无可计入”本周动态”的实质性更新。
关键数据：python-v0.7.5（2025-09-30，来源 https://github.com/microsoft/autogen/releases ）——本窗口外。
原文链接：https://github.com/microsoft/autogen/releases
影响判断：AutoGen 作为独立框架的迭代已明显停滞，重心转入 Microsoft Agent Framework。对采用方是重要信号：新项目应评估迁移路径，AutoGen 单飞时代趋于结束。

CrewAI

本周动态：CrewAI 本周处于 v1.14.8 预发布密集迭代期。GitHub releases 显示 2026-06-18 当天连发多个 pre-release：v1.14.8a1（23:42，新增 “single agent action to Flow definitions”、在定义加载期校验 Flow CEL 表达式、新增 Datadog 集成指南与可导入运维仪表盘）、v1.14.8a（17:46，为 each.do 步骤增加可选 if 表达式、修复 JSON crew 问题）、及更早的 v1.14.7 系列收尾。本周技术主线高度聚焦 “JSON-first crews / FlowDefinition”——即让用户无需写 Python 代码、纯靠 JSON/声明式定义来定义并运行 Flow（Implement Flow definition run tools without Python code、Add experimental crewai run --definition for flows、Introduce JSON first crews）。同时实现 DMN 模式（决策建模标记法）支持、script/code block action、crew composite action、表达式驱动的人类反馈（Drive human feedback from the flow definition）。配套 ZIP 部署回退、可插拔后端（memory/knowledge/rag/flow pluggable backends）。这标志 CrewAI 正从”代码框架”向”低代码/声明式 Agent 编排平台”转型，对标企业级可视化编排。
关键数据：v1.14.8a1（2026-06-18）、v1.14.8a（2026-06-18），均 pre-release，来源 https://github.com/crewAIInc/crewAI/releases ；上一稳定版 v1.14.7（2026-06-11，同源）。
原文链接：https://github.com/crewAIInc/crewAI/releases
影响判断：JSON-first/FlowDefinition 是 CrewAI 商业化关键押注——降低使用门槛、瞄准企业低代码市场，与 Dify/n8n 类可视化平台正面竞争。声明式定义+DMN+Datadog 运维仪表盘=明确的企业级落地信号。

Google ADK (Agent Development Kit)

本周动态：ADK 本周在 2.x 与 1.x 双线发布。重磅是 adk-python v2.3.0（tag 标 2026-06-17，release 页 2026-06-18 18:45），特性密集：①新增 GEPARootAgentOptimizer（GEPA 类自动优化器，指向 prompt/agent 自进化方向）；②Gemma4 在 Gemini 中的支持（gemma4: support Gemma4）；③E2BEnvironment 远程沙箱工作区（integrations: Add E2BEnvironment for remote sandbox workspaces）——补齐安全代码执行；④AgentRegistry 客户端 mTLS 支持、McpToolset 迁移到 AsyncAuthorizedSession 支持 mTLS（企业安全强化）；⑤Gemini Live 3.1 输入转写差异化处理、Live API 翻译配置；⑥为 Anthropic/OpenAI 模型上报 cached token 计数；⑦实验性 Antigravity SDK agent wrapper。同日另发 v1.35.1（2026-06-15），为 1.x 维护分支修流式与 grounding_metadata 问题（确保 final partial=False 帧总被产出）。注意 2.2.0（背景，非本周，2026-06-04）已将 LlmAgent 默认模型从 gemini-2.5-flash 改为 gemini-3-flash-preview——本周 2.3.0 延续该 Gemini 3 时代基线。
关键数据：adk-python v2.3.0（tag 2026-06-17 / 发布 2026-06-18，来源 https://github.com/google/adk-python/releases ）；v1.35.1（2026-06-15，同源）；默认模型 gemini-3-flash-preview（自 2.2.0, 2026-06-04，同源）。
原文链接：https://github.com/google/adk-python/releases
影响判断：ADK 2.3.0 的 GEPA 自优化器 + E2B 远程沙箱 + 全面 mTLS 是三大信号：Google 在押注”Agent自进化+企业安全执行”。1.x/2.x 双线维护说明已有大量生产用户需平滑迁移，ADK 正快速成为 Gemini 3 时代的官方 Agent 标准栈。

OpenAI Agents SDK / Swarm

本周动态：OpenAI Agents SDK（Swarm 的官方后继生产框架）本周发布 v0.17.6（2026-06-19 06:03），两个核心新特性指向”安全/治理”主线：①add pre-approval tool input guardrails（PR #3487）——在工具调用前对输入做预审批护栏，是 Agent 工具调用安全控制的关键能力；②add SDK-only custom data for tool outputs（PR #3486）——允许工具输出携带仅 SDK 可见的自定义数据（随后 #3657 强制其遵守严格 JSON 兼容契约）。另修复 handoff 工具名空白告警抑制（#3652）。结合本窗口前序版本 v0.17.5（2026-06-11）的 sandbox 错误可重试性暴露、tool-end hook 结果类型化，可见 OpenAI 正密集打磨 sandbox 沙箱执行 + 工具护栏 + tracing 可观测性 三大企业级支柱。该 SDK 已支撑 Realtime 语音 Agent、MCP、多种 session 后端（SQLite/Redis/MongoDB），是 OpenAI”把 Agent 能力产品化”的官方载体。本周节奏为稳态高频 patch（每周一版），无大版本但治理能力持续加码。
关键数据：v0.17.6（2026-06-19，来源 https://github.com/openai/openai-agents-python/releases ）；v0.17.5（2026-06-11，同源）；GitHub Stars 27,306（2026-06-22，来源 https://api.github.com/repos/openai/openai-agents-python ）。
原文链接：https://github.com/openai/openai-agents-python/releases
影响判断：pre-approval tool input guardrails 是重要信号——OpenAI 在把”工具调用安全/人审”做成框架原语，呼应企业对 Agent 可控性的核心诉求。Swarm→Agents SDK 的产品化路径已成熟，是 OpenAI 生态锁定的关键一环。

Dify

本周动态：本周无重大公开 release。 核查 langgenius/dify GitHub releases 与 tags：最新稳定版为 v1.14.2（2026-05-19），在本窗口（06-15~21）之前；2.0.0-beta.1/beta.2 等 tag 对应 commit 实为 2025-09 的历史提交（非本周）。但需注意：该仓库 pushed_at = 2026-06-22，main 分支本周仍高频活跃（持续向 2.0 演进：queue-based GraphEngine、RAG 2、@langgenius/dify-ui 设计系统迁移），只是未在本窗口打正式 release tag。背景（v1.14.x 系列，非本周）主线为：HITL（human-in-the-loop）工作流稳定性、租户隔离安全加固、RAG/知识库可靠性、可观测性（Langfuse v3/Phoenix）、GraphEngine 最小 worker 数提升。本周该项目对外无可计入”本周动态”的正式版本。
关键数据：最新稳定版 v1.14.2（2026-05-19，来源 https://github.com/langgenius/dify/releases ）；GitHub Stars 146,075（2026-06-22，来源 https://api.github.com/repos/langgenius/dify ）——本组 Stars 最高；forks 22,974。
原文链接：https://github.com/langgenius/dify/releases
影响判断：Dify 以 14.6 万 Stars 稳居本组开源人气第一，是低代码 Agent/LLMOps 平台的事实标准之一。本周虽无 release，但 main 分支向 2.0（队列化图引擎+RAG2）演进信号强烈，下一个大版本值得紧盯。

LlamaIndex Agents

本周动态：本周无重大公开 release。 核查 run-llama/llama_index：最新 tag 为 v0.14.22，其 release commit 日期为 2026-05-14（github-actions[bot] “Release 0.14.22 #21667”），在本窗口之前；GitHub releases 页顶部”2026-03-16”等为聚合 changelog 视图，非本周新版。该仓库 pushed_at = 2026-06-20（main 仍活跃，但本周未打新 tag）。背景（v0.14.22 及近期，非本周）llama-index-core 主线：Multimodal synthesis 多模态合成（#21374）、IngestionPipeline 多进程缓存写入保留、Memory 对 DocumentBlock 的 token 估算修复、FunctionTool 的 contextvars 传播修复（async 工具调用正确性）。LlamaIndex 的 Agent 能力（Workflows、FunctionAgent、AgentWorkflow）仍以 RAG-centric 编排为差异化定位。本周无可计入”本周动态”的正式版本。
关键数据：最新版 v0.14.22（release commit 2026-05-14，来源 https://api.github.com/repos/run-llama/llama_index/commits/77b78b507b975d9caa9e035df76a19ee4f76b0c5 ）；GitHub Stars 50,259（2026-06-22，来源 https://api.github.com/repos/run-llama/llama_index ）。
原文链接：https://github.com/run-llama/llama_index/releases
影响判断：LlamaIndex 保持 5 万 Stars 的 RAG+Agent 双栖定位，发版节奏放缓（约月度）。多模态合成是其押注方向。本周静默，与高频迭代的 LangGraph/ADK/CrewAI 形成节奏对比。

本板块 GitHub Stars 速览（2026-06-22 实时）

| 框架 | Stars | Forks | 本周release | 最新版/日期 | |—|—|—|—|—| | Dify | 146,075 | 22,974 | 否 | v1.14.2 (05-19) | | Microsoft AutoGen | 59,112 | 8,921 | 否 | v0.7.5 (2025-09-30) | | CrewAI | 54,096 | 7,577 | 是(预发布) | v1.14.8a1 (06-18) | | LlamaIndex | 50,259 | 7,603 | 否 | v0.14.22 (05-14) | | LangGraph | 35,375 | 5,935 | 是 | 1.2.6 (06-18) | | OpenAI Agents SDK | 27,306 | 4,214 | 是 | v0.17.6 (06-19) | | Google ADK (python) | 20,212 | 3,601 | 是 | v2.3.0 (06-17) |

板块洞察（Agent 框架赛道趋势）

本周窗口呈现清晰的”两极分化”拐点：官方/大厂栈高频冲刺，社区框架分化。 三大趋势：①官方 SDK 阵营（LangGraph 1.2.6、OpenAI Agents SDK 0.17.6、Google ADK 2.3.0）本周全部发版且节奏极密（周更甚至日更），主线高度趋同——流式运行时(v3 streaming)、企业安全(mTLS/工具预审批护栏/远程沙箱E2B)、可观测性(OTel)，标志赛道从”能跑通”进入”生产级可控”深水区。②Agent自进化首次进入主流框架：ADK 2.3.0 引入 GEPARootAgentOptimizer，把 prompt/agent 自动优化做成一等公民，是方法论层面的拐点信号。③社区框架走向声明式低代码：CrewAI 全力押注 JSON-first/FlowDefinition（无需写Python），向 Dify 类可视化平台靠拢；而 AutoGen 已停滞(并入 Microsoft Agent Framework)、Dify/LlamaIndex 本周静默，说明”纯代码框架”红利见顶，下一战场是”声明式编排 + 自进化 + 企业治理”三位一体。Gemini 3 时代(ADK 默认 gemini-3-flash-preview)与 GPT-5 时代基线已落定，框架竞争重心从”接什么模型”转向”如何安全、可观测、可自优化地编排”。

🏢 垂直 / 企业 Agent 产品

速查表

对象	热度	本周关键词
Perplexity 🟢	一般	Brain 记忆系统：面向「工作」的上下文图
Harvey 🔥	重大	详见 TOP5（3 亿 ARR + LAB 开源 + Token 清算）
Sierra 🟡	边缘	Ghostwriter 落地复盘 + FedRAMP High 认证
Glean 🟡	边缘	AWS Marketplace 渠道造势 + RFP 客户 ROI 案例
Manus 🔥	重大	Meta 20 亿收购被强制拆解 + 原投资人 20 亿回购
Devin 🔥	重大	详见 TOP5（260 亿估值）+ Devin Desktop×ACP×NVIDIA
Replit 🟢	一般	Replit×Claude 深度集成 + 高频企业集成

深度正文

Perplexity（Comet / 搜索Agent）

本周动态：本周Perplexity的核心动态是为其自主Agent “Computer” 推出全新记忆系统 Brain（约6月18-19日，Decrypt等报道为”3天前”，研究预览阶段）。Brain并非传统意义上记住用户姓名/偏好的记忆，而是面向”工作”的记忆：每次Computer完成任务后，Brain把本次任务写入一张”上下文图(context graph)”，记录用了哪些连接器(connectors)、哪些信息源靠谱、用户做了哪些纠正、什么方法失败了；然后默认在隔夜对该图做合成(synthesize)，更新一份”个人LLM wiki”，在下一个任务启动前预加载进Computer的沙箱。每条记忆都可回溯到来源session/文件，强调透明与可控。Perplexity自报内部指标：在Computer已处理过的重复任务上，答案正确率+25%、召回+16%、上下文密集型任务成本-13%（注：均为内部数字，非第三方benchmark）。Brain目前面向Max($200/月)与Enterprise Max订阅者开放研究预览，记忆入口在侧边栏”Customize”。Decrypt评论指出这本质是把OpenClaw/Hermes等开源Agent早已用markdown+SQLite做的”持久记忆”能力，带进了主流闭源生态——差异在于Brain运行在Perplexity自有基础设施上，用户拿到的是透明度而非数据所有权，且Brain只让Computer在”做过的任务”上更强，并不提升底层模型智能，跨域泛化仍是未解问题。背景：Comet浏览器已于2025年7月上线、2026年3月上iOS，Computer Agent定位”让AI跑数月级而非分钟级任务”。
关键数据：Brain内部指标正确率+25% / 召回+16% / 成本-13%（来源：Decrypt 2026-06-19 https://decrypt.co/371584/perplexity-ai-agent-brain）；Max定价$200/月（同上）。
原文链接：https://decrypt.co/371584/perplexity-ai-agent-brain ；官方博客 https://www.perplexity.ai/hub/blog/self-improving-memory-for-agents （Cloudflare拦截未能读取全文）
影响判断：Agent记忆从”记用户”转向”记工作”是垂直Agent提效的关键拐点——重复性企业工作流(竞品监控/周报/研究)是最先受益场景。这是Perplexity把Computer从”通用助手”推向”企业级可复利Agent”的明确信号，也把”记忆即护城河”竞争带入闭源大厂阵营。

Harvey（法律AI）

本周动态：本周Harvey动态密集，核心是“Token清算(Token Reckoning)”叙事 + LAB基准的持续发酵。6月16日，Harvey联合创始人兼总裁Gabe Pereyra与应用研究负责人Niko Grupen做客”Sourcery with Molly O’Shea”播客（同日CEO Winston Weinberg的token用量数据也被Business Insider报道）。关键披露：①规模数据——本月Harvey已突破 $300M ARR（去年8月还是$100M，3倍增长）、960名员工、2,000家客户、累计处理约13万亿(13T) tokens；累计融资$1.2B，最近一轮由Sequoia与GIC联合领投$200M、估值$11B(2026年3月)。②LAB基准——几周前Harvey开源了 Legal Agent Benchmark (LAB)，首个衡量AI Agent真实法律任务表现的开源基准，覆盖1,200+任务、24个执业领域、75,000+评分标准，方法论借鉴SWE-bench/Terminal Bench；本周配套发布OpenAI/Anthropic/DeepMind的初始排行榜结果。Harvey把竞争对手都拉进自己的评测标准，逻辑是法律行业因利益冲突(conflict)被迫多模型(代理OpenAI就不能把数据发给Anthropic模型)，Harvey价值在于其上的路由与编排层。③Token经济学——单条assistant查询可花$20，10万份合同审查可花$2万；Weinberg抛出”我刚花了10亿美元买token，我的ROI在哪？”的行业之问，预言AI消费定价会像律师”6分钟计费”一样走向可审计的按token计费。④架构演进——过去6个月Harvey完成从”聊天式产品”到”云端Agent”的重大迁移，自研沙箱基础设施名为Spectre，重做按案件的伦理墙(ethical walls)。
关键数据：$300M ARR(本月,从去年8月$100M)、960员工、2000客户、~13T tokens/月(1月为1T)、累计融资$1.2B、估值$11B(2026-03,$200M轮Sequoia+GIC领投)。来源：Sourcery 2026-06-16 https://www.sourcery.vc/p/breaking-harvey-co-founder-and-head ；Business Insider 2026-06 https://www.businessinsider.com/harvey-ceo-ai-token-usage-2026-6 。（注：另有arturmarkus.com称”$5B估值Series E”，与$11B口径冲突，应为过时/失实信息，以$11B多源口径为准。）
原文链接：https://www.sourcery.vc/p/breaking-harvey-co-founder-and-head ；https://www.businessinsider.com/harvey-ceo-ai-token-usage-2026-6 ；LAB开源 https://www.harvey.ai/blog/introducing-harveys-legal-agent-benchmark
影响判断：Harvey是本组商业化最强标的——$300M ARR + 3倍增速 + 2000客户证明法律AI已从”试用”跨入”基础设施”。开源LAB是从”应用层”向”研究机构”卡位的战略动作。”Token清算”叙事点出整个应用层Agent的核心矛盾：长程Agent工作流token成本爆炸，谁能证明每token的ROI谁就赢——垂直玩家天然有优势。这是2026年企业Agent商业化的关键拐点信号。

Sierra（客服Agent）

本周动态：本周Sierra无重大产品/融资发布，主要动态是思想领导力内容与企业级合规进展。①6月15日Sierra发布博客《How customer teams became agent builders》，是其”Discovering what’s possible with AI for CX”系列的一部分。核心讲述其3月推出的 Ghostwriter（”创建并优化其他Agent的Agent”，无需代码/点击即可让support leads、运营经理、QA团队直接塑造客户体验）三个月来的落地效果：从公司对话日志/通话记录/工单/培训文档中自动挖掘”已存在的好Agent”并构建；配套 Explorer（优化Agent的Agent，持续分析客户对话，发现掉线点、未处理好的问题、CSAT下滑）。文中引用客户高管(Delan Diaz、Mary Orrell)证言强调”迭代速度”——过去需多团队数天/数周协调的改进现在可实时完成。Sierra把这定位为比单一产品功能更大的转变：”最懂客户的人现在能自己塑造体验”。②背景合规：6月10日Sierra获 FedRAMP High 认证（面向美国联邦机构云服务的最高标准，刚好在本周窗口前一天）。③背景：4月Sierra收购法国YC背景初创Fragment；5月完成$950M融资、估值$15.8B（数月前一轮$350M/$100亿估值）；客户覆盖财富20强多数企业；2月”年度回顾”称ARR超$150M。
关键数据：ARR>$150M(2026-02口径)；最近融资$950M/估值$15.8B(2026-05)；FedRAMP High认证(2026-06-10)。来源：Sierra博客 https://sierra.ai/blog ；Voiceflow行业分析 https://www.voiceflow.com/blog/sierra-ai 。（本周窗口内无新融资/估值更新。）
原文链接：https://sierra.ai/blog/how-customer-teams-became-software-builders ；https://sierra.ai/blog
影响判断：Sierra本周叙事(“Outcomemaxxing”+客户自建Agent)与Harvey的”Token清算”形成有趣呼应——都在把焦点从”消耗/token”转向”结果/ROI”。Ghostwriter让非技术业务人员直接构建Agent，是客服Agent从”交付项目”走向”自助平台”的产品化拐点，对扩张毛利与客户黏性是关键。

Glean（企业知识Agent）

本周动态：本周Glean核心公开动态是6月16日SiliconANGLE/theCUBE在”AWS Marketplace Series”中对Glean合作伙伴副总裁Zubin Irani的专访（偏渠道/营销性质，非硬新闻发布）。要点：①定位演进——Glean从企业搜索起家，正转型为”企业级自主Agent与AI业务解决方案的领先开发者”，强调构建可调用广泛组织数据源的”横向(horizontal)”Agent；其agentic开发平台已通过AWS Marketplace分发，深度集成Amazon Bedrock，支持开放模型选择(为不同任务选不同模型)。②客户ROI案例(有料)——某医疗客户用Glean处理RFP：过去每月约处理10个RFP、中标率约10%，现在借AI每月可在全国范围找到100个RFP，单个处理时间从40小时压缩到2-3小时。③产品节奏——2月Glean已扩展其AI”同事”Glean Assistant能力(实时语音支持、品牌内容生成、主动模板、敏感任务的agent sandbox)；Irani透露”我们每月都出新产品/功能，但更关注’做事(doing)’——拿到正确信息后如何去执行，有很强的新版本即将发布”。
关键数据：医疗客户RFP案例 10→100个/月、处理40h→2-3h、中标率~10%（来源：SiliconANGLE 2026-06-16 https://siliconangle.com/2026/06/16/glean-enterprise-data-ai-value-awsmarketplaceseries/）。本周窗口内无新融资数据公开。
原文链接：https://siliconangle.com/2026/06/16/glean-enterprise-data-ai-value-awsmarketplaceseries/
影响判断：Glean的战略主线清晰——从”找信息(search)”向”做事情(action/agents)”迁移，借AWS Marketplace渠道放量。RFP案例是典型的”可量化ROI”落地证据，正好契合本组”Outcome/ROI”主旋律。但本周缺乏硬发布，更多是渠道造势，需关注Irani暗示的”即将发布的强版本”。

Manus（通用自主Agent）

本周动态：本周Manus是本组最大的商业/地缘新闻焦点——Meta对Manus的$20亿收购正在被强制拆解(unwind)。背景：Manus(母公司Butterfly Effect)2025年中将团队迁至新加坡，2025年12月宣布被Meta以$20亿收购；但因中国国家发改委(NDRC)以国家安全/技术出口管制为由，约两个月前(2026年4月27日)否决该交易并下令拆分。本周窗口内的关键进展：①Meta完成运营分离——6月11日彭博报道Meta已切断Manus对其内部系统的访问、停止两公司间数据共享，员工不再能用Manus工具做内部项目(TechCrunch 6月13日跟进)。②原始投资人计划$20亿回购(6月18日,The Information/路透)——Manus早期中国背景投资人计划以Meta当初支付的$20亿原价把公司买回；早前5月报道联合创始人曾讨论从外部投资人募资约$10亿来赎回，可能铺路”中国合资结构”并最终在香港上市(今年MiniMax、Zhipu等中国AI公司已掀起港股上市潮)。③投资人退出状态——加州Benchmark等已拿到收购对价；亚洲背景投资人(腾讯、HSG红杉中国、真格)表示将配合拆分(华尔街日报)。④工程侧仍在出货——即便在拆分中，Manus仍持续发布新功能，本期上线了与 Similarweb 和 Shopify 的集成(connector)。⑤定价(背景)：Free $0(300每日刷新credits,Manus 1.6 Lite)、Pro $20-200/月、Team $20/席/月起。地缘背景：中国同期扩大对AI研究者/高管出境限制，并收紧Moonshot、StepFun、字节等接受美资需政府批准。
关键数据：收购价/回购价$20亿(2025-12宣布;2026-06-18回购计划)；拟募资约$10亿赎回(2026-05);NDRC否决日2026-04-27。来源：TechCrunch 2026-06-13 https://techcrunch.com/2026/06/13/meta-reportedly-moves-to-unwind-2b-manus-deal-after-beijings-demand/ ；Reuters 2026-06-18 https://www.reuters.com/world/asia-pacific/manus-original-investors-plan-buy-back-ai-firm-meta-2-billion-information-2026-06-18/ ；Bloomberg/WSJ转引。
原文链接：https://techcrunch.com/2026/06/13/meta-reportedly-moves-to-unwind-2b-manus-deal-after-beijings-demand/ ；Manus×Shopify连接器 https://manus.im/blog/manus-shopify-connector
影响判断：这是本组最具地缘信号意义的事件——一桩”中国AI明星公司海外退出”的标志性交易在监管夹击下崩解，凸显中美AI资产跨境流动的政治化。对Manus本身：被Meta整合不成、又面临回购，产品连续性与团队稳定性存疑；但其仍持续出货connector说明产品团队在运转。值得持续追踪回购是否落地及港股上市路径。

Devin（Cognition）

本周动态：本周Devin母公司Cognition迎来重磅融资且产品持续迭代，是本组商业化第二强标的。①$10亿融资/$260亿估值(本周内,约6月17日周三宣布)——Cognition完成超$10亿新一轮融资，估值达$260亿，由Lux Capital、General Catalyst、8VC联合领投，Ribbit Capital、Atreides Management、Peter Thiel的Founders Fund等参投；估值较9月上一轮翻倍有余。最关键的硬数据：收入运行率(revenue run rate)从去年5月的$3,700万飙升至$4.92亿(约13倍增长)，客户包括Goldman Sachs、Mercedes-Benz及美国政府多个部门。累计融资已超$25亿。CEO Scott Wu称公司90%以上内部代码现由Devin自己编写；强调多模型组合策略(自有模型+OpenAI+Anthropic路由)优于单一模型。背景：去年7月Cognition在Google以$24亿拿走Windsurf顶尖人才/授权后，收购了Windsurf剩余资产；融资谈判受SpaceX拟$600亿收购Cursor消息提振。②产品:Devin Desktop(约6月20日)——NVIDIA加入Cognition关于Devin Desktop多Agent支持的研究预览。Devin Desktop定位”管理本地+云端Agent舰队的统一界面”，含完整IDE、基于Agent Client Protocol(ACP)的跨模型/跨Agent能力、Spaces(跨Agent共享上下文与Git worktree)、Supercomplete、Fast Context(毫秒级定位代码)、免费无限使用SWE-1.6模型；自述1M+用户、4000+企业客户(由Windsurf升级而来,OTA更新继承计划/扩展/设置)。
关键数据：融资>$10亿/估值$260亿(2026-06-17宣布,较9月翻倍)；收入运行率$4.92亿(对比去年5月$3,700万)；累计融资>$25亿；Devin写公司90%+内部代码；1M+用户/4000+企业客户。来源：Economic Times/Bloomberg 2026-06-17 https://economictimes.indiatimes.com/tech/funding/ai-coding-startup-cognition-raises-1-billion-at-26-billion-value/articleshow/131354428.cms ；Devin Desktop官方 https://devin.ai/desktop
原文链接：https://economictimes.indiatimes.com/tech/funding/ai-coding-startup-cognition-raises-1-billion-at-26-billion-value/articleshow/131354428.cms ；https://devin.ai/desktop
影响判断：$3,700万→$4.92亿的运行率增长是2026年最猛的应用层Agent营收曲线之一，估值翻倍验证”AI软件工程师”品类的资本热度(对比SpaceX拟$600亿收Cursor)。Devin Desktop+ACP+NVIDIA研究预览显示Cognition在押注”多Agent编排”作为下一战场。多模型路由策略与Harvey如出一辙——垂直Agent公司正集体走向”模型中立的编排层”。

Replit Agent

本周动态：本周Replit的核心在窗口动态是6月17日(周三)发布”Replit is now available in Claude”——与Anthropic Claude的深度集成。要点：①Design in Claude, Build in Replit——用户可在 Claude Design 用自然语言设计品牌化应用，设计完成后直接发送到Replit继续构建、打磨、发布，全程自然语言、无复制粘贴/上下文切换。②Delegate Any Task to Replit——Claude可通过官方Replit Connector把任意通用开发任务交给Replit(搭后端、做功能、迭代现有项目)，二者协同。这是把Replit的”构建/部署执行层”嵌入Claude的”对话/设计入口”，抢占vibe coding工作流的上游。背景:本周前后Replit产品迭代极密集——6月10日发布Agent Customization(Custom Instructions+Skills，让Agent跨项目记住团队规范)、6月10日Databricks集成升级(U2M连接器公开预览)、6月9日Package Firewall(与Socket合作,每天拦截约8000个恶意包)、6月4日Shopify店面构建、6月3日SEO Agent、6月1日Microsoft Fabric集成(含开源SDK Rayfin)、5月21日企业版自助购买。
关键数据：ARR约$150M(约一年内从几百万增长)、用户超4000万、Series D $4亿/估值约$90亿(2026-03,较此前$30亿估值翻三倍)、累计融资约$922M(Tracxn口径)、覆盖85%财富500强。来源：MEXC/TechCrunch转引 https://blog.mexc.com/finance/replit-ipo-2026-valuation-competitors-how-to-invest/ ；Tracxn ；Replit官方博客 https://replit.com/blog/replit-claude (2026-06-17)。（注：ARR $150M与估值$90亿为3月前后数据，本周窗口内无新财务披露。）
原文链接：https://replit.com/blog/replit-claude ；https://replit.com/blog
影响判断：Replit×Claude集成是vibe coding赛道”入口之争”的关键落子——Anthropic把Replit作为其Design入口的默认执行后端，等于双方在用户工作流上互相导流。结合Shopify/Databricks/Microsoft Fabric/Package Firewall等高频集成，Replit的策略很清晰：从”在线IDE”升级为”AI原生应用工厂+企业级安全治理层”，用集成密度和安全合规建护城河。

板块洞察（垂直/企业 Agent 商业化拐点）

本周垂直/企业Agent商业化的几个清晰拐点信号：

1. “Token清算”成为行业共识级议题。 Harvey CEO的”我花了10亿美元买token，ROI在哪？”与Sierra的”Outcomemaxxing(不看消耗看结果)”形成共振——2026年中，企业Agent的竞争焦点正从”能力/规模”急速转向”每token的可证明ROI”。垂直玩家因能按任务/案件量化产出，在这场”ROI审计战”中天然占优。

2. 营收曲线验证”应用层Agent已跨过基础设施门槛”。 Cognition收入运行率$3700万→$4.92亿(13x)、Harvey ARR $300M(3x增速)、Replit ARR ~$150M、Sierra ARR>$150M——多个垂直Agent公司同步进入”陡峭营收曲线”，估值随之翻倍($260亿Cognition、$110亿Harvey、$158亿Sierra)。资本对”垂直Agent=新一类工程/服务产能”的定价已确立。

3. “多模型中立编排层”成为垂直公司的共同架构选择。 Harvey(因利益冲突被迫多模型)、Cognition(自有模型+OpenAI+Anthropic路由)、Glean(AWS Bedrock开放模型)殊途同归——垂直Agent公司不押注单一基座模型，而是把价值沉淀在”路由+编排+领域数据+合规”层。这是对抗”被基座大厂吞噬”的核心防御。

4. 入口与执行层的”互相嵌入”竞赛升温。 Replit×Claude、Devin Desktop×ACP×NVIDIA、Perplexity Brain——大家都在抢”Agent工作流的上下文/记忆/编排”位置。记忆(Brain)、协议(ACP)、集成密度(Replit)成为新护城河要素。

5. 地缘政治成为Agent资产的硬约束。 Meta-Manus $20亿交易在中国监管下崩解、原投资人$20亿回购，标志中美AI资产跨境流动全面政治化——这是2026年企业Agent全球化绕不开的新变量。

🌐 浏览器操作 Agent + 中国 Agent

速查表

对象	热度	本周关键词
OpenAI Operator 🟢	一般	并入 ChatGPT Agent + 三星部署 + Lockdown Mode
Anthropic Computer Use 🔥	重大	暂停 Agent SDK 计费拆分 + 自托管沙箱公测
Google Project Mariner 🟢	一般	并入 Gemini Agent + Chrome Auto Browse 铺开
字节 Coze / 扣子 ⚪️	静默	本周无 release，扣子空间大版本后消化期
智谱 AutoGLM 🔥	重大	详见 TOP5（GLM-5.2 + ZCode 3.0 自研内核）
月之暗面 Kimi 🔥	重大	K2.7 Code 高速版上线：6 倍速 / 180 token/s
阿里 Qwen Agent 🔥	重大	Qwen-Robot 具身智能系列登顶 RoboChallenge

深度正文

OpenAI Operator / ChatGPT Agent

本周动态：本周 OpenAI 在浏览器/计算机操作 Agent 的”产品形态”上无独立大版本更新，但围绕 Agent 能力的企业落地与外围设置密集推进。核心背景须先澄清：Operator 独立预览站已被关停，其浏览器驱动能力整体并入 ChatGPT Agent 模式，开发者侧则通过 Agents SDK/API 的 computer-use 工具获得同等能力（OpenAI 帮助中心页面本周内仍在更新，明确”Operator 网站不再可用，功能已并入 ChatGPT agent 模式，仅付费档可用，支持 Web/iOS/Android/macOS/Windows”）。本周实际发生的相关动态有三条：①6月21日官宣三星电子（Samsung Electronics）全球部署 ChatGPT Enterprise + Codex——韩国全员 + 全球 DX（Device eXperience）事业部全员，OpenAI 称这是其”史上最大规模企业部署之一”，覆盖研发、制造、营销、产品等；披露 Codex 全球周活已超 500 万，韩国区 Codex 周活自2月1日以来增长近 800%。②6月18日发布”企业用量分析与支出管控”（new usage analytics + spend controls for enterprises），直接服务于 Agent/Codex 规模化后的成本治理。③帮助中心新增 Lockdown Mode：开启后限制实时联网浏览、deep research、agent mode、文件下载等网络化能力——是 Agent 安全侧的收紧。综合判断：OpenAI 的 Agent 战略本周重心从”能力炫技”转向”企业级治理 + 大客户渗透”，Codex（编码 Agent）成为对企业渗透的尖刀，而浏览器操作 Agent 处于能力沉淀期。
关键数据：Codex 全球周活 >500万；韩国区 Codex 周活自2026-02-01增长近800%（来源：openai.com/index/samsung-electronics-chatgpt-codex-deployment/，2026-06-21）；三星部署官宣日 2026-06-21；企业支出管控发布 2026-06-18（openai.com/news/）；computer-use 内部基准 WebVoyager 87%、WebArena 58.1%（背景，非本周；来源 firecrawl.dev/blog/best-browser-agents）。
原文链接：https://openai.com/index/samsung-electronics-chatgpt-codex-deployment/ ; https://openai.com/news/ ; https://help.openai.com/en/articles/6825453-chatgpt-release-notes ; https://help.openai.com/ru-ru/articles/11752874-chatgpt-agent（Operator并入说明）
影响判断：①三星全球级部署是 Agent/编码Agent 企业渗透的标志性拐点——”全员可用”而非”限定团队”，验证 Agent 正从试点转入生产工作流。②Lockdown Mode 与企业支出管控同周出现，说明 Agent 规模化后”安全 + 成本”成为头部厂商必须先解决的护栏，这是赛道成熟的信号。

Anthropic Computer Use

本周动态：本周 Anthropic 没有发布新的 Computer Use 模型版本，但有两件与 Agent 工程/商业化直接相关的大事。①6月15日：暂停 Agent SDK 计费拆分。Anthropic 原计划于 6/15 将 Claude Agent SDK、claude -p（headless）、Claude Code GitHub Actions、经 ACP 认证的第三方 App（Zed/JetBrains 等）的用量从 Pro/Max/Team/Enterprise 订阅池中剥离，改为按标准 API 费率计费的”独立月度美元额度、不可结转”。该计划原本是要终结”订阅补贴 Agent 用量 15–30×”的结构（一个 $20/月 Pro 用户理论上可跑出 $300–600 的 API 等值算力）。但 6/15 当天 Anthropic 在帮助中心确认暂停该变更、维持现状，称将”重新设计以更好支持用户用订阅构建 Claude”，未来变更会提前通知。Ars Technica、Axios 等多家报道交叉验证。②自托管沙箱（self-hosted sandboxes）进入公开测试 + MCP 隧道进入研究预览：Agent 编排/上下文/纠错循环留在 Anthropic 基础设施，工具执行可迁移到用户自有基础设施或 Cloudflare/Daytona/Modal/Vercel 等托管沙箱——直接服务于企业级 Computer Use/Agent 的数据隔离与合规。③Claude Code 本周高频迭代（2.1.178→2.1.185），含 agent teams 简化、嵌套 skills、auto 模式安全（阻断破坏性 git/terraform destroy 命令）等。
关键数据：订阅补贴 Agent 用量约 15–30×（来源 Zed Industries 博客，2026-05-14）；暂停日 2026-06-15；原计划生效日 2026-06-15（来源：digitalapplied.com/blog/anthropic-claude-credit-overhaul-june-15-2026，更新于2026-06-16；arstechnica.com 2026-06）；Claude Code 本周版本 2.1.178–2.1.185（releasebot.io/updates/anthropic，首见日2026-06-19~21）。
原文链接：https://www.digitalapplied.com/blog/anthropic-claude-credit-overhaul-june-15-2026 ; https://arstechnica.com/ai/2026/06/anthropic-pauses-token-based-billing-for-its-claude-agent-sdk/ ; https://releasebot.io/updates/anthropic ; https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan
影响判断：①”暂停计费拆分”是本周 Agent 经济学的核心信号——印证 Ina Fried（Axios）的判断：”‘all-you-can-eat’ 订阅可能撑不过 Agent 时代”。Anthropic 进退反复，说明 Agent 算力的定价模型尚未稳定，是整个赛道的结构性张力。②自托管沙箱公开测试是 Computer Use 走向企业生产的关键基建——把”执行环境”还给客户、把”智能环”留在云端，是兼顾合规与能力的折中范式。

Google Project Mariner

本周动态：与 OpenAI Operator 同构，Project Mariner 作为独立项目已于 2026-05-04 关停，其浏览器/网页任务自动化能力整体并入 Gemini Agent 及其他 Gemini/Google AI 产品（Android Authority、Search Engine Journal 交叉验证）。因此本周”Project Mariner”无独立产品动态，须以承接它的 Gemini Agent / Gemini in Chrome 为观察口。本周该线的真实动态集中在浏览器侧 Agent 的消费级铺开：①Gemini in Chrome for Android 的 “Auto Browse” 据多家媒体（digitbin 等，2026-06-18 前后）报道将于 6月底面向美国 Android 12+/≥4GB RAM 用户铺开，让助手”一键唤起侧边栏”并能自动化常规网页任务（如停车预订、修改订单），无需离开 Chrome——这是 Mariner 能力下沉到 Chrome 的直接产物。②Gemini 订阅页（gemini.google/subscriptions）本周仍在更新，Pro/Ultra 强调 “agentic capabilities”、Deep Search、Gemini 3 Pro/3.1 Pro 接入。③开发者侧：Gemini Code Assist IDE 扩展与 Gemini CLI 对个人/AI Pro/AI Ultra 档自 6月18日起停止服务请求（developers.google.com release notes），属 Agent 工具链的档位调整。综合判断：Google 的浏览器操作 Agent 已从”独立实验项目”过渡到”嵌入 Chrome 的默认能力”，路线是用 Chrome+Android 的分发优势把 Agent 变成”系统级默认”，而非独立App。
关键数据：Project Mariner 关停日 2026-05-04（来源 androidauthority.com via searchenginejournal.com，2026-06-18报道）；Gemini in Chrome for Android Auto Browse 预计6月底铺开、限美国 Android 12+/≥4GB RAM（digitbin.com，2026-06-18前后）；Gemini Code Assist 个人档停服 2026-06-18（developers.google.com）；Gemini Enterprise 3.5 Flash toggle 2026-06-16后下线（docs.cloud.google.com）。
原文链接：https://www.searchenginejournal.com/the-search-mirror-personal-intelligence-and-agentic-browsing/578430/ ; https://www.digitbin.com/gemini-chrome-android-auto-browse/ ; https://developers.google.com/gemini-code-assist/resources/release-notes ; https://gemini.google/subscriptions/
影响判断：①三家头部（OpenAI/Google/各自）不约而同把”独立浏览器Agent项目”关停并入主力助手（Operator→ChatGPT Agent、Mariner→Gemini Agent），是2026年浏览器操作Agent的明确拐点信号——”独立产品”形态被证伪，”嵌入主力助手/浏览器”成为共识路线。②Google 借 Chrome/Android 分发把 Auto Browse 做成系统默认，是其相对 OpenAI 最大的结构性优势。

字节 Coze / 扣子

本周动态：本周扣子/Coze 无重大公开产品发布。核查多方信源：①开源版 coze-studio GitHub 最新正式 release 仍为 v0.5.1（2026-02-05），本周（6/15–6/21）无新 tag/release，仅有日常 PR 合并（模型管理、知识库 OpenAPI、SQL 注入修复等小迭代），未发本周版本。②扣子的通用 Agent 平台”扣子空间（Coze Space）”为 2026-04-19 发布（36氪报道，首日用户破50万、平台已有超200万个AI应用），属本期区间外旧闻，仅作背景。③本周与字节相关的可见报道（36氪《13410亿，字节跳动的万亿野心》，2026-06-22）为产业综述，提及扣子作为字节 Agent 棋子的战略定位（先海外试验田、再国内复制；豆包大模型为底座），但无扣子本周具体动态。综合判断：扣子当前处于”4月大版本（扣子空间）后的消化期”，本周字节 Agent 线的公开声量集中在豆包App整合（猫箱/星绘并入）、AI硬件（眼镜/视频通话）等外围，而非扣子本体。须等官方公众号/官网后续发布确认。
关键数据：coze-studio 开源最新版 v0.5.1（github.com/coze-dev/coze-studio/releases，2026-02-05，本周无新版）；扣子空间发布日 2026-04-19、首日用户>50万、平台AI应用>200万个（36kr.com/p/3257876933275904，背景非本周）；字节2024资本开支约800亿元、2025计划约1600亿元（The Information via 36氪，背景）。
原文链接：https://github.com/coze-dev/coze-studio/releases ; https://36kr.com/p/3328673657579777 ; https://36kr.com/p/3257876933275904
影响判断：①扣子本周静默，反映字节 Agent 节奏是”大版本脉冲+长消化”，与 OpenAI/Anthropic 的高频迭代形成对比。②真正值得跟踪的是字节”先海外后国内、产品经理批量复制”的打法，扣子是这套打法在 Agent 赛道的载体，短期声量低不代表战略降级。

智谱 AutoGLM

本周动态：智谱本周是中国Agent阵营声量最大的一家，核心是 GLM-5.2 旗舰开源模型 + ZCode 3.0 自研Agent内核的”双发布”在本周内完成落地。时间线：6月13日晚智谱同日推出 GLM-5.2（面向 GLM Coding Plan 全量用户 Lite/Pro/Max/团队版开放）与 ZCode 3.0（全面切换自研 ZCode Agent 内核，放弃此前套用 Claude Code/Cline 的第三方Agent实现，官方称”长程推理、工具调用、大型工程执行链路整体效果已显著优于第三方Agent”，并宣布”后续不再内置/维护其他Agent适配”——即从”兼容Claude生态”转向”GLM+ZCode自有闭环”）。6月16-20日（本周内） API 与 MIT 开源权重落地：模型已上线 Hugging Face（zai-org/GLM-5.2，MIT License）、Z.ai Chat、GLM Coding Plan 与 Z.ai API，并支持 20+ 第三方 coding 工具。技术规格：safetensors 元数据显示总参数约 753.33B（MoE/DSA 路线，激活参数未公开），上下文 1M tokens、最大输出 128K，含 IndexShare 稀疏注意力（1M长度下复用索引器降 FLOPs）、MTP speculative decoding。官方 benchmark：SWE-Bench Pro 62.1（GLM-5.1 为 58.4）、Terminal Bench 2.1(Terminus-2) 81.0（前代 63.5）、AIME 2026 99.2、GPQA Diamond 91.2、HLE 40.5。智谱在公告中明确把开源当政治牌打：”在一些前沿模型突然变得不可用的时刻……前沿智能不应被少数规则随时收回”——直指上周 Anthropic 收紧高端模型访问的背景。关于 AutoGLM（智谱的手机/浏览器GUI操作Agent）本体，本周无独立大版本公告，智谱本周Agent叙事的重心在 GLM-5.2 基座 + ZCode 编码Agent，而非 GUI 操作 Agent。
关键数据：GLM-5.2 发布日 2026-06-13；API+开源权重落地 6月16-20（本周内，huggingface.co/zai-org/GLM-5.2，MIT）；总参数 ~753.33B（HF safetensors 元数据）；上下文 1M / 输出 128K；SWE-Bench Pro 62.1、Terminal Bench 2.1 81.0、AIME 2026 99.2、GPQA Diamond 91.2、HLE 40.5（官方模型卡，via datalearner.com 2026-06-18）；API 定价输入 $1.4/M、缓存输入 $0.26/M、输出 $4.4/M（Z.ai Developer Docs）；ZCode 应用内 150% 配额加成；高峰期额度系数3倍/非高峰2倍（知乎口径）。
原文链接：https://www.datalearner.com/ai-models/pretrained-models/glm-5-2 ; https://huggingface.co/zai-org/GLM-5.2 ; https://www.aitoollab.cn/articles/glm-52-zcode-3-release-analysis-202606/ ; https://zhuanlan.zhihu.com/p/2050158905360135402
影响判断：①ZCode 3.0 自研Agent内核是关键信号——国产编码Agent从”套壳Claude Code”走向”模型+Agent垂直整合”，类比 iOS 封闭生态，换取体验一致性与针对GLM的链路优化。②MIT 开源 + 自研Agent + 1M上下文的组合，在本周 Anthropic/OpenAI 收紧访问的对照下，把”开源”从技术选择抬升为企业级”业务连续性/自主可控”选择，是中国Agent最强的差异化叙事。③真正待验证的是 1M 上下文”可用性”与独立第三方复现 benchmark。

月之暗面 Kimi Agent

本周动态：月之暗面本周的本期区间内核心动态是 Kimi K2.7 Code 高速版（2026-06-15）正式上线——这是 6月12日发布并开源 K2.7 Code 编程大模型后的紧接动作，落在本周窗口内。高速版要点：与标准版架构/参数完全相同，仅在推理引擎与服务部署层做专项加速，输出速度提升至约6倍；典型编程任务（输入长度中位数）平均180 token/s，短上下文轻量任务峰值接近 260 token/s；API 标识 kimi-k2.7-code-highspeed，API 资费为标准版2倍，在 Kimi Code Plan 内消耗配额为标准版3倍；Kimi Code Plan 用户可经”抢先体验计划”（kimi.com/code/beta）率先使用，2026年7月起 Allegretto 及以上会员陆续获权限。背景（6/12发布的 K2.7 Code 本体，非本周但紧密关联）：1万亿参数 MoE（每Token激活32B、384专家、61层、MLA注意力）、256K上下文、MoonViT 视觉编码器支持图像/视频、Modified MIT 开放权重；强制思考模式（不可关；API关闭则报错，Kimi Code 自动回退 K2.6）；推理token消耗较 K2.6 降约30%、MCP 工具调用 Atlas 76.0(+9.5%)/Mark Verified 81.1(+11.4%)；定价输入¥6.5/M、输出¥27/M。Agent 侧：配套 Kimi Code（CLI + Agent + MCP，对标 Claude Code 国产替代，kimi.com/code）已上线，兼容 Claude Code/Cline/Roo Code。文末与智谱口径如出一辙地强调”前沿AI应开放普适、不应成为少数群体专享资源”——同样影射 Anthropic 收紧访问。注意：K2.7 Code 全部为月之暗面自有专有基准，无 SWE-bench Verified 等第三方标准成绩，K2.6 曾有”宣称80% vs 实测60-65%”的15-20pp差距，须等独立复现。
关键数据：K2.7 Code 高速版上线 2026-06-15（ai.zol.com.cn/1199/11999575.html，2026-06-16）；6倍速、180 token/s（中位）、峰值~260 token/s；高速版API=标准版2倍、配额3倍；K2.7 Code 发布/开源 2026-06-12；1T参数/激活32B/256K上下文；token降30%、MCP Atlas 76.0、Kimi Code Bench v2 62.0(+21.8%)；定价输入¥6.5/M·输出¥27/M（≈$0.95/$4.00），缓存命中输入¥1.3/M（aitoollab.cn 2026-06-13）。
原文链接：https://ai.zol.com.cn/1199/11999575.html ; https://www.aitoollab.cn/articles/kimi-k2-7-code-open-source-1t-coding-model-benchmark-202606/ ; https://zhuanlan.zhihu.com/p/2049934593588044237 ; https://www.kimi.com/code
影响判断：①Kimi 路线与智谱形成镜像对照——Kimi 走”专用模型+开放生态（兼容 Claude Code/Cline）”的安卓式路线，智谱走”模型+自研Agent闭环”的iOS式路线，两种范式本周同台，是国产编码Agent路线分化的标志。②高速版180 token/s把”AI写码接近人类阅读速度”变成现实，推理速度成为Agent体验的新竞争维度（而非仅准确率）。③自报基准+无第三方复现是国产模型共同短板，营销可信度待验证。

阿里 Qwen Agent

本周动态：阿里通义本周区间内的核心动态是 2026-06-16 发布 Qwen-Robot 系列具身智能大模型——这是千问大模型家族首个完整的具身智能模型体系，标志阿里 Agent 战略从”数字世界Agent”向”物理世界AI（Physical AI）/ 具身智能体”延伸（量子位、新浪财经、X 多源交叉验证发布日 6/16）。三大模型：”手”=Qwen-RobotManip（视觉-语言-动作 VLA 操作模型，采用 80 维统一动作表征解决跨设备/跨场景适配痛点，依相对位置而非绝对坐标运算，累计 >38000 小时语料预训练且全程开源数据、未用私有采集数据，在全球权威真机评测 RoboChallenge Table30 v1 中 “Lira”/”Atlas” 两版本包揽榜单前两名，可完成拧水龙头、插网线、双臂倒薯条等30项真实任务）；”脚”=Qwen-RobotNav（视觉-语言-导航 VLN，基于 Qwen-VL，整合5大任务于统一框架，任务自适应观察机制，原生兼容多种智能体框架，搭载宇树 Go2 四足机器人可语音指令自主巡逻/寻物）；”大脑”=Qwen-RobotWorld（世界模型，推演动作轨迹、生成海量视频训练数据缓解数据短缺）。三模型支持独立或协同部署，形成感知-决策-执行闭环。另：本周阿里云官网/百炼平台在持续主推 Qwen3.7 系列（”面向智能体时代”，编程/办公自动化/长周期自主执行），百炼内置 Agent 工具链、支持 MCP 托管、新用户赠超 7000 万 tokens——但 Qwen3.7 非本周首发，属在售旗舰。Qwen Agent 框架本体本周无独立大版本公告。
关键数据：Qwen-Robot 系列发布日 2026-06-16（qbitai.com/2026/06/435873.html、finance.sina.com.cn 2026-06-16，X 同日，三源一致）；RobotManip 80维统一动作表征、>38000小时开源数据预训练、RoboChallenge Table30 v1 前两名、30项真实任务；百炼新用户赠 >7000万 tokens（aliyun.com/product/bailian，2026-06-19前后）；Qwen3.6-plus 默认百万 token 上下文（知乎综述 2026-06-17）。
原文链接：https://www.qbitai.com/2026/06/435873.html ; https://finance.sina.com.cn/wm/2026-06-16/doc-inicqsxv4438421.shtml ; https://www.93913.com/122354.html ; https://www.aliyun.com/product/tongyi
影响判断：①Qwen-Robot 是本组唯一把 Agent 从”屏幕/浏览器操作”推向”物理世界操作”的动态——80维统一动作表征 + 全开源数据 + RoboChallenge 登顶，是中国厂商在具身 Agent 赛道的实质卡位。②”全程开源数据、未用私有采集数据却拿真机评测第一”是强信号：阿里在用”开源基线”打法复制其在 LLM 上的开源策略，向具身智能迁移。③与字节(豆包整合)、智谱/Kimi(编码Agent)路线对比，阿里是头部里最早系统性押注具身 Agent 的一家。

板块洞察（浏览器操作+中国 Agent 拐点）

本周浏览器/计算机操作Agent + 中国Agent赛道呈现三个清晰拐点信号：

① “独立浏览器Agent项目”形态被集体证伪。 OpenAI Operator → ChatGPT Agent、Google Project Mariner → Gemini Agent，两大巨头不约而同关停独立项目、把浏览器操作能力并入主力助手/浏览器（Google更借Chrome+Android把”Auto Browse”做成系统默认）。”独立产品”路线退场，”嵌入主力入口”成为共识——浏览器操作Agent的竞争焦点从”能力炫技”转向”分发渠道 + 企业治理（安全/成本护栏，如OpenAI同周推Lockdown Mode与企业支出管控）”。

② Agent经济学的定价模型尚未稳定，是全球共性张力。 Anthropic 6/15 紧急”暂停”Agent SDK计费拆分，印证”all-you-can-eat订阅撑不过Agent时代”——机器速度的token消耗与人类速度的订阅定价之间的结构性矛盾，头部厂商仍在反复试探，未有定论。

③ 中国Agent本周声量集中爆发在”编码Agent + 具身Agent”，且高度共享”开源对冲”叙事。 智谱(GLM-5.2+ZCode自研内核, MIT开源)、月之暗面(K2.7 Code高速版6倍速, Modified MIT)、阿里(Qwen-Robot全开源数据登顶RoboChallenge)三家本周均有实质动态，且智谱/Kimi公告口径惊人一致地影射”Anthropic收紧高端模型访问”，把”开源”从技术选择上升为”业务连续性/自主可控”的政治-商业选择。路线已分化：智谱=模型+自研Agent闭环(iOS式)、Kimi=专用模型+开放生态(安卓式)、阿里=向物理世界具身Agent延伸。值得警惕的共同短板：国产编码模型基准多为自报、缺独立第三方复现(K2.6曾有15-20pp宣传-实测差距)，”可用性”待验证。相比之下字节扣子本周静默，处于4月扣子空间大版本后的消化期。

📋 关于本周报

数据口径：所有「本周」均指 2026-06-15 ~ 2026-06-21（上海时区）完整一周。版本号、融资额、估值、benchmark、Stars、发布日期等关键数据均标注来源与日期；查不到如实标「未公开/未一手验证」。
图标说明：🔥 重大动态 · 🟢 一般动态 · 🟡 边缘动态 · ⚪️ 本周静默。
来源说明：优先官方博客/论文/GitHub release/官方公告等一手来源，二手报道用于交叉验证并标注；GitHub Stars 经实时接口读取（2026-06-22）。
下期预告：持续追踪 SpaceX-Cursor 交割进展、Cognition 多 Agent 编排（Devin Desktop+ACP）、Anthropic 计费模型再设计、智谱/Kimi 国产编码 Agent 第三方基准复现、Manus 回购与港股上市路径。

🔥 本周 TOP 5

1. SpaceX 600 亿美元收购 Cursor 母公司 ｜ 2026-06-16

2. Cognition 完成超 10 亿融资、估值 260 亿 ｜ 2026-06-17

3. Anthropic 暂停 Agent SDK 计费拆分 ｜ 2026-06-15

4. 智谱 GLM-5.2 + ZCode 3.0 自研内核 ｜ 2026-06-13 落地 6/16-20

5. Harvey 突破 3 亿 ARR + 开源法律基准 LAB ｜ 2026-06-16

🧭 三大维度趋势

学术研究

Agent 工程

商业化与落地

💻 编码 Agent / CLI

速查表

深度正文

Claude Code（Anthropic）★

OpenAI Codex / Codex CLI ★

OpenClaw（Agent OS）★

Hermes Agent（Nous Research，自进化）★

Cursor（Anysphere）

Cognition（Devin / Windsurf）

OpenCode（SST / Anomaly）

板块洞察（Agent 框架赛道趋势）

🧩 通用 / 自主 Agent 框架

速查表

深度正文

LangChain / LangGraph

Microsoft AutoGen

CrewAI

Google ADK (Agent Development Kit)

OpenAI Agents SDK / Swarm

Dify

LlamaIndex Agents

本板块 GitHub Stars 速览（2026-06-22 实时）

板块洞察（Agent 框架赛道趋势）

🏢 垂直 / 企业 Agent 产品

速查表

深度正文

Perplexity（Comet / 搜索Agent）

Harvey（法律AI）

Sierra（客服Agent）

Glean（企业知识Agent）

Manus（通用自主Agent）

Devin（Cognition）

Replit Agent

板块洞察（垂直/企业 Agent 商业化拐点）

🌐 浏览器操作 Agent + 中国 Agent

速查表

深度正文

OpenAI Operator / ChatGPT Agent

Anthropic Computer Use

Google Project Mariner

字节 Coze / 扣子

智谱 AutoGLM

月之暗面 Kimi Agent

阿里 Qwen Agent

板块洞察（浏览器操作+中国 Agent 拐点）

📋 关于本周报

📖 相关阅读

1. SpaceX 600 亿美元收购 Cursor 母公司｜ 2026-06-16

2. Cognition 完成超 10 亿融资、估值 260 亿｜ 2026-06-17

3. Anthropic 暂停 Agent SDK 计费拆分｜ 2026-06-15

4. 智谱 GLM-5.2 + ZCode 3.0 自研内核｜ 2026-06-13 落地 6/16-20