全球 AI 动态周报 · 第 2 期（2026-05-31 ~ 06-06）

覆盖区间　2026-05-31（周日）00:00 → 06-06（周六）24:00｜上海时区 覆盖范围　38 个 AI 主体 · 6 大赛道 · 实质覆盖 38/38（100%）全部信息严格限定在上述自然周内；窗口外动态仅作背景标注，不计入”本周动态”。

本周一句话

模型发布相对沉寂，平台 / Agent / 资本 / 算力动作密集。 行业正从”模型军备竞赛”迈入”Agent 生产化与商业化落地”新阶段：基座厂转向发平台、发 Agent、发资本；编码 Agent 全面企业化 + 多智能体编排；NVIDIA 算力全栈通吃；中国具身机器人量产元年坐实。

🔥 本周 TOP 5

1. NVIDIA GTC Taipei：算力从云端杀向 PC 与机器人本体｜ 6/1

黄仁勋在台北 Computex 期间的 GTC Taipei 2026 主题演讲一口气抛出三条新战线。①消费 PC 线：发布 RTX Spark 超级芯片，将 CPU 与 GPU 融合于一颗芯片，定位”AI 个人电脑”，可本地运行 AI agent，微软、戴尔等将于 2026 秋季推出搭载机型；黄仁勋称这是”40 年来首次跨产品线的 PC 重新发明”。②数据中心线：新一代 Vera CPU 已全面量产，早期客户含 Anthropic、OpenAI、SpaceXAI。③机器人线：发布 NVIDIA Isaac GR00T 人形机器人参考设计（本体用宇树 H2 Plus、大脑用 Jetson AGX Thor T5000，内含 Blackwell GPU、2070 FP4 TFLOPS）。消息刺激 NVDA 盘前涨近 4%，Intel、AMD 均跌超 3%。 ↳ 为什么重要：NVIDIA 正从”数据中心 GPU 霸主”向”端-边-云全栈算力”扩张，RTX Spark 直插 Intel/AMD 腹地，Jetson Thor + Isaac GR00T 卡位具身智能本体算力，意图通吃 AI 每一层。 Fortune 报道 · NVIDIA 官方

2. 宇树”三喜临门”：产能破万 + IPO 过会 + 英伟达联姻｜ 6/1–6/2

中国人形机器人量产元年的标志性一周。①产能破万：6/2 官宣，截至 2026 年 5 月单款双足人形累计下线约 11000 台，新基地设计年产能达 7.5 万台、较 2025 年增约 12 倍。②IPO 闪电过会：6/1 上交所科创板上市审核委审议通过宇树首发申请，从 3/20 受理到过会仅 73 天刷新最快纪录，拟募资 42.02 亿元，整体估值约 420 亿元，有望成 A 股”人形机器人第一股”。③英伟达联姻：黄仁勋在 GTC 台北宣布与宇树战略合作，以宇树 H2 Plus 为本体、英伟达提供 Jetson Thor + Isaac GR00T 大脑。 ↳ 为什么重要：三重利好叠加于一周，是宇树乃至中国人形机器人产业的”奇点时刻”；被英伟达选为首个开放人形参考设计本体，等同获得全球算力龙头的”出货背书”。新浪财经 · NVIDIA 官方

3. MiniMax M3 发布：中国首个集齐”前沿 Coding + 1M 上下文 + 原生多模态”的开源模型｜ 6/1

儿童节正式发布第三代旗舰 MiniMax M3，采用自研稀疏注意力架构 MiniMax Sparse Attention（MSA）：索引分支快速扫描筛选关键 Token，再交稀疏计算分支精算，把长上下文复杂度从 O(n²) 大幅压缩。官方称 M3 是国内首个同时具备”前沿 Coding + 1M 超长上下文 + 原生多模态”三项能力、且全球唯一具备完整能力组合的开源选项。性能：100 万上下文下单 token 计算量仅为上代约 1/20，对比 M2 Prefilling 提速 9.7×、Decoding 提速 15.6×；SWE-Bench Pro 59.0%（超 GPT-5.5 和 Gemini 3.1 Pro、接近 Opus 4.7）、Terminal Bench 2.1 66.0%。同日 MiniMax Code 更新，Token Plan 拉入”百元时代”（Plus 49 元/6 亿 token、Max 119 元/18 亿、Ultra 469 元/55 亿）。 ↳ 为什么重要：中国开源模型首次集齐三项核心能力，对海外闭源旗舰构成实质挑战；MSA 把长上下文推理成本砍到 1/20，是”Agent 经济学”的关键突破；百元 Token Plan 意在抢占全球开发者生态。凤凰财经 · 36氪 · 官方

4. DeepSeek 首次对外融资：约 74 亿美元、估值 590 亿美元｜ 6/3

据路透社等报道，长期靠母公司幻方资金自给的 DeepSeek 正筹备首轮融资约 74 亿美元（约 500 亿元人民币），投资方包括腾讯与宁德时代 CATL 等，估值最高可达 590 亿美元，有望跻身中国规模最大的私募科技融资之一。这是这家以低成本高性能开源模型闻名的中国 AI 公司首次对外融资，标志其从”研究驱动的隐形冠军”转向资本化扩张。 ↳ 为什么重要：74 亿美元融资 + 590 亿估值是中国 AI 资本市场的标志性事件；腾讯 + CATL 入局意味”互联网巨头 + 硬科技/能源”对算力时代的押注，资金或解决 DeepSeek 长期算力瓶颈；也意味其从纯研究走向商业化扩张，需关注开源策略是否持续。 Reuters · Tech Startups

5. 微软 Build 2026：全栈”AI Agent 平台”+ 自研 MAI 模型去 OpenAI 依赖｜ 6/2–6/3

微软在旧金山 Build 2026 把 Windows + Copilot + Azure 整体重塑为”AI Agent 平台”。①Microsoft Agent Framework 编排构建块转 stable（与 GitHub Copilot SDK、Claude Agent SDK 集成）；Hosted agents 预计 7 月初 GA；Memory in Foundry、Toolboxes、Foundry IQ（含 Web IQ 实时联网 grounding）全线公开预览。②自研 MAI 模型家族：MAI-Code-1-Flash（vibe coding，已接入 GitHub Copilot）、MAI-Thinking-1（推理，Foundry 私有预览）、Aion 小模型（Windows 本地）；Suleyman 称定制后成本效率比 GPT-5.5 高 10 倍。③下一代 Phi-4 已驱动部分 Copilot 功能。 ↳ 为什么重要：微软从”OpenAI 独家分销商”转向”自建前沿模型 + 多模型并存”，既降本又夺回模型层控制权；全栈 agent 平台把治理/可观测/记忆/grounding 做成开箱即用，直击企业生产化痛点。 Foundry 博客 · CNBC

🧭 三条主线趋势

① 从”发模型”集体转向”发平台 / 发 Agent / 发资本”。 本周真正有硬动态的基座厂高度集中在产品化与生态：Google（Gemma 4 12B，encoder-free 端侧多模态）、Microsoft（Build 2026 全栈 agent 平台）、OpenAI（求职入口/记忆翻倍/Lockdown Mode/英国广告）、DeepSeek（74 亿美元首轮融资）。”模型即基础设施、Agent 即产品”成为主线，竞争焦点从参数/benchmark 转向 agent 运行时、记忆、grounding、治理。

② “本地通用 Agent + Agent 经济学”成为最强共振信号。 Kimi Work（300 子 Agent 集群、本地干活）、Perplexity 混合本地-服务器推理编排器、Cursor Design Mode、Devin Desktop 的 Agent Command Center——头部产品本周不约而同把”Agent 从云端 Chat 下沉到端侧/桌面、跨应用自主执行真实任务”作为主攻方向。底层则是 token 经济学之争：Glean Waldo（延迟 -50%/token -25%）、MiniMax MSA（计算量 1/20）、Perplexity 端云路由——谁能在不牺牲能力的前提下把推理成本压下来，谁就能让 Agent 规模化普及。

③ 算力全栈化 + 具身机器人量产元年坐实。 NVIDIA 以 RTX Spark 杀入 PC、Vera 量产卡数据中心、Jetson Thor + Isaac GR00T 卡机器人本体，意图通吃端-边-云；AWS/Azure 在模型层激烈卡位（OpenAI 模型登陆 AWS 打破 Azure 独占，微软反手推自研 MAI）。具身侧宇树产能破万 + IPO 过会、优必选下探 C 端超仿生陪伴、Figure 拿下零售仓储订单，三条路径同周坐实”商业订单替代试点”。

📊 赛道速查表（导航索引）

🔥重大｜ 🟢一般｜ 🟡边缘｜ ⚪️静默

🧠 大模型基座

对象	本周	一句话
Google DeepMind	🔥	Gemma 4 12B：encoder-free 统一多模态，16GB 笔记本可跑
Microsoft	🔥	Build 2026 全栈 agent 平台 + 自研 MAI 模型（详见 TOP 5）
OpenAI	🟢	求职入口/记忆翻倍/Lockdown Mode/英国广告四线并进
DeepSeek	🔥	首轮融资 74 亿美元、估值 590 亿（详见 TOP 5）
xAI	🟢	Grok Imagine 上线 Quality Mode、Composer 2.5
Anthropic	🟡	仅企业自定义角色新增 admin 权限（Opus 4.8 在窗前）
Meta AI	🟡	Behemoth 延迟、EU 许可争议、股价承压（多为二手）
Databricks	🟡	Summit 预热 + Vector Search 更名 AI Search
Mistral AI	🟡	仅 mistral-common v1.11.2/1.11.3 SDK 迭代
字节跳动	⚪️	静默期，弹药集中到 6 月中 Force 大会

🤖 垂直 Agent 产品

对象	本周	一句话
Anysphere (Cursor)	🔥	3.7 版 Design Mode 多选元素 + 语音输入 + SDK 升级
Cognition (Devin)	🔥	Windsurf 升级 Devin Desktop，首发支持开源 ACP 协议
Perplexity	🔥	首个混合本地-服务器推理编排器
Glean	🟢	新增 NVIDIA Nemotron 3 Ultra 支持，平台接入 30+ 模型
Harvey	🟢	《为每个事项定制法律 Agent》+ 大律所计时收费被动摇
Midjourney	🟡	Office Hours：v8.2 待发、v8.1 转默认
Sierra	⚪️	5 月 megaround 后消化期，无新公开动作

🇨🇳 中国公司

对象	本周	一句话
MiniMax	🔥	M3 发布，国内首个集齐三项能力的开源模型（详见 TOP 5）
月之暗面 (Kimi)	🔥	Kimi Work Beta 内测，300 子 Agent 集群、92% 代码 AI 生成
阿里云 (Qwen)	⚪️	5/20 峰会发 Qwen3.7-Max 后执行期
智谱 (GLM)	⚪️	2 月 GLM-5、4 月 GLM-5.1 后迭代消化期
腾讯 (混元)	⚪️	“先偿内债”，4 月混元 3.0 后内部落地期

🛠️ Agent 框架工具

对象	本周	一句话
Claude Code	🔥	每日发布：fallbackModel、managed settings 版本锁定、跨会话安全
Codex CLI	🔥	rust-v0.137.0 + 多智能体 v2 + goal extension + 远程控制
Google ADK	🔥	v2.2.0：默认模型切 gemini-3-flash-preview + OTel 原生
OpenClaw	🟢	2026.6.5 月度补丁：新增 Parallel 搜索 provider + 错误恢复
OpenCode	🟢	仓库迁 anomalyco、启动 +38%、新增 Snowflake Cortex
Hermes Agent	🔥	NVIDIA 官方将其选为 NemoClaw 蓝图 harness 层
Dify	⚪️	v1.14.2（5/19）后发布间隙，无新 tag
Scale AI	⚪️	Scale Labs 评测榜单常态更新，无里程碑
Cohere	🟢	开源数据可视化工具 co/plot 发布
SSI	⚪️	零产品纯研究，仅外部估值梳理（$32B）

⚡ 算力云硬件

对象	本周	一句话
NVIDIA	🔥	GTC Taipei：RTX Spark + Vera 量产 + Isaac GR00T（详见 TOP 5）
AWS	🔥	GPT-5.5/5.4 + Codex 登陆 Bedrock GA，打破 Azure 独占
Azure	🔥	Build 推自研 MAI 去 OpenAI 依赖（详见 TOP 5）

🦾 具身机器人

对象	本周	一句话
宇树 Unitree	🔥	产能破万 + IPO 过会 + 英伟达联姻（详见 TOP 5）
优必选 UBTech	🔥	“优世界”品牌下探 C 端超仿生陪伴，3000 元定金预售
Figure AI	🟢	签 Catalyst Brands，进零售仓储物流

📚 赛道深度正文

🧠 大模型基座

Google DeepMind · Gemma 4 12B（6/3） 本周 DeepMind 的核心动作是发布 Gemma 4 12B——一款”无编码器（encoder-free）的统一多模态开放模型”，定位”把 agentic 多模态智能直接带到笔记本电脑”。架构创新：摒弃传统多模态模型的独立视觉/音频编码器，视觉用”单次矩阵乘法 + 位置嵌入 + 归一化”的轻量 embedding 模块替代，音频则完全移除编码器、把原始音频信号直接投射到与文本 token 相同的维度空间，由 LLM 主干统一处理（降低延迟与内存占用）。它填补了边缘端 E4B 与更强 26B MoE 之间的空档，是 Gemma 系列首个具备原生音频输入的中型模型。性能上标准 benchmark “接近其 26B MoE 模型”，但总内存占用不到一半，可在仅 16GB VRAM/统一内存的消费级笔记本本地运行。生态：Apache 2.0 许可证开源，内置 Multi-Token Prediction（MTP）drafter 降低延迟；官方称 Gemma 4 系列累计下载已突破 1.5 亿次，已上线 LM Studio、Ollama、Google AI Edge Gallery。背景：Gemma 4 初代于 2026-03-31 发布；6/11 还将在 London Tech Week 办”Gemma 4 Startups”活动（含 Gemini 3.1、Genie、Veo 预告）。encoder-free 统一多模态是端侧 AI 的范式转变，瞄准”本地笔记本跑 agent”场景，是 Google 在开源端侧与 Meta Llama、Qwen 正面竞争的关键落子。 Google 博客 · 版本时间线

Microsoft · Build 2026 全栈 agent 平台 + MAI（详见 TOP 5）除 TOP 5 所述，本届 Build 还交付：Foundry Toolkit for VS Code 正式 GA；Toolboxes in Foundry 公开预览（统一治理工具/技能/MCP 客户端/企业数据的单一端点）；Voice Live 新增实时语音路径；Foundry agent 可发布到 Teams 与 M365 Copilot（计划 6 月 GA）；Memory in Foundry Agent Service 新增 procedural/user/session 三类记忆；Foundry IQ 升级为更广知识平面（serverless 检索、Web IQ 实时联网 grounding，Work IQ APIs 2026-06-16 GA）；基础设施侧推出 Azure Cobalt 200 VMs、Azure HorizonDB（面向 AI 时代的企业级 Postgres）。与 Claude Agent SDK、GitHub Copilot SDK 深度集成，显示微软走”开放编排 + 多模型”而非单一模型路线。 Foundry 博客 · Build 2026

OpenAI · ChatGPT 产品侧四线并进（6/1–6/4） 本周 OpenAI 重心从”发模型”转向”产品化 + 安全合规 + 商业化”。①6/1：ChatGPT 上线”求职”能力——可在对话中搜索实时在招岗位（live roles）并针对特定职位定制简历（resume tailoring），把 ChatGPT 推向求职工作流入口。②6/2：上线”Active sessions（活跃会话）”安全功能，用户可在 Settings>Security 查看与账户关联的所有会话（设备、App、大致位置、登录时间、可信设备状态）并单独或一次性登出，覆盖 ChatGPT/Codex/API Platform 会话；同日开发者侧官宣 GPT-5.2 与 GPT-5.3-Codex 进入 sunset 退役时间表。③6/4：升级 Memory 系统——记忆自动更新、减少陈旧/矛盾记忆，Plus/Pro 用户记忆容量翻倍；同日”Lockdown Mode（锁定模式）”面向所有登录用户开放（限制联网/深度研究/agent 模式/文件下载以降低提示注入数据外泄风险）；并开始在英国对 Free/Go 用户推送广告（付费层保持无广告）。OpenAI 把”反提示注入”做成 C 端产品功能，英国广告落地是 ChatGPT 商业模式的关键拐点。 ChatGPT Release Notes · Codex Changelog

DeepSeek · 首轮融资 74 亿美元（详见 TOP 5）背景补充：deepseek-chat 与 deepseek-reasoner 已于此前升级至 DeepSeek-V3；DeepSeek-V3.2 & V3.2-Speciale（reasoning-first、为 agent 构建）于 2025 年 12 月发布；R1 于 2025 年 1 月发布（性能对标 OpenAI-o1、全开源）。本周核心是”资本拐点”——首次引入外部战投（腾讯 + CATL），590 亿美元估值反映市场对中国开源大模型龙头的重估。 Reuters · API 更新

xAI · Grok Imagine Quality Mode + Composer 2.5 本周 xAI 在产品工具侧更新。①Grok Imagine API 上线”Quality Mode”，面向企业开发者与团队，主打更高写实度、更强多语种文字渲染、更精准提示遵循与品牌一致性，瞄准产品可视化、营销素材、UGC 风格内容；据其引用的 LMArena Text-to-Image Arena（截至 2026-05-04）排名，OpenAI 1398/Google 1268/xAI 1223。②Composer 2.5 在 Grok Build 中上线（本周初），定位擅长长任务与复杂指令遵循的快速 SOTA 模型，同期新增 Smart Turn 对话轮次结束检测。背景：5/25 马斯克称 Grok V9-Medium（约 1.5T 参数级编码模型）已完成训练、预计 mid-June 出货（尚未发布）。xAI 从消费级 Grok 聊天向企业开发者工具与多模态内容生产延伸，但本周无实质模型发布，需警惕”预告先行、交付滞后”。 xAI Releasebot

Anthropic · 企业自定义角色新增 admin 权限（6/2） 本周 Anthropic 无重大模型发布，仅有企业管理功能小更新：Enterprise 套餐的自定义角色（custom roles）框架新增”管理员权限”，可让成员获得计费/隐私等特定管理区域访问权而无需设为 Owner（精细化权限治理）。背景：最重磅的 Claude Opus 4.8 于 5/28 发布（窗前 3 天，不计入本周）。本周节奏放缓属正常——刚在窗前发完旗舰，进入企业治理打磨期，把”可治理、可合规”作为对抗 OpenAI 的护城河。 Release Notes

Meta AI · Llama 4 调整期（二手为主） 本周 Meta 无 Llama 新模型发布，但有两条相关动态。①Llama 4 许可证/EU 可用性争议：Meta 托管服务与自托管 Llama 权重为不同路径，EU 企业在自建开源模型策略前需直接确认当前许可条款。②资本市场承压：据 TipRanks（6/5），Meta 股价当日下跌，部分因 Llama 4 发布令投资者失望，且 Meta 推迟了更大的 Llama 4 Behemoth 模型发布。本周 Meta 在 Llama 侧处于”调整期”，开源旗舰高地出现松动；注：本周核心动态多为二手来源，需以 Meta 官方博客交叉验证。 digitalapplied 分析

Databricks · Summit 预热 + AI Search 更名 本周 Databricks 无新基座模型发布，重心在大会预热与平台更新。①6/2 官宣 Data + AI Summit 2026 完整议程：6/15-18 旧金山 Moscone，预计超 3 万人，主题演讲嘉宾含微软 Satya Nadella（预录）、OpenAI 的 Greg Brockman 等。②平台更新：Azure Databricks Vector Search 正式更名为 AI Search（现可创建无需向量/嵌入的全文检索索引）。背景：2/9 宣布跨越 54 亿美元营收 run-rate、估值 1340 亿美元。Databricks 持续走”数据 + AI 一体化平台”路线，基座模型（DBRX）已非其叙事重点。 Summit 新闻 · 6 月平台更新

Mistral AI · mistral-common SDK 迭代 本周 Mistral 无新旗舰基座发布，仅开源工具库小版本迭代：6/3 mistral-common v1.11.2、6/4 v1.11.3（扩展 OpenAI 转换的 reasoning 格式支持、修复 tokenizer guidance 与 tekken normalizers）。背景：5/28 发布”Vibe”——把 Le Chat 升级为统一 AI agent（含 Work Mode、Code Mode、VS Code 扩展），卡在窗前 3 天。Mistral 近期重心明显从”发基座”转向”agent 产品化 + 开发者工具链”。 Mistral Releasebot

💤 本周静默：字节跳动（重大发布节奏与火山引擎 Force 大会绑定，历史多在 6 月中举办，本周处大会前静默期，弹药蓄势待发）。

🤖 垂直 Agent 产品

Anysphere (Cursor) · 3.7 版 Design Mode（6/5） 本周 Cursor 发布 3.7 版本，核心是”Design Mode（设计模式）”的重大增强，让开发者可在 Cursor 浏览器中直接对实时运行的应用做可视化操作：①多选元素——同时点选两个或以上 UI 元素，Cursor 能读取所选元素的代码、周边布局及视觉关系，可让 agent”把 A 改成和 B 一致”、批量调整一组组件；②语音输入——通过 Design Mode 浮层用语音口述改动，且 agent 运行中麦克风保持可用，可语音排队下一个改动。配套更新：Cursor SDK 升级（TS/Python），新增自定义工具（通过 local.customTools 把自有函数作为 MCP 工具暴露）、auto-review（本地 headless agent 的工具调用经分类器审核）、JSONL 持久化、可无限嵌套的 subagent；Canvas Design Mode + 上下文用量报告（拆解 token 在 system prompt/tool 定义/rules/skills 等处的分布）；Enterprise Organizations（企业版组织管理，支持多 Team 多 Group 的安全/治理/预算/功能分权，已对所有企业客户 GA）。Cursor 正从”代码编辑器”全面转向”agent 编排平台”——Design Mode 把前端可视化操作纳入 agent 闭环，SDK 的嵌套 subagent + 自定义工具是在搭建生产级 agent 基础设施。背景：据 Wikipedia 摘要 Cursor 估值达数百亿美元、ARR 超 30 亿美元。 Cursor Changelog

Cognition (Devin) · Windsurf 升级 Devin Desktop（6/2） 本周 Cognition 正式将 Windsurf 更名/升级为 “Devin Desktop”（老用户 OTA 自动获得，计划/价格/扩展/功能不变）。核心：把 Windsurf 和 Devin 合二为一，将 Agent Command Center（智能体指挥中心）设为默认界面——用户在单一 Kanban 看板里管理所有本地与云端 agent；新增 Spaces 在 agent 之间共享上下文。最关键的开放性举措：Devin Desktop 首发即支持 ACP（Agent Client Protocol，开源协议），让任何兼容 agent 能在任何 ACP 兼容编辑器内运行；首发支持 Codex、Claude Agent、OpenCode 等第三方 agent（含企业自建），第三方 agent 获得与 Devin 相同的界面。同时推出 Devin Local——用 Rust 从头重写的本地 agent（Cascade 继任者），token 效率提升最高 30%、支持 subagents。形成”一个 Devin、多个 surface”（Desktop/Cloud/CLI/Review）。背景：5/27-28 宣布完成超 10 亿美元融资、估值 260 亿美元，营收 12 个月从 $37M 增至 $492M、90% 自有代码由 AI 编写。Cognition 用 ACP 开放性吸纳竞品 agent 入驻自家 command center，是典型的”做平台、做入口”打法。 Devin 博客

Perplexity · 混合本地-服务器推理编排器（Computex 2026） Perplexity 发布其所称”首个混合本地-服务器推理编排器”，官方技术博客标题《The data center moves to your machine》。核心机制”混合智能体推理“：在用户设备上运行一个紧凑的本地模型作为”路由器”，对每个进入的任务/子任务评估——是否涉及敏感数据、是否需要重计算、是否能完全在端上完成——据此决定任务留在本地还是发往云端前沿模型，发送敏感任务到云端前会征求用户许可，明确把金融/健康/个人文件保持在本地。它建立在 Perplexity Computer（2026-02，云端多模型 agentic 产品、可协调多达 20 个 AI 模型）和 Personal Computer（2026-04 在 Mac 上线）之上，进步在于对”任务的每一部分该在哪执行”做推理。框架模型无关、芯片无关，已确认可在 Intel Core Ultra Series 3 和 NVIDIA RTX Spark 硬件运行，预计 2026 年 7 月先在 Windows 上随 Perplexity Computer 到来。”端云混合推理路由”若成主流，将重塑 AI 产品的成本结构与隐私架构。 MarkTechPost

Glean · 新增 NVIDIA Nemotron 3 Ultra 支持（6/4） Glean 官方发布新增对 NVIDIA Nemotron 3 Ultra 开源模型的支持，为客户提供”高性价比 agentic 工作”的新开放模型选项。官方称 Nemotron 3 Ultra “以开源模型的成本结构交付前沿 LLM 91% 的完整度“。此举强化 Glean 的模型无关平台战略：现平台已接入 30+ 模型（含开源与闭源）。原文还披露与 NVIDIA 的延续合作：Glean 的 agentic 搜索模型 Glean Waldo 基于 Nemotron 3 Nano 做后训练，实现延迟降低 50%、token 减少 25%——Waldo 承接原本由前沿模型处理的搜索任务，体现 Glean 的”token 经济学”思路。背景：据报道 5/28 宣布 ARR 突破 3 亿美元、15 个月内 3 倍增长。Glean 把自己定位为”企业 AI 的可信上下文与智能层”。 Glean 官方

Harvey (Legal) · 为每个事项定制法律 Agent 本周 Harvey 官方博客核心产品博文《Legal Agents for Every Matter, Tailored to You》，宣布引入”改进的 agentic 能力”，使法律团队能快速产出一致、高质量的结果。同时重要行业背景：洛杉矶时报 6/1 刊文《AI shakes up big law, threatening the billable hour》，指出顶尖律所正大规模部署 Harvey 等定制平台以加速文档审查、推行分层定价，同时 AI 生成的错误在法庭文件中堆积、威胁传统计时收费模式。背景：3/25 完成 $200M 成长轮、估值 110 亿美元、总融资超 12 亿美元；ARR 1.9 亿美元、服务 60 国 1300+ 客户、平台上运行 25000+ 定制 AI agent；与 LexisNexis、Docusign 整合。”每个法律事项都配定制 agent”是 legal AI 从工具到平台的关键演进，LA Times 报道揭示 legal AI 正实质动摇律所计时收费模式。 Harvey 博客 · LA Times

Midjourney · Office Hours（6/3） 本周无新模型正式发布，但有官方周度 Office Hours：团队两大优先级是 v8.2 发布和新的 editor model（编辑模型）。v8.2 主要聚焦修复并扩展 v8.1 的美学表现，创始人 David Holz 估计约还要 2 周才会发布；在此之前 v8.1 将先成为主站和 Discord 的默认模型（取代 v8.0）。版本脉络澄清：题述”v7”已是旧版（2025-04-03 发布），2026 年主线已推进到 V8 系列（V8.1 于 2026-04-30 发布，渲染比早期快约 4-5 倍）。Midjourney 拆分出独立”editor model”，显示图像编辑正成为与生成并重的能力轴；本周属过渡期，不代表停滞。社区 Office Hours 记录

💤 本周静默：Sierra（5/4 完成 $950M E 轮、估值 $15.8B 并在 Sierra Summit 集中发布 8 款新品后，本周处发布后消化期，无新增公开动作）。

🇨🇳 中国公司

MiniMax · M3 发布（详见 TOP 5）补充技术细节：M3 官方六大关键词为 Coding 能力、1M 上下文、原生多模态、Computer Use、低价 Token Plan、开源。此前能集齐”前沿 Coding + 1M 上下文 + 原生多模态”三项的仅 Claude Opus 4.7、Gemini 3.1 Pro、GPT-5.5 等海外闭源旗舰。完整 benchmark：SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%、SWE-fficiency 34.8%、KernelBench Hard 28.8%、MCP Atlas 74.2%；SVG-Bench 超 Opus 4.7；多模态 OmniDocBench 超 Gemini 3.1 Pro；Claw-Eval 拿最高分。同日 MiniMax Code 更新（Agent Team 可将大任务拆解为多阶段可并发 Workflow）。背景：截至 5/28 全球企业开发者客户超百万、全球用户约 3 亿、过去两月 ARR 增长超 100%。凤凰财经 · 36氪 · 官方

月之暗面 (Kimi) · Kimi Work Beta 内测（6/3） 本周月之暗面宣布”Kimi Work Beta 版“开启内测，随 Kimi 最新测试版 Mac 和 Windows 客户端推出。官方定位：Kimi Work 是面向知识工作者的通用型本地 Agent——用户无需打开终端、写命令、配置环境，只需用自然语言描述目标，Kimi Work 即可在用户电脑上拆解任务、并行执行、调用工具、使用浏览器、创建整理文件夹，并交付文档/表格/PPT 等工作产物。关键能力：支持 Agent 集群，最高可根据任务复杂度自主创建包含 300 个子 Agent 的团队。最具信号意义的细节：Kimi Work 自身由 Kimi Code 深度参与写出——工程师用 Kimi Code 等 Coding Agent 工具一周内完成 Beta 版客户端，开发中累计产出超 5 万行有效代码，其中 92% 由 AI 自主生成。背景：Kimi K2 于 2025-07-11 发布（万亿参数/320 亿激活、开源），旗舰 Kimi K2.6 于 2026-04-20 发布并开源。Kimi 从”模型 + Chat”向”本地通用 Agent + Agent 集群”延伸，主打”AI 替知识工作者干活”的落地叙事。新浪科技转 IT 之家

💤 本周静默： 阿里云（Qwen/夸克）——重磅集中在窗前 5/20 阿里云峰会（发布 Qwen3.7-Max + 自研真武 M890 芯片 + 千问云、完成”芯片-云-模型-推理”全栈 Agent 化升级），本周处发布后落地执行期；通义千问 Plus 预计 6 月全量开放，本周未见正式公告。 智谱（GLM/清言）——旗舰 GLM-5（2 月、744B 参数）、GLM-5.1（4 月并提价 10%）密集发布后处迭代消化期；已在港交所上市（02513.HK），本周无新版本对外。 腾讯（混元/元宝）——AI 战略明确”先偿内债”，优先在元宝/QQ/腾讯文档等十余款产品内铺开混元 3.0（4/23 发布、5/7 以 3.66 万亿 Token 登顶 OpenRouter 周榜）能力，本周处内部落地期；”腾讯元器”6 月分发能力本周未见正式上线确认。

🛠️ Agent 框架工具

Claude Code · 高频发布周（5/31–6/6） 本周是 Claude Code 的高频发布周，节奏接近每日一发。核心新功能：①fallbackModel 设置（6/6）——可配置最多三个 fallback 模型，主模型过载/不可用时按序尝试，–fallback-model 现也作用于交互式会话；②deny 规则支持 glob 通配——deny 规则工具名位置支持 “*“（拒绝所有工具）；③跨会话消息安全加固——经 SendMessage 从其他 Claude 会话转发的消息不再携带 user authority，接收方拒绝转发的权限请求；④managed settings 强化（6/4）——新增 requiredMinimumVersion/requiredMaximumVersion，版本越界则拒绝启动；新增 /plugin list 命令；⑤思考控制——MAX_THINKING_TOKENS=0 现可关闭默认思考的模型；⑥触发词从 workflow 改为 ultracode（6/2）。另有大量 background agents 稳定性、Windows 权限规则反斜杠匹配、MCP 密钥脱敏、OTEL 指标维度切片修复。Claude Code 本周明显聚焦”企业治理 + 模型容错 + 多会话/后台 agent 编排稳定性”，正从单机编码工具向团队级、可治理、多 agent 并行的工程平台演进。 GitHub Releases

Codex CLI · rust-v0.137.0 + 多智能体 v2（6/4–6/6） Codex 本周发布极其密集，正式版 rust-v0.137.0 于 6/4 发布，随后 0.138.0-alpha.1~alpha.6 在 6/4-6/6 连续滚出。v0.137.0 核心：①多智能体 v2——每个 thread 保留运行时选择，为 spawned agents 暴露更干净的 follow-up 与 metadata，assign_task 重命名为 followup_task，新增 multi-agent runtime metadata 类型与持久化；②企业/管理流——状态栏显示月度 credit 限额，可应用 cloud-managed config bundles（含 EDU 工作区）；③远程控制——remote-control 客户端可通过 app-server v2 RPC 发起配对、列出/撤销 controller 授权；④插件工作流——codex plugin list –json 机器可读输出；⑤托管 Web/图像工具——独立 web 搜索可并行运行；⑥goal extension——新增 GoalApi、idle continuation、目标引导提示模板化。Codex 正全力投入”多智能体编排 + 企业级配置治理 + 远程控制”，goal extension 与 idle continuation 显示其向”自主长任务 agent”演进，与 Claude Code 的企业治理路线高度趋同。 GitHub Releases

Google ADK · v2.2.0（6/4） ADK 本周有两个在窗发布：v2.2.0（6/4）与 v1.34.2（6/1）。v2.2.0 含破坏性变更：①LlmAgent 默认模型从 gemini-2.5-flash 改为 gemini-3-flash-preview，为 2026-10-16 gemini-2.5-flash 下线做准备；②interactions 适配 GenAI SDK v2.0.0，术语从 “turns” 改为 “steps”。新特性：AutoTracingPlugin（OpenTelemetry 自动插桩）、RubricBasedMultiTurnTrajectoryEvaluator（基于评分标准的多轮轨迹评估器）、原生发射 OTel gen_ai.client.* 指标、BaseSessionService 新增 get_user_state。安全修复：升级 starlette/fastapi 修复 CVE-2026-48710、GCS skill 解压修复 Zip Slip。默认模型切到 gemini-3-flash-preview 是强信号——Google 正以框架默认值推动开发者迁移到 Gemini 3 系列；OTel 原生指标 + Rubric 评估器显示 ADK 向”可观测、可评估的生产级 agent 平台”成熟。 GitHub Releases

Hermes Agent · NVIDIA 官方背书（约 6/2） Hermes Agent（Nous Research 出品的自改进 AI agent）本周最重磅信号是 NVIDIA 官方技术博客发布深度集成案例：《Deploy Self-Evolving Agents for Faster, More Secure Research with a Hermes Agent and NVIDIA NemoClaw》。该文将 Hermes 定位为 NemoClaw 蓝图的 “harness” 层（提供 skills/sessions/memory/bridges/hooks），与 NVIDIA Nemotron 3 Super（120B-A12B-FP8）模型层、OpenShell 运行时层组成三层自进化 agent 架构。案例演示 agent 从对话中学习报告格式并自动写出 SKILL.md，通过 snapshot/tear-down/rebuild/restore 让习得技能跨部署存活；网络策略以 policy.yaml 代码声明，越界访问返回 403。Hermes 核心卖点：内置学习闭环、6 种终端后端、多平台 gateway、兼容 agentskills.io 标准、原生 Windows 支持。值得注意：README 明确提供 hermes claw migrate 从 OpenClaw 迁移功能。NVIDIA 把 Hermes 选为其 NemoClaw 开放 agent 蓝图的官方 harness，是自进化 agent 赛道的里程碑级背书。 NVIDIA 博客 · GitHub

OpenClaw · 2026.6.5 月度补丁（6/6） 正式版 2026.6.5 于 6/6 发布。核心改动三条线：①搜索 Provider 扩展——新增 Parallel（api.parallel.ai/v1/search）作为内置 web_search 提供商，支持自动发现、guarded endpoint、onboarding 选择器；②协议/通道稳健性——MCP 工具结果现在在 materialize 边界对非文本块做强制 coerce，避免 Anthropic 400 错误；Anthropic 扩展思考会话在 prompt-cache 过期或 Gateway 重启后可恢复；③通道内容边界——QQBot 在原生投递前剥离模型 reasoning/thinking 脚手架。此外 auth profile 迁入 SQLite、cron 旧版 JSON 存储迁移至 SQLite。发布流程切换为 YYYY.M.PATCH 月度补丁编号。OpenClaw 月度补丁化 + 错误恢复深耕，标志其进入”生产可用稳定期”；新增 Parallel 搜索 provider 说明 Agent OS 正在做搜索后端多元化。 GitHub Releases

OpenCode · 仓库迁移 + 启动 +38%（6/5） 本周两个在窗发布。值得注意：仓库已从 sst/opencode 重定向到 anomalyco/opencode（疑似维护方/品牌归属变更）。核心：managed workspace cloning、跨 workspace 移动会话、通过 AWS Bedrock 支持 OpenAI 模型、skill discovery 与基于文件的 agent 加载、启动时间提升 38%；reasoning summaries 仅在支持的 provider 运行、running subagents 可发送到后台、新增 Snowflake Cortex provider。组织迁移 + 启动性能大幅优化 + 多 provider 扩张，是 OpenCode 从社区项目走向规模化/可能商业化的拐点信号。 GitHub Releases

Cohere · 开源 co/plot（6/5） Cohere 发布开源数据可视化工具 co/plot。该工具由 Cohere Labs 内部研究可视化需求催生（Matplotlib 迭代慢、Figma 出图美但无法可靠接入数据），co/plot 填补”可快速原型 + 预设可定制样式 + 忠于底层数据”的空白，在构建 Tiny Aya 模型（评估 70+ 语言）过程中被打磨。背景：Command A+ 开源企业模型于 5 月底发布（窗前）。co/plot 是小而精的开源动作，配合主权 AI 定位与潜在 IPO 路径，显示 Cohere 以”开放科学 + 企业/政府主权部署”双轮做差异化。 Cohere 博客

💤 本周静默： Dify——最新正式版 v1.14.2（5/19）后处发布间隙，本周 GitHub releases 无新 tag，属 1.14 稳定补丁周期的正常节奏波动。 Scale AI——Scale Labs 的 Showdown/Leaderboard 评测榜单本周保持常态化更新，无方向性新动作或里程碑事件。 SSI——坚持”零产品、纯研究、超长周期”路线，本周无任何技术信号，仅有外部财务梳理（累计融资约 $6B、估值 $32B）。

⚡ 算力云硬件

NVIDIA · GTC Taipei 大爆发周（详见 TOP 5）补充：6/2 黄仁勋对外表态 NVIDIA “有足够产能支撑 CPU/GPU 强劲增长”，回应供给约束担忧。Jetson AGX Thor T5000 规格：Blackwell GPU、2070 FP4 TFLOPS AI 算力、14 核 Arm CPU、128GB 统一内存、40–130W 可配置功耗。Vera CPU 全面量产，被定位为”新的主要增长驱动力”。NVIDIA 从云端 GPU 单点垄断走向”端-边-云”全栈通吃，RTX Spark 把战火烧到 PC 芯片，直接动 Intel/AMD 蛋糕。 Fortune · NVIDIA · Reuters

AWS · OpenAI 模型登陆 Bedrock GA（6/1） AWS 本周核心动作是把 OpenAI 前沿模型全面接入 Bedrock——GPT-5.5、GPT-5.4 与编码 agent Codex 在 Amazon Bedrock 正式 GA。这是继 4/27 微软与 OpenAI 重组协议、独占条款被取消后，OpenAI 模型首次大规模登陆 AWS 云。要点：①GPT-5.5 面向”最难的客户工作负载”，GPT-5.4 主打”最佳性价比”，均通过 Bedrock 以 Responses API 调用；②Codex 据 OpenAI 称每周有超 400 万开发者使用；③数据驻留：所选 Bedrock 区域内完成全部处理，按 token 计费，无席位许可。同时 Bedrock 推出 AgentCore（端到端 agent 平台）、与 Coinbase/Stripe 合作的 AgentCore Payments、Bedrock Managed Agents（powered by OpenAI）。OpenAI 模型登陆 AWS 是云竞争格局的拐点信号——OpenAI 不再被微软 Azure 独占，AWS 得以用”全模型超市 + Trainium 成本优势”争夺企业 agent 工作负载。 AWS 博客

Azure · 自研 MAI 模型去 OpenAI 依赖（详见 TOP 5）补充：MAI-Thinking-1 跑在 Azure 自有基础设施上，直接改善 Azure AI 的毛利结构；Azure AI Agent Service（托管调度/记忆/工具调用/多 agent 协同）首日开放注册、首小时超 1 万开发团队报名。背景：Anthropic 6/1 已秘密递交 IPO；微软已投 OpenAI 130 亿美元、Anthropic 50 亿美元。这是微软 AI 战略的关键拐点——从深度绑定 OpenAI 转向”自研 MAI + 多供应商并行”，既降本又夺回模型层控制权。 CNBC · WindowsNews

🦾 具身机器人

宇树 Unitree · 三喜临门（详见 TOP 5）补充：宇树 2025 年纯人形出货超 5500 台、全球份额约 32.4%、居全球第一（高工机器人/IDC）。被英伟达选为首个开放人形参考设计本体（H2 Plus），”身体来自宇树、大脑来自英伟达”的分工绑定全球 AI 算力龙头。NVIDIA-宇树”美脑中身”组合，在中美科技博弈背景下耐人寻味——英伟达同时强调将与美欧厂商合作，留有对冲。新浪财经 · Reuters

优必选 UBTech · “优世界”下探 C 端（6/2） 优必选本周最大动作不在 Walker S 工业线，而是杀入消费级——6/2 旗下全新消费级人形机器人品牌”优世界“官宣，推出”全球首款全尺寸超仿生人形机器人”并开启预售，6/30 正式发布。产品分男女两款 SKU：男款 183cm/42kg、女款 168cm/35.2kg，全系标配 88 个自由度，支持 Wi-Fi、续航 2-4 小时，明确标注”不支持二次开发”——面向 C 端家庭消费者而非开发者。预售政策：即日起至 7/15 预付 3000 元定金锁首批名额（已在京东等平台上线），9 月开始交付，定位”情感陪伴 + 服务型机器人”。背景：Walker S 系列 2026 出货目标已上调至 5000 台、产能规划 1 万台，已落地蔚来 F2 工厂、极氪智慧仓等汽车产线。优世界是优必选把工业人形积累的关节/控制/AI 能力下放到消费陪伴市场，标志人形机器人商业化从”B 端产线”向”C 端家庭”开辟第二战场。 IT 之家 · myzaker

Figure AI · 签 Catalyst Brands 进零售仓储（6/5） Figure AI 本周落下一笔标志性商业订单——与 Catalyst Brands（JCPenney、Aéropostale、Brooks Brothers、Eddie Bauer、Lucky Brand、Nautica 等品牌母公司）签署商用协议，首批部署落在内华达州 Reno 的配送物流中心。机器人先承担仓储/供应链环节中重复、体力消耗大的分拣与打包任务，接入 Catalyst 现有的 Joey Pouch 分拣系统。财务暗线：Brookfield 既是 Figure 投资方、又持有 Catalyst Brands 股份——Figure 称这是其与 Brookfield 投资组合公司之间”首座商业桥梁”。部署数量/启动日期/采购模式（含 RaaS）/岗位影响均未公开。这是 Figure 从”汽车工厂（如 BMW）”向”零售/电商仓储物流”横向扩张的关键落子，但 Brookfield 资本闭环（投资方撮合自家组合公司订单）需警惕”关联交易式”需求的真实性。 Fox News

📋 关于本周报

数据口径：覆盖区间严格限定 2026-05-31（周日）00:00 → 06-06（周六）24:00（上海时区）；窗口外动态仅作背景标注，不计入”本周动态”。
覆盖率：实质覆盖 38/38（100%）——有动态对象均附原文链接与深度笔记，静默对象均经搜索验证并附具体原因。
图标说明：🔥重大｜ 🟢一般｜ 🟡边缘｜ ⚪️静默。
来源说明：官方博客 / 论文 / GitHub release / 官方公告优先于二手新闻；关键数据标注来源 URL 与日期，查不到写”未公开”。
下期预告：6 月中将密集迎来字节火山引擎 Force 大会、Databricks Data + AI Summit（6/15-18）、DeepMind Gemma 4 Startups（6/11）、xAI Grok V9-Medium 预计出货、优必选优世界 6/30 正式发布定价——下期重点跟踪。

本周一句话

🔥 本周 TOP 5

1. NVIDIA GTC Taipei：算力从云端杀向 PC 与机器人本体 ｜ 6/1

2. 宇树”三喜临门”：产能破万 + IPO 过会 + 英伟达联姻 ｜ 6/1–6/2

3. MiniMax M3 发布：中国首个集齐”前沿 Coding + 1M 上下文 + 原生多模态”的开源模型 ｜ 6/1

4. DeepSeek 首次对外融资：约 74 亿美元、估值 590 亿美元 ｜ 6/3

5. 微软 Build 2026：全栈”AI Agent 平台”+ 自研 MAI 模型去 OpenAI 依赖 ｜ 6/2–6/3

🧭 三条主线趋势

📊 赛道速查表（导航索引）

🧠 大模型基座

🤖 垂直 Agent 产品

🇨🇳 中国公司

🛠️ Agent 框架工具

⚡ 算力云硬件

🦾 具身机器人

📚 赛道深度正文

🧠 大模型基座

🤖 垂直 Agent 产品

🇨🇳 中国公司

🛠️ Agent 框架工具

⚡ 算力云硬件

🦾 具身机器人

📋 关于本周报

📖 相关阅读

1. NVIDIA GTC Taipei：算力从云端杀向 PC 与机器人本体｜ 6/1

2. 宇树”三喜临门”：产能破万 + IPO 过会 + 英伟达联姻｜ 6/1–6/2

3. MiniMax M3 发布：中国首个集齐”前沿 Coding + 1M 上下文 + 原生多模态”的开源模型｜ 6/1

4. DeepSeek 首次对外融资：约 74 亿美元、估值 590 亿美元｜ 6/3

5. 微软 Build 2026：全栈”AI Agent 平台”+ 自研 MAI 模型去 OpenAI 依赖｜ 6/2–6/3