全球 AI 核心动态内参

每日AI综述
每周浏览器综述
每周输入法综述
历史检索
监测周期:加载中...

今日重点

技术迭代 Anthropic
Claude Code推出dynamic workflows研究预览,支持数百subagent并行编排,Bun项目11天完成75万行Rust迁移
Anthropic为Claude Code推出dynamic workflows功能,可动态编写编排脚本运行数百个并行subagent,实际案例中Bun运行时从Zig到Rust的重写项目完成75万行代码迁移,测试套件通过率99.8%,首次提交到合并仅11天;支持中断恢复、进度自动保存,适用于全代码库安全审计、大规模迁移和对抗式验证,在Max/Team/Enterprise计划中可用。
商业动态 Anthropic
Anthropic发布Claude Opus 4.8并完成650亿美元H轮融资,估值达9650亿美元,年化收入突破470亿美元
Anthropic发布Claude Opus 4.8,具备更强判断力和诚实度(无依据断言概率降至前代1/4),新增动态工作流(支持数百subagent并行编排)和极速模式(速度提升2.5倍),API定价输入5美元/百万Token、输出25美元/百万Token;同期完成650亿美元H轮融资,估值从2月的3800亿增至9650亿美元(约2.5倍),年化收入已突破470亿美元。
产品动态 阿里巴巴
蚂蚁阿福上线健康监测功能,支持远程追踪家人血压数据
蚂蚁集团旗下产品"阿福"发布健康监测应用场景,主打远程健康管理功能,用户可通过阿福记录并追踪家人的血压等健康数据,面向异地子女关照父母的需求场景,将AI助手从信息查询延伸至家庭健康管理。
产品动态 Perplexity AI
Perplexity AI助手Computer上线Microsoft 365插件接入
Perplexity AI的Computer助手功能新增Microsoft 365集成插件,允许AI助手直接操作和访问Microsoft 365应用套件中的数据和功能,扩展其作为桌面AI助手的企业办公场景覆盖。
产品动态 Microsoft
微软重构Microsoft 365 Copilot界面,加载速度提升超50%,PowerPoint中使用量增长43%
微软发布Microsoft 365 Copilot全新设计,应用加载速度提升超50%(超过2倍),复杂聊天响应时间改善10%(P95),采用渐进式披露设计原则,新增Work IQ智能层整合邮件、文件、会议上下文,上线后Word使用量增27%、Excel增33%、PowerPoint增43%、Outlook增30%,引入Designer、Researcher等专项Agent模式。

OpenAI

技术迭代
OpenAI 升级 GPT-5.5 Instant 模型,优化对话风格并取消 canvas 界面支持
为优化日常人机交互与实用任务的生成质量,OpenAI 对 ChatGPT 及 API 中的 GPT-5.5 Instant 模型进行更新。核心动作包括优化其回答的风格与质量,减少冗长和列表式回复以使其更易读、自然,同时在 GPT-5.5 Instant 和 Thinking 中关停 canvas 界面,转由内置写字板和代码块直接提供支持。
行业洞察
OpenAI 正式发布前沿治理框架,阐明其高级 AI 系统安全实践如何对齐加州与欧盟法律要求
面对全球前沿大模型合规与风险缓释的监管要求,OpenAI 发布前沿治理框架。该框架全面公开了其在网络攻击、生化核(CBRN)风险、有害操纵和控制权丧失等领域的安全评估与缓解措施,旨在将其内部的准备工作框架与加州法案及欧盟人工智能法案对齐,通过规范化大模型报告强化风险治理透明度。

Google

技术迭代
Google Nano Banana系列模型正式GA,可通过Gemini API投入生产使用
Google宣布Nano Banana系列模型正式进入General Availability阶段,开发者可通过Gemini API在生产环境中直接调用,标志该系列端侧模型从预览阶段进入可商用状态。
技术迭代
谷歌展示 I/O 2026 尖端研究成果,推经验研究协助引擎与 Symptom AI 开启智能体新时代
在大模型由对话走向执行的智能体时代背景下,谷歌回顾了 I/O 2026 展示的系列前沿研究成果。核心动作包括推出可通过树搜索优化并自动迭代数千种代码变体的经验研究协助(ERA)引擎,以及用于推理症状对话数据的 Symptom AI 工具,通过融合计算与科学探索全方位协助攻克健康及学术难题。

Anthropic

商业动态
Anthropic发布Claude Opus 4.8并完成650亿美元H轮融资,估值达9650亿美元,年化收入突破470亿美元
Anthropic发布Claude Opus 4.8,具备更强判断力和诚实度(无依据断言概率降至前代1/4),新增动态工作流(支持数百subagent并行编排)和极速模式(速度提升2.5倍),API定价输入5美元/百万Token、输出25美元/百万Token;同期完成650亿美元H轮融资,估值从2月的3800亿增至9650亿美元(约2.5倍),年化收入已突破470亿美元。
技术迭代
Claude Code推出dynamic workflows研究预览,支持数百subagent并行编排,Bun项目11天完成75万行Rust迁移
Anthropic为Claude Code推出dynamic workflows功能,可动态编写编排脚本运行数百个并行subagent,实际案例中Bun运行时从Zig到Rust的重写项目完成75万行代码迁移,测试套件通过率99.8%,首次提交到合并仅11天;支持中断恢复、进度自动保存,适用于全代码库安全审计、大规模迁移和对抗式验证,在Max/Team/Enterprise计划中可用。
技术迭代
Anthropic 推出 Claude Code 动态工作流研究预览版,通过多智能体并行处理复杂工程任务
针对复杂工程任务自动化交付面临的长期运行挑战,Anthropic 推出 Claude Code“动态工作流”研究预览版。该功能基于用户提示词进行动态规划,将其拆解并分发给并行运行的子智能体处理,支持执行长达数天的复杂软件工程任务,虽显著增加词元消耗但支持中断进度恢复,大幅提升了研发的自动化效能。
商业动态
阿波罗与黑石联合筹备 360 亿美元债务融资,资助 Anthropic 采购谷歌定制 TPU 芯片
为满足大模型基础设施建设的巨额资金需求,资产管理巨头阿波罗与黑石联合筹备了一笔 360 亿美元的债务融资。该资金将通过特殊目的公司(SPV)大规模采购谷歌定制的 TPU 芯片,并以租赁形式提供给 Anthropic 部署。此项由博通提供信用担保的交易创下了私有信贷市场芯片融资金额纪录,可大幅扩张其算力版图。
商业动态
埃隆马斯克透露 SpaceX 与 Anthropic 仅签署了为期 180 天的 Colossus 算力租赁协议
针对大模型初创公司与云基础设施深度绑定的市场风向,埃隆·马斯克公开澄清了 SpaceX 与 Anthropic 的算力合作细节。核心动作是确认双方针对 Colossus 算力集群仅签署了为期 180 天(6个月)的短期租赁协议,尽管未来可能延期,但现阶段保留了高灵活性,反映出前沿 AI 创企在算力短缺下的弹性供应链策略。

Meta

技术迭代
Meta联合纽约大学发布ATLAS项目,消耗1830亿Token将26本数学教材形式化为63万行Lean代码
Meta发布ATLAS项目(Autoformalized Textbook Library At Scale),利用AI将26本本科及研究生数学教材自动翻译为630,999行Lean代码,覆盖46,203条数学声明中42,837条证明(通过率92.7%),教科书定理形式化覆盖率71.3%,采用AutoformBot三层架构流水线驱动,Claude Opus 4.6在同等算力下形式化完成率92%远超Gemini 3.1 Pro的46%。
技术迭代
扎克伯格旗下Biohub开源ESMFold2蛋白质世界模型,图谱含68亿蛋白质和11亿预测结构,五靶点命中率36%-88%
扎克伯格创立的Biohub发布全球首个开源蛋白质世界模型,基于ESM Atlas图谱(68亿蛋白质、11亿预测结构),核心模型ESMFold2采用类BERT的Transformer架构无需多序列比对,在EGFR、PD-L1等五个癌症和免疫学靶点实测蛋白命中率36%-88%,推理速度比AlphaFold2快10-100倍,性能超越AlphaFold3,向全球科学界免费开放。
技术迭代
Meta 正式发布 SAM 3.1 视频分割模型,引入对象复用技术在单张 H100 上实现每秒 32 帧处理
针对复杂拥挤场景下视频分割效率低、算力开销大的痛点,Meta 发布分割万物模型升级版 SAM 3.1。作为 SAM 3 的直接替代版本,该模型首次引入对象复用技术,支持在单次前向传播中同时追踪多达 16 个对象,将单张 H100 GPU 上的视频处理速度翻倍至每秒 32 帧,有效降低了高性能实时视频追踪的硬件门槛。
商业动态
Meta 承诺向监督委员会追加 1300 万美元资金支持直至 2028 年
面对全球对社交媒体平台内容审查与生成式 AI 内容合规性的严格监管,Meta 宣布向其独立的监督委员会(Oversight Board)追加 1300 万美元资金支持并将资助延长至 2028 年。此举旨在确保该外部机构拥有充足资源,独立裁决 Facebook、Instagram 等平台及全新付费订阅服务中的复杂言论纠纷,缓解公众信任危机。

字节跳动

商业动态
字节Seed AI4S团队或考虑分拆,多位核心成员出走创业AI制药方向
字节跳动Seed内部AI4S团队面临组织调整(拟从项亮体系转至杨震原下),多位核心成员离职创业:肖文之(2015年加入,聚焦计算生物学)创业AIDD方向已获头部机构多轮融资,顾全全(UCLA副教授、Seed大模型Pre-training Co-Lead)也计划出走;该团队此前产出Protenix(AlphaFold 3复现)和PXDesign(5/6靶点实现20%-73%纳摩尔级命中率),分拆动因在于AI4S反馈周期长、短期价值难以在字节体系内证明。

阿里巴巴

产品动态
蚂蚁阿福上线健康监测功能,支持远程追踪家人血压数据
蚂蚁集团旗下产品"阿福"发布健康监测应用场景,主打远程健康管理功能,用户可通过阿福记录并追踪家人的血压等健康数据,面向异地子女关照父母的需求场景,将AI助手从信息查询延伸至家庭健康管理。
技术迭代
阿里云百炼CLI开源,一行命令接入150余款模型和十余款应用,原生适配主流Agent框架
阿里云百炼CLI正式开源(GitHub: modelstudioai/cli),将API调用、鉴权、参数结构统一封装,支持150多款模型和十多款应用的一键接入,覆盖文本、图像、视频、语音等多模态调用及知识库检索、记忆库管理、联网搜索等能力,已适配Claude Code、Qwen Code、OpenClaw、Hermes Agent等主流Agent框架。
数据洞察
通义实验室发布 Qwen-Image-Bench,56个创作级考点覆盖17大场景定义文生图评测新标准
通义实验室推出文生图评测基准Qwen-Image-Bench,包含56个细粒度创作考点、5大核心能力支柱、17大创作场景和1000条中英双语分层Prompts,配套Q-Judger自动评估模型与人类艺术家评分的Spearman相关系数达0.92,评测结果显示当前模型在文字准确性、信息可视化、影像分镜等专业创作领域仍存在显著短板。
商业动态
同济医院与阿里云签署全面合作协议,以千问大模型驱动脑科学与消化系统肿瘤精准诊疗
华中科技大学同济医院与阿里云、武汉硚口区政府签署三方合作协议,依托阿里云全栈AI技术与千问大模型的多模态推理能力,在脑科学神经疾病和消化系统肿瘤两大方向联合攻关,阿里云为科研模型训练提供MaaS平台和算力底座,加速医疗影像、病理、基因等方向的智能诊疗应用落地。

腾讯

技术迭代
腾讯混元发布 Hy-Memory Agent记忆插件,LongMemEval评测85.2分,写入速度为Graphiti的8倍
腾讯混元发布Agent记忆插件Hy-Memory,采用"6层记忆框架×System1/System2双系统×演化链"三层架构,在LongMemEval评测中获85.2分,偏好维度领先同类框架21.11pp,记忆条数仅为mem0的1/3且单条信息密度为其3-4倍,写入速度是Graphiti的8倍,Token消耗降低35%,专为OpenClaw等长期协作型Agent设计。
产品动态
腾讯创意智能体Miora开测,支持一句话生成完整视觉方案,覆盖图像、视频、3D和UI设计
腾讯在香港Cloud Day发布创意设计AI工具Tencent Design Miora(妙境),由WorkBuddy团队打造,定位"会思考、有记忆"的AI创意伙伴,支持用户输入一句需求后自动生成完整品牌视觉方案,内置图像、视频、3D、UI/UX四大原生媒体处理引擎和记忆系统,支持统一画布多模态协作和Skills开放平台,国际版已开启邀测。

百度

技术迭代
LeMiCa框架入选NeurIPS 2025 Spotlight,支持ERNIE-Image文生图模型无损2倍加速至约7秒
联通数据科学与人工智能研究院提出的LeMiCa加速框架入选NeurIPS 2025 Spotlight,通过将加速问题转化为全局路径优化取代传统局部贪心缓存策略,在百度ERNIE-Image模型上实现约2倍无损加速(单张H100从约32秒缩短至约7秒),LPIPS低至0.028,最高可达4.57倍加速,无需修改模型或重新训练。

其余重点关注公司

行业洞察 DeepSeek
DeepSeek三模型在OpenRouter月调用合计超17万亿Tokens,Agent系统成为Token消耗主力
DeepSeek V4 Flash、V4 Pro、V3.2三个模型在OpenRouter平台月调用合计超17万亿Tokens(V4 Flash排名第1达9.13T),消耗主力已从传统聊天转向Agent系统(Hermes Agent月调用10.8T、OpenClaw 6.25T),文章同时介绍昇腾针对万亿MoE架构的MegaMoE融合算子(Prefill提升20%-30%)和KVCache池化方案(Agentic场景Prefill性能提升4倍以上)。

行业新闻

技术迭代 OpenClaw
OpenClaw更新v2026.5.27,发布包体积缩小59%至17.8MB,冷启动速度提升2.9倍
OpenClaw发布v2026.5.27版本,发布包从43.3MB缩至17.8MB(缩小59%),冷启动Agent turn从9.8秒降至3.4秒(快2.9倍),热启动从7.5秒降至3.0秒(快2.5倍),安装依赖数降42%至371个,通过将Bedrock、Slack等重插件移出核心包实现,峰值内存降7%至635MB。
产品动态 Microsoft
微软重构Microsoft 365 Copilot界面,加载速度提升超50%,PowerPoint中使用量增长43%
微软发布Microsoft 365 Copilot全新设计,应用加载速度提升超50%(超过2倍),复杂聊天响应时间改善10%(P95),采用渐进式披露设计原则,新增Work IQ智能层整合邮件、文件、会议上下文,上线后Word使用量增27%、Excel增33%、PowerPoint增43%、Outlook增30%,引入Designer、Researcher等专项Agent模式。
产品动态 Microsoft
微软响应美国 Take It Down 法案强化全球非自愿亲密图像举报与自动化检测机制
面对 AI 合成影像泛滥与美国《Take It Down 法案》生效的合规压力,微软宣布升级对抗非自愿亲密图像(NCII)的治理举措。核心动作包括在全线服务中上线更直观的全球举报表格、引入先进的已知违规影像自动化检测技术、并建立人审与申诉机制,旨在通过流程升级加速移除违规图像并强化数字生态合规问责。
产品动态 Amazon
亚马逊计划在 AWS Bedrock 平台引入 SpaceX 的 Grok 大模型以扩展其旗舰 AI 服务
为在云端 MaaS 托管市场吸引更多企业客户,亚马逊 AWS 计划将其旗舰级 AI 服务 Bedrock 接入由 SpaceX 拥有的 Grok 大模型。核心动作是将 Grok 纳入托管生态,为开发者和企业级用户拓展模型选择多样性并增强应用数据集成,此举将深化 AWS 在企业级大模型算力与服务基础设施领域的服务护城河。
产品动态 Canva
Canva 推出 2026 年 5 月产品功能更新,引入一键更换全页色彩与全新图表库以打通创意发布流
为弥合创意设计与多平台分享之间的分发鸿沟,Canva 推出 2026 年 5 月功能更新。核心动作包括引入更精准的 AI 工具、上线支持一键批量修改单页所有色彩或字体的层编辑功能、重构位置面板图层组,并推出高对比度、覆盖更多现代图表类型的全新图表库,通过强化工作流自动化加速向综合性生产力工具平台演进。
产品动态 Perplexity AI
Perplexity AI助手Computer上线Microsoft 365插件接入
Perplexity AI的Computer助手功能新增Microsoft 365集成插件,允许AI助手直接操作和访问Microsoft 365应用套件中的数据和功能,扩展其作为桌面AI助手的企业办公场景覆盖。
技术迭代 阶跃星辰
阶跃星辰发布并开源Step 3.7 Flash,196B参数MoE架构仅激活11B,生成速度达400 Tokens/s
阶跃星辰发布并开源生产级Agent模型Step 3.7 Flash,采用稀疏MoE架构(总参数196B+1.8B ViT,激活仅11B),最高生成速度400 Tokens/s,原生支持多模态理解与工具调用,兼容Claude Code、OpenClaw、Hermes Agent等主流Agent框架和MCP/Skills协议,Toolathlon评分49.5%,ClawEval-1.1评分67.1%,τ²-bench Telecom通过率超98%。
技术迭代 商汤
商汤开源SenseNova-U1-8B-MoT-Infographic模型,信息图生成IGenBench准确率从51.3%提升至69.5%
商汤开源SenseNova-U1-8B-MoT-Infographic模型,基于NEO-unify架构(无Visual Encoder和VAE),专注信息图生成,在BizGenEval(hard)从39.8提升至46.6,IGenBench Q-ACC从51.3%提升至69.5%,支持100+风格布局和密集文字渲染,H100上推理约9秒生成2048×2048图像,Apache 2.0协议开源。
技术迭代 Hermes Agent
Nous Research发布Hermes Agent v0.15.0版本
Nous Research发布Hermes Agent v0.15.0版本更新,作为当前OpenRouter平台调用量排名前列的Agent系统(月调用超10T tokens),持续迭代其Agent执行和工具调用能力。
产品动态 Antigravity
Antigravity CLI 1.0.3发布,支持配额耗尽后自动切换使用Google AI credits
Antigravity CLI发布1.0.3版本,新增配额耗尽后自动使用Google AI credits的fallback机制,确保用户在主额度用完后仍可继续使用服务不中断。

本周动态

产品动态 Perplexity 2026/5/29
Perplexity AI助手Computer上线Microsoft 365插件接入
Perplexity AI的Computer助手功能新增Microsoft 365集成插件,允许AI助手直接操作和访问Microsoft 365应用套件中的数据和功能,扩展其作为桌面AI助手的企业办公场景覆盖。
产品动态 腾讯 2026/5/28
QQ浏览器上线PC自研文件查看器和Markdown格式查看器,解决跨平台文件兼容性问题
QQ浏览器发布两项文件工具升级:PC自研文件查看器解决PPT视频黑块、Word公式乱码和大型Excel加载缓慢问题,实现Windows/Mac双端样式一致并支持原生AI功能;新增Markdown格式查看器支持本地MD文件即开即渲染、排版优化与分屏编辑双模式切换,无需联网即可处理敏感信息,完善AI交付物(如GitHub开源Skills)的承接能力。
产品动态 腾讯 2026/5/29
QQ浏览器全面接入元宝助手,底层模型升级至Hy3 preview,问答准确率从91%提升至94%
QQ浏览器将腾讯元宝助手深度嵌入侧边栏、搜索栏和地址栏,支持多网页/文件跨内容综合梳理,新增AI写作、AI生图、AI学习(拍题解析+电子错题本)三大功能模块,底层模型升级至Hy3 preview使问答准确率从91%提升至94%,搜索结果首条直接呈现结构化答案,Mac版已更新其他版本逐步放量。
产品动态 美团 2026/5/28
用户案例:零代码通过Tabbit智能代理9次对话完成完整HTML网页的生成和发布
一位完全不懂代码的用户通过Tabbit浏览器智能代理,仅用9个Query(自然语言提问)完成了从网页框架生成、图片提取替换、排版调整到最终发布的全流程,生成包含图片展示和折叠互动功能的完整HTML页面,验证了AI工具在零代码建站场景的可行性,但存在随机删减原文和排版不够智能等局限。
产品动态 美团 2026/5/27
Tabbit浏览器v0.33智能代理新增文件生成能力,支持在对话中直接输出PDF、Excel、PPT、Word和HTML
Tabbit浏览器发布v0.33版本,智能代理新增文件生成能力,支持对话中直接生成PDF、Excel、PPT、Word和可预览分享的HTML文件并一键保存本地,新增本地文件夹关联(作为对话上下文)、Mac菜单栏快捷对话入口、HTML/SVG内容直接渲染,优化飞书和腾讯文档等云文档网站的侧边栏对话体验。
产品动态 美团 2026/5/23
Tabbit浏览器v0.32上线多模型回复对比模式,支持一次提问多模型并行回答和分叉追问
Tabbit浏览器发布v0.32版本,核心功能为多选模型对比模式,支持用户一次提问让多个AI模型同时回答并对比结果,可重新生成单个模型的回答、选择某个回答作为追问上下文或分叉到新对话,同步优化妙招广场UI(卡片/列表双布局)、垂直标签栏状态记忆和首页输入性能。
技术迭代 Dia 2026/5/26
Dia 正式发布 1.32.0 版本,上线 Tab Search 与 Tidy Tabs 功能并重构底层标签追踪架构
针对多标签浏览导致的管理混乱与系统卡顿痛点,Dia 发布 1.32.0 版本。该版本上线了支持全局检索打开与关闭标签的 Tab Search 功能,引入了允许用户自定义 12 小时至 7 天周期并自动归档闲置标签的 Tidy Tabs 机制,同时重构了标签追踪架构,将清理工作完全移至系统后台运行。此举消除了界面偶发性卡顿,显著提升了用户在多任务并行场景下的信息流转与检索效率。
行业洞察 美团 2026/5/24
Tabbit「洞见」连载第二篇:多数人的知识管理是焦虑缓解仪式而非真正学习
耿达维在Tabbit「Tinsight·洞见」栏目发表系列第二篇,论证大多数人的信息消费本质是"焦虑管理"而非学习(学习需遇问题→形成判断→找信息→校准→内化),指出AI时代"为检索而整理"的知识管理80%已失去意义,整理笔记是伪装最强的焦虑管理方式,唯有维护"学科前沿delta"或"个人独特认知delta"才具实际价值。
行业洞察 美团 2026/5/29
Tabbit「洞见」连载第三篇:AI时代真正重要的能力是认知去耦,即从具体情境中抽象可操作结构
耿达维在Tabbit「Tinsight·洞见」栏目发表系列第三篇,统一分析"通才论""品味论""认知折叠论"三条流行能力叙事后指出,三者共同指向同一底层机制——认知去耦(cognitive decoupling),即把表征从现实中剥离并当作独立对象操作的能力;AI时代人真正剩下的是指挥模型的那一层:提出正确问题、判断输出、纠正偏差和做价值决定。

本周动态

产品动态 腾讯 2026/5/28
搜狗输入法上线跨设备剪贴板同步功能,支持Windows、macOS、iOS、Android四端文字和图片互传
搜狗输入法正式上线跨设备复制粘贴功能,同一账号登录后自动识别设备并同步剪贴板内容,支持文字、图片和链接在Windows、macOS、iOS、Android四端互传,复制内容可直接调用输入法AI能力(润色、翻译、生图等),鸿蒙端正在开发中,用户可自主关闭任一设备的同步功能保护隐私。
产品动态 KK键盘 2026/5/28
KK键盘因语音变声BUG意外登顶App Store免费总榜第一,超越豆包和抖音商城
北京艾享科技开发的KK键盘(9人团队,创始人陈力为前搜狗输入法创始成员)因语音变声功能触发后无法恢复的BUG,导致用户在微信、游戏、抖音等场景中语音消息被强制以变声唱歌形式呈现,大量用户吐槽传播引发围观下载潮,5月27日登顶苹果App Store免费总榜第一超越豆包,但该热度本质为情绪化传播事件,可持续性存疑。