全球 AI 核心动态内参

每日综述
历史检索
监测周期:加载中...

今日重点

产品动态 Google
Google 计划在 Gemini 及 AI Studio 推出“Skills”功能,构建自动化 Agent 框架
Google 准备在消费版 Gemini、企业版及 AI Studio 中全面上线“技能(Skills)”功能,支持用户创建可复用的指令集。Gemini 侧边栏新增的“Agent”标签包含技能与计划任务(Schedules)子项,允许用户设置自动重复的 AI 工作流。此举旨在统一 Google AI 平台的定制化层级,并通过 AI Studio 桌面版潜在的同步支持,缩小与 Anthropic、OpenAI 在开发者工作流标准化方面的差距,预计将于 Google I/O 2026 大会正式亮相。
产品动态 Anthropic
Anthropic 研发 Claude Code 桌面版重大更新 Epitaxy,引入协调员模式对抗 OpenAI
Anthropic 正在代号为“Epitaxy”的项目下重构 Claude Code 桌面体验。新版本引入专用面板支持查看计划、任务追踪及 Diff 审查,并实现多仓库同时协作。核心更新“协调员模式(Coordinator Mode)”允许 Claude 作为编排者将任务分发给并行子代理执行。此外,该更新支持在应用内直接预览运行代码及创建自定义 Agent,标志着 Anthropic 将 Agent 竞争重点从模型指标转向本地化开发者工作流集成。
产品动态 Hermes
Hermes Agent 原生支持微信连接,优化中国区用户 Agent 交互体验
Nous Research 宣布 Hermes Agent 完成对个人微信的深度适配。开发者通过 update 指令即可激活微信端交互权限,支持利用微信作为 Agent 调度的统一入口,极大提升了 AI 智能体在中文社交场景下的可用性。
技术迭代 OpenClaw
OpenClaw “龙虾”五天五更:重构主动记忆系统,接入 Seedance 2.0 并开启 ChatGPT 导入
开源个人 AI 助手 OpenClaw 迎来高频更新(v2026.4.7-4.11)。核心功能 Active Memory(活跃记忆) 插件上线,通过子代理实现对话上下文的自动召回,无需用户手动指令。新版本正式支持 Seedance 2.0 视频生成模型,并实现了 ChatGPT 对话记录一键导入至龙虾记忆体系(Memory Palace)。此外,针对 macOS 实验性接入 MLX 本地语音推理,并实施了包括主机环境净化、浏览器沙箱隔离在内的数十项安全加固,标志着龙虾已从单一工具向高度安全、自我进化的系统级助手演进。

OpenAI

技术迭代
OpenAI 研发统一 Codex 超级应用,引入 Scratchpad 并行任务与托管智能体功能
OpenAI 正在整合 ChatGPT、Atlas 浏览器及编程工具,打造基于 Codex 的统一桌面超级应用。新特性 Scratchpad 允许用户通过 TODO 列表形式并行触发多个任务。代码库中发现的“心跳系统(heartbeat)”表明该应用将支持托管智能体(Managed Agents),实现无需用户干预的长程工作流自动执行。此外,员工密集发布的“雪花”表情暗示代号为 Glacier 的新模型(疑似 GPT-5.5)或将随此平台同步发布,旨在全方位回击 Anthropic 的桌面 Agent 布局。
产品动态
OpenAI 拟推受限网络安全产品,AI 攻防能力跨越“武器化”临界点
继 Anthropic 限制 Mythos 模型访问后,Axios 爆料 OpenAI 正计划为少数合作伙伴内测一款具备极强网络安全能力的产品。与通用旗舰模型 Spud 不同,该产品专注于漏洞自动挖掘、PoC(利用证明)生成及利用链构建。OpenAI 此举被视为对 AI 能力“外溢”的预防性治理,反映出顶尖实验室已意识到 AI 能跨越代码审计与实际攻击之间的门槛。行业专家指出,AI 正在重塑“责任披露”逻辑,网络安全竞争已演变为模型厂商间关于“防御优先权”的白名单分层博弈。
产品动态
OpenAI 修正订阅额度表述,Pro 用户将获得最高 20 倍于 Plus 的配额
OpenAI 官方确认,在 5 月 31 日前的促销期内,100 美元和 200 美元的 Pro 订阅实际分别拥有 10 倍和 20 倍于 Plus 订阅的额度。此举通过配额优势强化高客单价订阅的吸引力,旨在筛选并留存高价值开发者。
商业动态
HumanX 大会调研显示 Claude 开发者口碑反超 ChatGPT,OpenAI 陷入信任与焦点危机
在旧金山举办的 HumanX AI 大会上,Claude 成为技术社区讨论的焦点,多数供应商与团队反馈其编码能力已超越 ChatGPT。尽管 OpenAI 刚完成 1220 亿美元融资并准备 IPO,但受视频生成模型 Sora 搁置、广告注入争议及 CEO 个人信誉质疑影响,市场感知其正逐渐失去行业统治地位。目前 Anthropic 在 B 端用户增长上已紧追 OpenAI,促使后者紧急推出 100 美元/月的高级订阅计划以稳固其在 Agent 编码市场的份额。
商业动态
OpenAI 老股遭遇“零接盘”窘境,估值倒挂与 Anthropic 崛起引发洗牌
2026 年 4 月,二级市场平台 Next Round Capital 披露 6 亿美元 OpenAI 老股无机构认购,交易估值较融资额缩水 10%,而竞争对手 Anthropic 溢价超 50%。尽管 OpenAI 刚以 8520 亿美元估值创纪录融资,但因 Anthropic B 端 ARR 突破 300 亿美元反超、代码生成市场份额占优及训练成本仅为其四分之一,投资者信心发生显著偏移。受制于 C 端免费用户负担、Sora 关停及人才流失,OpenAI 正面临从“统治者”转为“分庭抗礼者”的地位重构,全球大模型第一梯队进入新一轮洗牌期。
商业动态
OpenAI 响应 Axios 开发工具劫持事件,紧急强制更新 macOS 全系应用证书
OpenAI 确认受 3 月底第三方库 Axios 供应链攻击影响,其 macOS 应用签名流程中的 GitHub Actions 工作流可能暴露了签名证书。尽管尚未发现数据泄露或代码篡改证据,但 OpenAI 已决定撤销并旋转相关证书。官方要求所有使用 ChatGPT Desktop、Codex 及 Atlas 浏览器的 macOS 用户在 5 月 8 日前更新至最新版本,届时旧版软件将因证书失效而无法运行。此次事件暴露了其工作流中“浮动标签”配置的安全隐患,目前已通过第三方机构完成合规审计。
商业动态
OpenAI CEO 住所遭到不速之客闯入,嫌疑人已被警方逮捕
萨姆·奥特曼发文回应其住所遭袭事件。此突发事件凸显了 AI 领袖人物日益增长的安全风险,反映了生成式 AI 带来的巨大社会争议正向现实个人层面传导。
商业动态
OpenAI Stargate 核心高管跳槽 Meta,负责组建全新 AI 算力部门
OpenAI 负责万亿级数据中心项目 Stargate 的两名执行官正式加入 Meta 旗下的新算力部门。此人才流动旨在强化 Meta 在大规模基础设施建设上的战略能力,直接对标 OpenAI 的算力护城河,预示着巨头间基础设施竞争加剧。

Google

产品动态
Google 计划在 Gemini 及 AI Studio 推出“Skills”功能,构建自动化 Agent 框架
Google 准备在消费版 Gemini、企业版及 AI Studio 中全面上线“技能(Skills)”功能,支持用户创建可复用的指令集。Gemini 侧边栏新增的“Agent”标签包含技能与计划任务(Schedules)子项,允许用户设置自动重复的 AI 工作流。此举旨在统一 Google AI 平台的定制化层级,并通过 AI Studio 桌面版潜在的同步支持,缩小与 Anthropic、OpenAI 在开发者工作流标准化方面的差距,预计将于 Google I/O 2026 大会正式亮相。
技术迭代
Google 为 Mixboard 开发语音模式及协作工具,强化 AI 创意音频协作
Google Research 正在为音频创作平台 Mixboard 引入实时语音交互与多人协作功能。通过 AI 模型对语音语义的精准捕捉,用户可实现自然语言驱动的乐曲编排,提升了 AI 音频工具的社交属性与交互效率。
产品动态
Google 扩展 AI Mode 餐厅预订功能,覆盖中国香港等全球多个市场
Google 宣布将其 AI 驱动的语音预订系统落地澳大利亚、加拿大及中国香港。用户通过自然语言即可描述订位偏好,系统通过集成 OpenTable 等第三方平台自动匹配链接,完成了从搜索意图到线下服务的消费闭环。

Anthropic

产品动态
Anthropic 研发 Claude Code 桌面版重大更新 Epitaxy,引入协调员模式对抗 OpenAI
Anthropic 正在代号为“Epitaxy”的项目下重构 Claude Code 桌面体验。新版本引入专用面板支持查看计划、任务追踪及 Diff 审查,并实现多仓库同时协作。核心更新“协调员模式(Coordinator Mode)”允许 Claude 作为编排者将任务分发给并行子代理执行。此外,该更新支持在应用内直接预览运行代码及创建自定义 Agent,标志着 Anthropic 将 Agent 竞争重点从模型指标转向本地化开发者工作流集成。
产品动态
Claude Code 推出 Ultraplan 云端规划功能,实现 CLI 与 Web 端的跨端任务协同
nthropic 发布 Ultraplan 研究预览版,支持将本地 CLI 的复杂规划任务迁移至云端 Web 界面执行。该功能允许 Claude 在后台进行代码库调研与计划草拟,用户可通过浏览器进行分段点评、修改并选择执行路径:既可在云端环境完成编码并直接提交 GitHub PR,亦可将方案“传送”回本地终端执行。Ultraplan 仅支持 Anthropic 云基础设施,旨在通过解耦“规划”与“执行”环节,为开发者提供更丰富的交互界面与并行工作流。
产品动态
Anthropic 发布 Claude for Word 插件,支持文档内文本重写与跨应用上下文同步
Anthropic 推出 Microsoft Word 原生插件 Claude for Word,允许用户在文档内直接选择文本并调用 AI 进行风格重写、语气调整或被动语态优化,所有修改以修订模式呈现。该产品支持将合同审查、研究简报等特定工作流保存为“技能(Skills)”,供团队成员复用以确保输出质量一致。此外,Claude 可在 Word、PowerPoint 和 Excel 插件间共享会话上下文,实现了跨 Office 套件的连续协作体验。
数据洞察
Claude Mythos 被质疑采用字节跳动 LoopLM 循环架构,图搜索性能提升近 4 倍
社区热议 Anthropic 最强模型 Mythos 或采用字节跳动 Seed 团队提出的 LoopLM 循环语言模型架构。关键证据显示,Mythos 在广度优先图搜索测试 GraphWalks BFS 中以 80% 的高分碾压 GPT-5.4(21.4%),且在 Token 消耗仅为前代 1/5 的情况下推理速度反而更慢,符合循环架构在潜空间迭代而非 Token 层生成的特征。该技术通过在模型内部“反复计算”提升知识操作与多跳推理能力,使其在网络安全漏洞发现等图遍历强项任务上创造了非线性的性能尖峰。
商业动态
英国监管机构评估 Anthropic 核心模型风险,FT 称主要针对金融稳定性
英国金融监管机构正加急评估 Anthropic 最新模型的潜在风险。评估核心聚焦于 AI 模型在处理金融逻辑时可能引发的系统性缺陷,FT 报道指出该行动反映了监管层对生成式 AI 深度介入核心经济命脉的行政警惕。
商业动态
Anthropic 与 CoreWeave 达成租赁协议,引入超大规模算力支持 Claude 运行
Anthropic 签署协议租用 CoreWeave 的 AI 计算容量。此项合作旨在保障 Claude 系列模型在用户爆发式增长下的推理稳定性,通过接入专业算力云平台,实现模型迭代与服务扩展的快速弹性部署。
商业动态
Anthropic 误封 OpenClaw 创始人账号,两小时后解封并澄清并非针对特定工具
OpenClaw 创始人 Peter Steinberger 的个人及 API 账号因“可疑活动”被 Anthropic 安全团队短暂封禁。Peter 表示此前已按新规转为付费 API 模式进行端到端兼容性测试,质疑封禁影响了开源软件的“生命线”。Anthropic 工程师随后介入澄清,称封禁系因滥用检测分类器过于敏感导致的“误判”,并非针对 OpenClaw 使用者。此次事件加深了开源社区对模型厂商掌握生态话语权的忧虑,尤其在 Peter 已入职 OpenAI 担任产品战略顾问的背景下,双方关系更显微妙。
商业动态
美国监管机构推动 Anthropic 新模型部署,涉及政府基础设施升级
消息指美国相关行政部门正积极推动 Anthropic 核心模型在政府内网的部署。此举旨在利用高级 AI 优化政务流程及数据分析,亦被视为通过政府订单强化本土头部 AI 企业竞争力的战略动作。
商业动态
Claude Mythos 网络安全能力遭质疑,开源小模型被指具备同等 0day 挖掘水平
AISLE 实验研究显示,Anthropic 高调宣传的 Claude Mythos 网络安全突破存在夸大嫌疑。测试发现,仅 36 亿激活参数的开源模型 GPT-OSS-20b 即可识别其发现的 FreeBSD 零日漏洞,51 亿参数模型亦能复现 27 年前的 OpenBSD 漏洞逻辑。顶级黑客 George Hotz 与投资人质疑 Anthropic 利用“勒索研究”进行恐吓营销,其实际进步仅为线性改进。同时,数据审计发现 Mythos 发现的数千漏洞多存在于不再维护的旧软件,且严重依赖 198 次人工复核,并非完全自主。
商业动态
Claude Mythos 满分通过 Cybench 测试引发金融海啸,Cloudflare 市值蒸发数十亿美元
Anthropic 发布 Claude Mythos Preview,凭借在 Cybench 网络安全基准测试中的 100% 满分表现及独立发现“沙箱逃逸”零日漏洞的能力,引发华尔街对 SaaS 安全模式的恐慌。Cloudflare 股价四日累计跌幅达 22%,ServiceNow 等安全相关企业亦受重创。Anthropic 同步启动“玻璃翼计划(Project Glasswing)”,发布 AI 加速攻防生存指南,强制建议企业转向 Rust/Go 语言并采用硬件 FIDO2 密钥。尽管顶级黑客 George Hotz 质疑其夸大 AI 智慧,但市场已开始重估 AI 调度权在网络安全价值链中的地位。0
商业动态
HumanX 大会调研显示 Claude 开发者口碑反超 ChatGPT,OpenAI 陷入信任与焦点危机
在旧金山举办的 HumanX AI 大会上,Claude 成为技术社区讨论的焦点,多数供应商与团队反馈其编码能力已超越 ChatGPT。尽管 OpenAI 刚完成 1220 亿美元融资并准备 IPO,但受视频生成模型 Sora 搁置、广告注入争议及 CEO 个人信誉质疑影响,市场感知其正逐渐失去行业统治地位。目前 Anthropic 在 B 端用户增长上已紧追 OpenAI,促使后者紧急推出 100 美元/月的高级订阅计划以稳固其在 Agent 编码市场的份额。

Meta

商业动态
吴翼加盟 Meta 超级智能实验室,清华叉院官网已撤销其教职信息
清华大学交叉信息研究院官网已撤下吴翼的教职信息,确认其已加盟 Meta AI 团队。此顶级人才跨界流动反映了在 AGI 研发进入深水区后,全球科技巨头对学术顶尖人才的虹吸效应持续增强。
商业动态
OpenAI Stargate 核心高管跳槽 Meta,负责组建全新 AI 算力部门
OpenAI 负责万亿级数据中心项目 Stargate 的两名执行官正式加入 Meta 旗下的新算力部门。此人才流动旨在强化 Meta 在大规模基础设施建设上的战略能力,直接对标 OpenAI 的算力护城河,预示着巨头间基础设施竞争加剧。

字节跳动

商业动态
字节跳动接洽荣耀商讨“豆包手机”合作,细节尚未达成最终一致
据澎湃新闻报道,荣耀正与字节跳动就“豆包手机”的相关合作进行接洽。知情人士透露,目前双方在合作细节上尚未达成一致。此次接洽被视为字节跳动试图将其领先的“豆包”AI 生态下沉至硬件底层的关键尝试。若合作达成,荣耀手机或将在系统级架构中深度集成豆包视觉智能体、长程记忆及实时交互能力。目前,双方在数据主权、系统分层权限及商业收益分配上的博弈仍是核心焦点。
商业动态
中远海运特运携手火山引擎打造“数字员工派遣站”,航运测算效率提升 20 倍
航运巨头中远海运正式引入火山引擎的 AI Agent 方案。通过数字员工处理海量物流单据、航线调度及风险预警,此跨界合作标志着大模型能力正深入渗透全球物流与港口运营核心链路。
商业动态
115 篇 ICLR 2026 论文霸榜:字节跳动重仓“基座+多模态”,Oral 占比超大盘两倍
字节跳动在 ICLR 2026 录用名单中以 115 篇论文实现规模与质量双爆发。其研究火力高度聚焦,84.3% 的论文集中于基座大模型与多模态感知。值得关注的是,字节在这些核心方向的投入强度约为大会平均水平的 1.5-1.8 倍,显示出极强的“超配”战略。此外,字节通过 90.4% 的全球外部协作率,构建了深度链接顶级高校的科研联盟。其代表作如 OmniVerifier(视觉验证器)与 Deep Anything 3(统一视觉建模)标志着字节正从单点突破转向全栈 AI 平台化布局。

阿里巴巴

产品动态
阿里云百炼 Coding Plan Lite 停止续费,产品策略向高级套餐集中
阿里云发布通知,百炼大模型平台将于 4 月 13 日停止基础 Coding Plan Lite 套餐的升级与续费。此动作反映了云服务商正通过收缩长尾低价套餐,引导用户向更高价值及更深度集成的服务迁移,优化盈利结构。
产品动态
Qwen Code 支持社交平台远程控流,实现 AI 代码执行的移动化管控
阿里 Qwen 代码模型新增社交软件联动功能。开发者可通过手机端的钉钉或微信发送指令,远程驱动云端 AI 运行循环测试及执行规划。该更新拓宽了开发者实时监控与调度 AI Agent 的时空边界。

腾讯

技术迭代
微信支付发布 AI 专属开发 Skill,实现支付接入全流程智能辅助
微信支付于 2026 年 4 月 9 日更新并推出“基础支付接入 Skill”。该工具专为 AI IDE(如 Cursor)设计,支持通过自然语言对话完成支付选型、业务知识查询、接入质量评估及接口排障。核心亮点在于其提供的示例代码均经过人工验证而非 AI 实时生成,确保了支付逻辑的安全性。目前该 Skill 已支持 Java 和 Go 语言,并集成了 Request-Id 自动排障功能,显著提升了开发者从下单到回调处理的接入效率。
技术迭代
腾讯 FlexKV 获 NVIDIA 及 vLLM 官方支持,四级缓存方案将可用 KV Cache 扩展百倍
腾讯云研发的 FlexKV 推理优化技术正式合入全球三大主流推理技术栈。该技术针对大模型推理中极度消耗显存的 KV Cache 难题,构建了 GPU-CPU-SSD-远程存储的四级卸载体系,将缓存容量扩展至显存的 100 倍以上。同时,FlexKV 通过分布式 RadixTree 实现了跨节点缓存共享,避免了异地调度的重复计算。实测显示,该方案能显著降低首 Token 延迟并提升集群吞吐量,目前已实现即插即用,无需补丁即可在主流框架中启用。

百度

数据洞察
百度“伐谋”Agent 2.0 登顶 MLE-Bench,机器学习工程能力刷新全球最优成绩
百度智能云自主优化智能体“伐谋”Agent 2.0 在由 OpenAI 主导的 MLE-Bench 评测中夺冠,在 75 个 Kaggle 真实工程难题中表现优于搭载 Claude Opus 4.6 的智能体。该版本引入了增强演化策略、长程记忆机制,并依托全栈 AI 云基础设施大幅提升了算法迭代效率。目前,伐谋已在汽车制造(风阻验证提速)、金融风控及交通优化等领域落地,服务数千家企业。百度宣布该模型将于 5 月 13 日-14 日的 Create 2026 百度 AI 开发者大会上正式发布。

其余重点关注公司

商业动态 Kimi
Kimi 创始人杨植麟参加总理座谈会,助力“人工智能+”与产业双向赋能
4月10日,国务院总理李强主持召开经济形势专家和企业家座谈会。月之暗面(Moonshot AI)创始人杨植麟作为企业家代表发言。会议强调要深化拓展“人工智能+”,加快制造业数智化转型,通过先进制造业与现代服务业的深度融合支撑产业体系跃升。杨植麟的参会体现了国家对大模型领军企业在引领创新发展、培育新动能方面的高度重视,旨在通过 AI 技术助力经济高质量发展。
技术迭代 MiniMax
MiniMax M2.7 正式开源,携手华为昇腾、NVIDIA、Ollama 等全球伙伴构建 AI 生态
MiniMax 宣布正式开源 M2.7 模型。该模型是首个由 AI 深度参与自我进化的模型,具备自主构建 Agent Harness、多智能体协作(Agent Teams)及 Tool Search 等复杂生产力能力,在 Hermes Agent 和 OpenClaw 社区口碑领先。开源首日,M2.7 已完成与华为昇腾(CANN)、摩尔线程、NVIDIA TensorRT-LLM 及 Ollama、Together AI 等海内外软硬件平台的深度适配,实现“发布即就绪”的算力体验。此举被视为对近期大模型闭源趋势的有力回击,旨在加速全球 AI 智能体生态的繁荣。
技术迭代 MiniMax
MiniMax M2.7 深度适配 Hermes Agent,共建持续学习与自我进化的智能体生态
拥有 6w+ Star 的开源项目 Hermes Agent 宣布 MiniMax M2 系列已成为其使用量最高的模型之一。M2.7 凭借极高的工具调用准确度、复杂指令遵循能力及超高性价比,完美支撑了 Hermes Agent 的“学习闭环”——即自动提炼 Skill、跨会话记忆与子代理并行运行。目前,全球开发者已利用该组合实现自动化交易、长篇小说创作及模型自训练等复杂场景。MiniMax 强调,M2.7 的设计初衷即为让复杂智能体在无价格负担的情况下 24 小时稳定运行。
产品动态 智谱
智谱 AI 为 GLM Coding Plan 开启限时退款,致歉称服务体验待优化
智谱官方发文承认由于近期服务响应及体验问题,为国内版 GLM 编码套餐开启七天无理由退款。此举是国产大模型厂商在激烈竞争中维持商业信誉与用户口碑的重要补救措施。
数据洞察 智谱
GLM-5.1 登顶 LMArena 开源代码榜,实现 8 小时级长程任务突破
智谱 AI 发布 GLM-5.1,在全球权威盲测平台 LMArena 的 Code Arena 专项榜中位列开源模型第一、全球第三。该模型在长程任务(Long-Horizon Task)上表现惊人,能够 8 小时从零构建 Linux 桌面,并完成 655 次迭代优化向量数据库。在 METR 评估标准下,GLM-5.1 成为全球唯二(另一款为 Claude Opus 4.6)具备 8 小时级持续工作能力的模型,标志着国产开源模型在复杂工程自动化领域达到世界顶尖水平。
产品动态 xAI
xAI 为 Grok Build 启动积分计费测试,引入“模型竞技场”实现多智能体并行编程
xAI 正在内测名为 Grok Build 的编程环境及其配套的积分(Credits)计费系统。该工具支持通过 Grok CLI 本地运行或 Web 端远程操作,并创新性地推出了“模型竞技场(Model Arena)”模式,允许用户让多个 Agent 并行处理同一任务并择优使用。此计费模式采用了与 Claude Code 及 OpenAI Codex 类似的“月度配额+按需购买”混合结构,旨在为开发者提供标准化的智能体编程基础设施。埃隆·马斯克此前透露,xAI 目标在 6 月前实现对 Claude Opus 4.6 的性能超越。
产品动态 xAI
马斯克版“微信” XChat 上架 App Store,主打加密通讯与 Grok 智能交互
马斯克旗下的 XChat 预计于 4 月 17 日在苹果 App Store 开放下载。该应用支持端到端加密、阅后即焚、禁止截屏及大型群聊,并承诺无广告、不追踪用户。作为马斯克打造“万能应用”的核心步骤,XChat 将深度集成 xAI 的 Grok 模型。然而,其安全性受到质疑:XChat 仍保留加密密钥,且与 Grok 的交互可能导致隐私数据“脱密”。目前该应用首发 iOS 平台,被视为精准收割美国核心市场的策略,安卓版上线时间暂不明确。
商业动态 xAI
xAI 起诉科罗拉多州政府,针对州内新颁布的 AI 反歧视法律提起诉讼
埃隆·马斯克旗下的 xAI 正式提告科罗拉多州。核心争端点在于该州新颁布的 AI 监管法律,xAI 认为该法律对算法公平性的强制干预侵犯了企业技术自主权。此案或成为全球 AI 伦理立法与技术创新边界争夺的风向标。
商业动态 DeepSeek
DeepSeek 在内蒙古大规模招聘数据中心工程师,加速北方算力基座布局
DeepSeek 发布招聘公告,寻求内蒙古地区的数据中心基础设施及运维工程师。此举标志着该团队正利用北方低成本电力优势,扩建超大规模算力集群,为其大模型训练及推理提供底层硬件保障。

行业新闻

技术迭代 OpenClaw
OpenClaw “龙虾”五天五更:重构主动记忆系统,接入 Seedance 2.0 并开启 ChatGPT 导入
开源个人 AI 助手 OpenClaw 迎来高频更新(v2026.4.7-4.11)。核心功能 Active Memory(活跃记忆) 插件上线,通过子代理实现对话上下文的自动召回,无需用户手动指令。新版本正式支持 Seedance 2.0 视频生成模型,并实现了 ChatGPT 对话记录一键导入至龙虾记忆体系(Memory Palace)。此外,针对 macOS 实验性接入 MLX 本地语音推理,并实施了包括主机环境净化、浏览器沙箱隔离在内的数十项安全加固,标志着龙虾已从单一工具向高度安全、自我进化的系统级助手演进。
商业动态 英伟达
吕门特姆获英伟达支持,AI 订单需求确定性已排期至 2028 年
受 AI 算力基建驱动,光通信组件商 Lumentum 表示其 AI 相关订单量激增。在英伟达技术背书下,其光模块及激光器组件的供应计划已覆盖至 2028 年,反映了全球大模型硬件基座建设的长期高景气度。
数据洞察 宇树
宇树 H1 奔跑速度达 10m/s 再破世界纪录,逼近人类顶级运动员水平
宇树科技最新发布的视频显示,其 H1 全尺寸通用人形机器人实现了 10m/s 的奔跑速度,正式刷新人形机器人世界纪录。H1 机器人体重约 62kg,腿长 0.8 米,此次突破意味着其运动能力已接近博尔特 12.42m/s 的峰值速度。该记录的达成不仅展示了国产机器人高功率密度驱动器与复杂运动控制算法的领先地位,也预示着人形机器人在快速响应与复杂机动任务中的应用潜力。
产品动态 Hermes
Hermes Agent 原生支持微信连接,优化中国区用户 Agent 交互体验
Nous Research 宣布 Hermes Agent 完成对个人微信的深度适配。开发者通过 update 指令即可激活微信端交互权限,支持利用微信作为 Agent 调度的统一入口,极大提升了 AI 智能体在中文社交场景下的可用性。
技术迭代 京东
京东开源 240 亿参数 JoyAI-Image-Edit,首创“空间智能”实现跨视角图像编辑
京东探索研究院正式开源 JoyAI-Image-Edit 图像模型,采用 80 亿 MLLM 与 160 亿 MMDiT 耦合架构。该模型突破了传统 AI 在透视与遮挡关系上的局限,支持相机旋转/缩放控制、物体三维旋转及空间位移操作,且在保持场景几何一致性上超越了 Nano Banana Pro。JoyAI-Image 已全面兼容 ComfyUI 与 Diffusers,旨在深度赋能电商商品多维展示与具身智能机器人数据仿真,目前已通过 Apache 2.0 协议彻底开放。
技术迭代 其他
GEMS 框架赋能多模态生成:让 6B 小模型在生成任务中超越 Nano Banana 2
上海人工智能实验室联合多家高校提出 GEMS 框架,通过引入 Agent 的“长记性”与“学技能”机制优化生图流程。该框架包含三大特性:Agent Loop(闭环优化)、Agent Memory(分层压缩经验)和 Agent Skill(专家知识库)。实验显示,基于 Z-Image-Turbo (6B) 的 GEMS 在主流任务中平均提升 14.22 分,成功在复杂指令遵循和艺术感生成上实现对 Nano Banana 2 的反超。
数据洞察 其他
首个“参考生视频”榜单发布:Vidu Q3 强势夺冠,国内模型实现断层领先
2026年4月,SuperCLUE-R2V 首期榜单揭晓。生数科技的 Vidu Q3 以 70.89 分登顶多图参考总榜,并以 72.43 分领跑单图人物还原榜。测评显示,国内模型在“主体一致性”等核心技术上已趋于成熟,Vidu 系列斩获满分。相比之下,Google 的 Veo 与 OpenAI 的 Sora 2 在人物还原与应用适配上均处于中下游。报告指出,尽管国内模型在商业广告、影视创作等场景已具实际生产力,但“画面流畅度”仍是全行业面临的共同技术瓶颈。
数据洞察 其他
字节/OPPO 背景产品人曾熙创办 Chance AI,Visual Agent 登顶多图参考基准第一
成立于 2025 年的 AI 创业公司 Chance AI 推出以摄像头为核心入口的 Visual Agent(视觉智能体)。创始人曾熙(曾任职于字节跳动 Flow 部门及 OPPO/一加)将“软硬一体”写入底层逻辑,主张 AI 交互应从“看见”而非“提问”开始。其模型在多模态权威基准 MMMU-Pro 中以 86.07 分位居全球第一。目前产品已上线“Live 模式”实时视觉交互系统,在艺术展导览、潮流文化识别等领域积累了超 20 万自然增长用户,并计划于 2026 年深耕北美学生市场。