
AI 早报 2026-03-25
概览
要闻
模型发布
- 阿里通义实验室发布 PrismAudio,论文入选 ICLR 2026 ↗
#3 - Ai2 发布 MolmoWeb 开源视觉模型含数据集 ↗
#4 - 英伟达开源 Kimodo 动作生成工具适配类人机器人 ↗
#5
开发生态
产品应用
技术与洞察
- Anthropic 发文介绍 Harness 方案,优化 Claude 长流程开发能力 ↗
#10
行业动态
- 国家数据局明确词元命名,日均调用量两年增长超千倍 ↗
#11 - OpenAI 基金会启动运作,计划一年投资十亿美元推进 AGI ↗
#12 - OpenAI 调整 ChatGPT 电商战略,弱化结账功能转向产品发现 ↗
#13 - Arm 推出首款自研数据中心芯片 AGI CPU ↗
#14 - Agile Robots 与 Google DeepMind 达成战略合作 ↗
#15 - Dreamer 团队加入 Meta,技术授权专注 AI Agent 开发 ↗
#16
OpenAI 官方宣布关闭 Sora 应用 #1
OpenAI 宣布将关停其 Sora 应用及相关 API 服务,并会尽快公布具体的关闭时间表及用户作品保存方案。
OpenAI 官方宣布将关闭其旗下的 Sora 社交应用程序。
Sora 官方团队表示,尽管用户创作的内容很有价值,但仍决定停止服务。
后续将公布关于应用程序、API 的时间表及用户作品保存的具体细节。

相关链接:
LiteLLM 遭遇供应链攻击 两版本含窃凭证恶意代码 #2
开源 AI 网关项目 LiteLLM 遭遇供应链攻击,其 PyPI 平台上的
1.82.7和1.82.8版本被植入恶意代码。该恶意代码能够自动窃取 SSH 密钥、云服务及环境变量中的敏感信息。
此次攻击波及 DSPy、CrewAI 等下游依赖项目。
开源项目 LiteLLM 在 PyPI 上的 1.82.7 和 1.82.8 版本近期遭遇供应链攻击,被植入窃取凭证的恶意代码。
该事件起因是项目的 CI/CD 流程中使用的 Trivy 扫描工具导致 PYPI_PUBLISH token 泄露,进而被攻击者 TeamPCP 利用发布恶意包。
受影响版本包含的恶意载荷可在 Python 解释器启动或模块导入时自动执行,旨在窃取 SSH 密钥、云服务凭证及环境变量等敏感信息。
目前 PyPI 已对相关版本实施隔离并删除。
社区建议所有用户立即降级至 1.82.6 或更低版本,全面轮换 GitHub、Docker 及云服务凭据,并检查 DSPy、CrewAI 等受影响下游项目的依赖情况。
相关链接:
- https://github.com/BerriAI/litellm/issues/24512
- https://the-decoder.com/popular-ai-proxy-litellm-got-hacked-with-malware-that-spreads-through-kubernetes-clusters
阿里通义实验室发布 PrismAudio,论文入选 ICLR 2026 #3
阿里通义实验室近期推出了名为 PrismAudio 的视频生成音频框架,该框架利用强化学习结合分解式思维链技术,有效解决了声画不对位的难题。
阿里通义实验室近期推出了名为 PrismAudio 的视频生成音频(V2A)框架,该研究已被顶级会议 ICLR 2026 收录。
作为首个将强化学习融入 V2A 生成并配备专门思维链规划的框架,PrismAudio 通过将推理过程分解为语义、时序、美学和空间四个专门的 CoT 模块,并结合多维奖励函数进行优化,解决了传统模型“声画不对位”的痛点。

相关链接:
Ai2 发布 MolmoWeb 开源视觉模型含数据集 #4
Ai2 发布了完全开源的视觉 Web Agent 模型
MolmoWeb,它能仅凭识别浏览器截图就自动执行点击、输入及滚动等网页任务,无需依赖 HTML 源码。
Ai2 研究机构近日发布完全开源的视觉 Web Agent MolmoWeb。该项目基于 Molmo 2 家族,推出 4B 和 8B 两种规模。该模型仅靠视觉界面模拟人类操作,无需依赖 HTML 等结构化数据。
官方数据显示,其在 WebVoyager 等四大基准测试中达到开放权重模型最先进水平,部分任务超越基于 GPT-4o 的 Agent。
同步开源的 MolmoWebMix 数据集,包含目前规模最大的公开人类浏览轨迹数据。
目前,模型权重及工具已在 Hugging Face 和 GitHub 上线,采用 Apache 2.0 许可证。

相关链接:
英伟达开源 Kimodo 动作生成工具适配类人机器人 #5
英伟达发布了 Kimodo 运动学运动扩散模型,它基于 700 小时商业级数据训练,能根据文本提示或路径约束,直接生成适用
Unitree G1等类人机器人的高质量 3D 动作。
英伟达近日发布了 Kimodo,这是一款基于运动学运动扩散模型的高质量 3D 动作生成工具。该模型基于 700 小时商业级光学动作捕捉数据训练,能够根据文本提示及全身姿态关键帧、末端执行器位置、2D 路径等多种约束条件,生成适用于人类及类人机器人骨骼的动作。
项目已在 GitHub 上开源代码(Apache-2.0 许可),并在 Hugging Face 上提供了适配 SOMA、Unitree G1 和 SMPL-X 骨骼的多个模型权重。

相关链接:
- https://research.nvidia.com/labs/sil/projects/kimodo/docs
- https://github.com/nv-tlabs/kimodo
- https://huggingface.co/nvidia/Kimodo-SOMA-RP-v1
京东云 JoyBuilder 上线 AI 编程订阅服务 #6
京东云上线 Coding Plan,支持
Kimi-K2.5、GLM-5、DeepSeek-V3.2等模型。新用户限时享受首月特惠,Lite 套餐低至 7.9 元,Pro 套餐 39.9 元。
京东云 JoyBuilder 模型开发平台近日上线 Coding Plan AI 编程订阅服务,专为个人开发者提供高性价比代码辅助。该服务支持 Kimi-K2.5、GLM-5 等主流模型自由切换,适配 Claude Code、Cursor 等工具。
官方推出限时特惠,即日起至 6 月 30 日,新用户每日 10:30 可抢购首月优惠。
Lite 套餐约 1.8 万次 请求/月售 7.9 元,Pro 套餐约 9 万次 请求/月售 39.9 元。
官方强调,该服务仅限编程工具交互式使用,严禁 API 直接调用,用户数据将用于模型优化。

相关链接:
Anthropic 发布 Claude Code 自动模式,支持安全权限自主决策 #7
Claude Code 推出了 auto mode 自动模式,该模式能自主决策文件写入和命令执行权限,在拦截危险指令及提示注入攻击的同时减少人工审批流程。
该功能目前向 Team 计划用户开放,Enterprise 和 API 权限随后推出。
Anthropic 官方宣布为 Claude Code 引入全新的 auto mode(自动模式),旨在让 AI 自主处理文件写入和 Bash 命令等权限决策,从而在无需用户逐个批准的情况下保持操作安全性。该功能通过内置的分类器在执行前审查每一项操作,自动放行安全行为并拦截潜在的危险指令或提示注入攻击。
目前,该功能已作为研究预览版向 Team 计划用户开放,Enterprise 和 API 用户的访问权限预计将在未来几天内推出。
用户需通过命令 claude --enable-auto-mode 启用,并通过 Shift+Tab 切换至该模式。官方建议仅在隔离环境中使用,且该功能目前仅支持 Claude Sonnet 4.6 和 Opus 4.6 模型。

相关链接:
Adobe 升级 Firefly 平台 推出自定义模型功能 #8
Adobe Firefly 平台推出了处于公开测试阶段的自定义模型功能,允许创作者训练捕捉特定视觉风格的专属私有模型。
Adobe 近日扩展了其 Firefly AI 创意平台,除新增了 30 多个第三方 AI 模型访问权限及名为 Project Moonlight 的对话式 Agent 界面外,最引人注目的是推出了处于公开测试阶段的 Firefly 自定义模型功能。
该功能允许创作者利用自有图像库训练专属模型,以捕捉特定的视觉风格、角色设计或摄影效果,训练后的模型默认为私有且可在多项目中重复使用。

相关链接:
Linear 发文称 Issue Tracking 已死,推出 Agent 新功能 #9
Linear 官方宣告产品开发正式转向以上下文和 Agent 为核心的新范式,并同步推出 Linear Agent、Skills 以及 Automations 三项功能,旨在通过
Agent承担规划与审查等程序性工作来消除管理开销。
Linear 近日发文,宣告产品开发将从传统的流程交接模式转向以上下文和 Agent 为核心的新范式,并同步推出了 Linear Agent、Skills 以及 Automations 三项核心功能。
官方认为,传统的 Issue tracking 旨在解决工程资源稀缺带来的分工问题,但如今繁琐的流程本身已演变为负担,而 Agent 的普及正在改变这一现状,使其能够承担规划、实现及代码审查等程序性工作。
Linear 还预告了即将推出的 Code Intelligence、Code Diffs 和 Linear Coding Agent,旨在通过理解代码库、优化审查界面及自动编写代码,进一步缩短从创意到落地的距离。

相关链接:
Anthropic 发文介绍 Harness 方案,优化 Claude 长流程开发能力 #10
Anthropic 发文提出了一种面向长流程应用开发的 Harness 设计方案,用于提升 Claude 在低人工干预场景下完成端到端应用构建以及高质量前端设计的表现。
Anthropic 在文中提出了一种面向长流程应用开发的 Harness 设计方案。该方案受 GAN“生成—判别”分工思路启发,并进一步演化为包含 Planner、Generator 和 Evaluator 在内的多 Agent 协同架构。
其核心做法包括:将主观性的设计质量要求转化为可操作、可评分的评价标准,并通过独立的评估与 QA 机制对生成结果进行持续校验。
文章认为,这种设计有助于缓解模型在自评过程中偏宽松的问题,并降低其在长任务执行中因上下文压力而出现的失稳现象。

相关链接:
国家数据局明确词元命名,日均调用量两年增长超千倍 #11
国家数据局局长在中国发展高层论坛上将“Token”的中文表述为词元,或将使词元成为Token的正式翻译。
根据其当天披露的数据,我国日均词元调用量已突破140万亿,两年增长超千倍。
国家数据局局长近日出席中国发展高层论坛2026年年会期间,将“Token”的中文表述为“词元”,引发互联网关于这一译名的讨论。
与此同时,据国家数据局局长披露的数据,我国日均Token调用量呈现爆发式增长,已从两年前的1000亿跃升至去年底的100万亿,并于本月突破140万亿,两年间增长超千倍。

相关链接:
OpenAI 基金会启动运作,计划一年投资十亿美元推进 AGI #12
OpenAI Foundation 近日宣布计划在未来一年内投资至少 10 亿美元,聚焦生命科学与治愈疾病、就业与经济影响、AI 韧性及社区项目四大领域,以推进“确保 AGI 造福全人类”的使命。
OpenAI Foundation 近日宣布启动全面运作,依托其持有的 OpenAI Group 约 1300 亿美元 股权,计划在未来一年内投资至少 10 亿美元,以推进“确保 AGI 造福全人类”的使命。
该基金会将重点聚焦生命科学与治愈疾病、就业与经济影响、AI 韧性及社区项目四大领域。
在人事任命方面,OpenAI 联合创始人 Wojciech Zaremba 将转任 AI 韧性 负责人,Jacob Trefethen 将领导生命科学部门,原 OpenAI 全球影响力副总裁 Anna Makanju 也将转任负责民间社会与慈善事务。此外,Robert Kaiden 和 Jeff Arnold 分别加入担任 CFO 和运营总监。
Sam Altman 在社交媒体上强调,除了利用 AI 发现新科学外,还必须通过社会层面的应对措施来解决新型生物威胁和经济剧变等挑战。
相关链接:
- https://openaifoundation.org/news/update-on-the-openai-foundation
- https://www.bloomberg.com/news/articles/2026-03-24/openai-nonprofit-names-leaders-aims-to-spend-1-billion-in-2026
OpenAI 调整 ChatGPT 电商战略,弱化结账功能转向产品发现 #13
OpenAI 降低了 “Instant Checkout” 即时结账功能的优先级,转而专注于提供价格对比及评论等详细产品信息,引导用户跳转至商家自有网站完成交易。
OpenAI 宣布调整 ChatGPT 的电商战略,放弃此前试图建立的直接购物闭环,转而将其定位为辅助决策的“产品发现”与研究工具。
该公司确认将降低 Instant Checkout 功能的开发优先级,允许商家引导用户回到其自有网站完成结账,而 ChatGPT 将专注于提供包含并排图片、价格对比及评论在内的详细产品信息。
这一调整基于官方所称的“灵活性不足”以及外界报道反映的用户实际购买转化率低下。

相关链接:
- https://techcrunch.com/2026/03/24/openais-plans-to-make-chatgpt-more-like-amazon-arent-going-so-well
Arm 推出首款自研数据中心芯片 AGI CPU #14
Arm 正式发布首款自主设计的数据中心芯片 Arm AGI CPU,这款基于
台积电3nm工艺的芯片集成 136 个高性能核心,专为 AI 智能体基础设施优化。
半导体 IP 巨头 Arm 正式推出首款自主设计的数据中心芯片 Arm AGI CPU,标志其从 IP 授权商转型为芯片供应商。
该芯片采用台积电 3nm 制程及双 Chiplet 设计,集成 136 个 Neoverse V3 核心,主频 3.7GHz。根据官方说法,同等功耗下单机架性能是 x86 平台的 2 倍以上。
Meta 作为联合开发者及首发客户,已与 OpenAI 等伙伴展开合作。
该芯片现已开放订购,计划于今年年底前量产。Arm 披露产品路线图,拟于 2027 年发布二代产品。
永擎电子、联想 等 OEM 厂商已推出早期系统,更广泛商用部署预计下半年落地。
此举被视为 Arm 进军千亿级数据中心市场的关键一步。

相关链接:
Agile Robots 与 Google DeepMind 达成战略合作 #15
Agile Robots SE 与 Google DeepMind 达成战略研究合作,将
Gemini Robotics基础模型深度集成至 Agile 的工业机器人硬件平台。
Agile Robots SE 与 Google DeepMind 宣布达成战略合作伙伴关系,旨在将 Gemini Robotics 基础模型与 Agile Robots 的硬件及工业机器人平台深度集成。
双方计划通过共同训练、部署及测试,利用真实运营数据构建可扩展的 AI 飞轮,以提升模型性能。

相关链接:
- https://www.agile-robots.com/en/news/detail/agile-robots-and-google-deepmind-partner-to-bring-intelligence-to-robotics/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=
- https://goo.gle/4lKu7de
Dreamer 团队加入 Meta,技术授权专注 AI Agent 开发 #16
Dreamer 团队宣布加入 Meta Superintelligence Labs,并将技术授权给 Meta,旨在构建让数十亿人创建个性化软件的未来。
Dreamer 团队宣布加入 Meta Superintelligence Labs 并将技术授权给 Meta,旨在构建让数十亿人创建个性化软件的未来。
此前一个月,该团队发布 Beta 版,允许用户通过“英语”编程语言,借助 Sidekick 功能构建个人智能 AI Agent。
官方数据显示,已有数千名用户创建了涵盖生产力、娱乐及生活方式等领域的 AI Agent。

相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。