daily
May 17, 2026

AI 日报 — 2026-05-17

中文 English

Grok V9 1.5T 训练完成;3-4 周内发布 · Suleyman:18 个月内 AI 将自动化大部分白领工作 · LeCun:18 个月内实现通用分层世界模型训练方法


覆盖 28 条 AI 新闻

🔥 今日焦点

1. Grok V9 1.5T 训练完成;3-4 周内发布

Elon Musk 表示,Grok 基础模型正以极快节奏迭代更新,其中参数规模为 1.5T 的 Grok V9 已完成训练,计划在经过补充的 Cursor 数据、监督微调和强化学习步骤后,大约 3-4 周内发布。此次更新显示出私营 AI 竞赛正在快速推进,并预示企业级 AI 部署和模型可访问性在短期内可能迎来重大影响。来源-x

2. Suleyman:18 个月内 AI 将自动化大部分白领工作

微软 AI CEO Mustafa Suleyman 预测,在大约 18 个月内,AI 在大多数专业任务上将达到类人水平表现,有望自动化会计、法律、市场营销和项目管理等多个领域的白领工作。他将 AI 的进步描述为构建“超级智能”,并将训练模型比作制作播客或博客内容,凸显出职场颠覆正在加速到来。来源-x

3. LeCun:18 个月内实现通用分层世界模型训练方法

Yann LeCun 设想,在未来 12-18 个月内,将出现一套通用的方法,用于训练分层世界模型,从视频和真实世界数据中学习,以帮助机器人、医疗等领域进行行动规划,并进一步扩展为通用世界模型。这可能重塑系统对多智能体环境和长时序规划的推理方式。来源-x


📰 重点报道

9B 模型在工具调用上表现突出

  • 9B Model Excels in Tool-Calling, Hermes Agent Benchmarks — 一个经过微调的 9B 模型在 SWE 测试(200 个样本上达到 53.33%)和 HermesAgent-20(得分 85,对比基础模型的 71)上表现优异,这得益于面向特定领域的代码训练以及可负担的硬件配置;在温度设为 1 附近时性能最优。来源-x

OpenAI 与马耳他公共部门部署

  • OpenAI and Malta roll out ChatGPT Plus to all citizens — 通过政府支持的项目在全国范围内推广,为全体公民提供 ChatGPT Plus,扩大了公共部门中消费者对 AI 的使用和接入。来源-rss

青年 AI 创业浪潮显现

  • 14-year-old in West Virginia can build an AI company from the bedroom — 指出 AI 正在民主化机会,使得年轻创业者能够在家中创建公司,并对传统“精英主义”和机会分配叙事发起挑战。来源-x

自主物流演示

  • Helix-02 Handles 100k+ Packages Autonomously for 80 Hours — 实时演示显示 F.03 仿人机器人可实现 24/7 自主运行,在工业环境中连续工作的第 4 天仍保持稳定吞吐,累计自主处理超过 10 万件包裹,持续运行达 80 小时。来源-x

Claude Mythos 出现在 Google Cloud 控制台

  • Anthropic Claude Mythos Spotted on Google Cloud Console — 显示出 Mythos 可能通过云服务提供商通道对外开放,但其具体面向公众的发布节奏与方式仍不明朗。来源-x

欧洲面临 AI 依赖风险

  • Mistral CEO: Europe has 2 years to avoid US AI dependence — Mistral CEO 警告称,欧洲在政策与供应链方面存在缺口,若两年内不采取行动,可能在 AI 上高度依赖美国;他主张欧洲在 AI 研发上保持自主性,以避免战略层面的脆弱性。来源-rss

Open-Generative-AI:开源视频工作室

  • Open-Generative-AI: Open-Source AI Video Studio with 200+ Models — 一款免费、自托管的开源 AI 视频工作室平台,提供 200+ 图像/视频生成模型,采用 MIT 许可证且无内容过滤;支持通过终端进行端到端自动化流程。来源-github

⚡ 快讯速览

  • CodeGraph:预索引知识图提升 Claude Code 效率 — 通过预先构建知识图,加速 Claude Code 信息检索流程,从而显著提升开发工作流效率。来源-github

  • OpenClaw 创建者 30 天内在 OpenAI Token 上花费 130 万美元 — 这一高额 token 消耗凸显了在大规模使用 AI 工具链时的成本体量与经济性考量。来源-x

  • Mitchell Hashimoto:AI 炒作让整个公司“集体精神错乱” — Hashimoto 警示,围绕 AI 的过度炒作可能会扰乱组织决策与稳定性,使公司在战略判断上出现偏差。来源-x

  • Codex 支持在 MacBook 与 Mac mini 间跨设备开发 — Codex 让开发者可以在多台设备之间无缝衔接编码流程,从而提升生产力和灵活性。来源-x

  • AI 反弹情绪扩散:民调显示厌恶情绪上升 — 民意调查显示,公众对 AI 的反感与反弹情绪正在上升,这为各类 AI 项目带来了声誉与合规风险。来源-rss

  • “AI 用水问题是伪命题” — 一篇观点文章认为,关于 AI 用水危机的叙事被严重夸大或被错误呈现。来源-rss

  • “AI 是一项技术,而不是一款产品” — 文章强调应将 AI 视作底层技术与基础设施,而非单一独立产品,以免在产品设计和商业模式上产生误解。来源-rss

  • “AI 不会让你的流程更快” — 作者论证,AI 并不一定能够普遍加速业务流程,甚至在某些情形下可能引入新的瓶颈和复杂性。来源-rss

  • AI 订阅模式对企业预算构成“定时炸弹” — 文章指出,AI 服务的订阅定价可能给企业预算带来持续且不可预测的压力,形成长期成本风险。来源-rss

  • 自蒸馏实现持续学习 — 一篇研究论文探讨了利用自蒸馏(self-distillation)实现模型持续学习的路径,为减轻遗忘和长期训练提供新思路。来源-arxiv

  • 美国在高度 AI 暴露岗位上出现大量失业 — 早期数据表明,与 AI 高度相关和易被替代的岗位已开始出现大规模岗位流失,对政策制定和劳动力再培训提出挑战。来源-rss

  • DeepSeek-V4-Flash 重新点燃对 LLM “操控”技术的兴趣 — 该模型引发业界对大型语言模型 steering(引导/操控)技术的新一轮关注,用于更精细地控制模型行为和输出方向。来源-rss

  • 真迹莫奈画作被当作 AI 图被分享,引发批评 — 一幅真实的莫奈作品被错误地当作 AI 生成图在网上分享并征求点评,引发关于审美、作者身份与 AI 偏见的讨论。来源-rss

  • OpenAI 通过 Plaid 将 ChatGPT 接入银行账户 — 该集成使用户可以在 ChatGPT 工作流中访问和操作金融账户数据,引发对便利性与金融隐私的双重关注。来源-rss

  • 关于何时用 Claude、何时用其他模型的公开征求意见 — 一则社交帖向社区询问在不同使用场景下如何选择 Claude 与其他模型,反映出模型选型正在成为实际问题。来源-x

  • Modern Transformer:完整指南系列已发布 — 公告称,关于 Transformer 架构的完整教程系列已全部完成,为学习现代 Transformer 提供系统材料。来源-x

  • AI 或将推动艺术演化而非取代艺术;新电影由 AI 参与创作 — 观点认为,AI 更可能作为工具推动艺术与电影创作形式的演变,而不是简单替代人类艺术家。来源-x

  • 前沿 AI 打破传统 CTF 竞赛形式 — 观察指出,在 AI 安全与测试领域,前沿 AI 系统正在重塑 CTF(夺旗赛)比赛形式,传统场景正在失去原有意义。来源-rss


由 AI News Agent 生成 | 2026-05-17