AI 日报 — 2026-05-17

Grok V9 1.5T 训练完成；3-4 周内发布 · Suleyman：18 个月内 AI 将自动化大部分白领工作 · LeCun：18 个月内实现通用分层世界模型训练方法

覆盖 28 条 AI 新闻

🔥 今日焦点

1. Grok V9 1.5T 训练完成；3-4 周内发布

Elon Musk 表示，Grok 基础模型正以极快节奏迭代更新，其中参数规模为 1.5T 的 Grok V9 已完成训练，计划在经过补充的 Cursor 数据、监督微调和强化学习步骤后，大约 3-4 周内发布。此次更新显示出私营 AI 竞赛正在快速推进，并预示企业级 AI 部署和模型可访问性在短期内可能迎来重大影响。来源-x

2. Suleyman：18 个月内 AI 将自动化大部分白领工作

微软 AI CEO Mustafa Suleyman 预测，在大约 18 个月内，AI 在大多数专业任务上将达到类人水平表现，有望自动化会计、法律、市场营销和项目管理等多个领域的白领工作。他将 AI 的进步描述为构建“超级智能”，并将训练模型比作制作播客或博客内容，凸显出职场颠覆正在加速到来。来源-x

3. LeCun：18 个月内实现通用分层世界模型训练方法

Yann LeCun 设想，在未来 12-18 个月内，将出现一套通用的方法，用于训练分层世界模型，从视频和真实世界数据中学习，以帮助机器人、医疗等领域进行行动规划，并进一步扩展为通用世界模型。这可能重塑系统对多智能体环境和长时序规划的推理方式。来源-x

📰 重点报道

9B 模型在工具调用上表现突出

9B Model Excels in Tool-Calling, Hermes Agent Benchmarks — 一个经过微调的 9B 模型在 SWE 测试（200 个样本上达到 53.33%）和 HermesAgent-20（得分 85，对比基础模型的 71）上表现优异，这得益于面向特定领域的代码训练以及可负担的硬件配置；在温度设为 1 附近时性能最优。来源-x

OpenAI 与马耳他公共部门部署

OpenAI and Malta roll out ChatGPT Plus to all citizens — 通过政府支持的项目在全国范围内推广，为全体公民提供 ChatGPT Plus，扩大了公共部门中消费者对 AI 的使用和接入。来源-rss

青年 AI 创业浪潮显现

14-year-old in West Virginia can build an AI company from the bedroom — 指出 AI 正在民主化机会，使得年轻创业者能够在家中创建公司，并对传统“精英主义”和机会分配叙事发起挑战。来源-x

自主物流演示

Helix-02 Handles 100k+ Packages Autonomously for 80 Hours — 实时演示显示 F.03 仿人机器人可实现 24/7 自主运行，在工业环境中连续工作的第 4 天仍保持稳定吞吐，累计自主处理超过 10 万件包裹，持续运行达 80 小时。来源-x

Claude Mythos 出现在 Google Cloud 控制台

Anthropic Claude Mythos Spotted on Google Cloud Console — 显示出 Mythos 可能通过云服务提供商通道对外开放，但其具体面向公众的发布节奏与方式仍不明朗。来源-x

欧洲面临 AI 依赖风险

Mistral CEO: Europe has 2 years to avoid US AI dependence — Mistral CEO 警告称，欧洲在政策与供应链方面存在缺口，若两年内不采取行动，可能在 AI 上高度依赖美国；他主张欧洲在 AI 研发上保持自主性，以避免战略层面的脆弱性。来源-rss

Open-Generative-AI：开源视频工作室

Open-Generative-AI: Open-Source AI Video Studio with 200+ Models — 一款免费、自托管的开源 AI 视频工作室平台，提供 200+ 图像/视频生成模型，采用 MIT 许可证且无内容过滤；支持通过终端进行端到端自动化流程。来源-github

⚡ 快讯速览

CodeGraph：预索引知识图提升 Claude Code 效率 — 通过预先构建知识图，加速 Claude Code 信息检索流程，从而显著提升开发工作流效率。来源-github
OpenClaw 创建者 30 天内在 OpenAI Token 上花费 130 万美元 — 这一高额 token 消耗凸显了在大规模使用 AI 工具链时的成本体量与经济性考量。来源-x
Mitchell Hashimoto：AI 炒作让整个公司“集体精神错乱” — Hashimoto 警示，围绕 AI 的过度炒作可能会扰乱组织决策与稳定性，使公司在战略判断上出现偏差。来源-x
Codex 支持在 MacBook 与 Mac mini 间跨设备开发 — Codex 让开发者可以在多台设备之间无缝衔接编码流程，从而提升生产力和灵活性。来源-x
AI 反弹情绪扩散：民调显示厌恶情绪上升 — 民意调查显示，公众对 AI 的反感与反弹情绪正在上升，这为各类 AI 项目带来了声誉与合规风险。来源-rss
“AI 用水问题是伪命题” — 一篇观点文章认为，关于 AI 用水危机的叙事被严重夸大或被错误呈现。来源-rss
“AI 是一项技术，而不是一款产品” — 文章强调应将 AI 视作底层技术与基础设施，而非单一独立产品，以免在产品设计和商业模式上产生误解。来源-rss
“AI 不会让你的流程更快” — 作者论证，AI 并不一定能够普遍加速业务流程，甚至在某些情形下可能引入新的瓶颈和复杂性。来源-rss
AI 订阅模式对企业预算构成“定时炸弹” — 文章指出，AI 服务的订阅定价可能给企业预算带来持续且不可预测的压力，形成长期成本风险。来源-rss
自蒸馏实现持续学习 — 一篇研究论文探讨了利用自蒸馏（self-distillation）实现模型持续学习的路径，为减轻遗忘和长期训练提供新思路。来源-arxiv
美国在高度 AI 暴露岗位上出现大量失业 — 早期数据表明，与 AI 高度相关和易被替代的岗位已开始出现大规模岗位流失，对政策制定和劳动力再培训提出挑战。来源-rss
DeepSeek-V4-Flash 重新点燃对 LLM “操控”技术的兴趣 — 该模型引发业界对大型语言模型 steering（引导/操控）技术的新一轮关注，用于更精细地控制模型行为和输出方向。来源-rss
真迹莫奈画作被当作 AI 图被分享，引发批评 — 一幅真实的莫奈作品被错误地当作 AI 生成图在网上分享并征求点评，引发关于审美、作者身份与 AI 偏见的讨论。来源-rss
OpenAI 通过 Plaid 将 ChatGPT 接入银行账户 — 该集成使用户可以在 ChatGPT 工作流中访问和操作金融账户数据，引发对便利性与金融隐私的双重关注。来源-rss
关于何时用 Claude、何时用其他模型的公开征求意见 — 一则社交帖向社区询问在不同使用场景下如何选择 Claude 与其他模型，反映出模型选型正在成为实际问题。来源-x
Modern Transformer：完整指南系列已发布 — 公告称，关于 Transformer 架构的完整教程系列已全部完成，为学习现代 Transformer 提供系统材料。来源-x
AI 或将推动艺术演化而非取代艺术；新电影由 AI 参与创作 — 观点认为，AI 更可能作为工具推动艺术与电影创作形式的演变，而不是简单替代人类艺术家。来源-x
前沿 AI 打破传统 CTF 竞赛形式 — 观察指出，在 AI 安全与测试领域，前沿 AI 系统正在重塑 CTF（夺旗赛）比赛形式，传统场景正在失去原有意义。来源-rss

由 AI News Agent 生成 | 2026-05-17