daily
Apr 27, 2026
AI 日报 — 2026-04-27
中文 English
Microsoft 发布 TRELLIS.2:开源 40 亿参数 3D 生成模型 · 本地浏览器 AI Agent 利用 WebGPU 离线运行 · 小米以 MIT 协议开放 MiMo-V2.5...
共收录 33 条 AI 新闻
🔥 今日焦点
1. Microsoft 发布 TRELLIS.2:开源 40 亿参数 3D 生成模型
TRELLIS.2 推出了一个拥有 40 亿参数的图像到 3D 生成模型,采用新颖的 O-Voxel 稀疏体素结构,可以生成具备完整 PBR 材质的高保真资产。它通过原生 3D VAE 实现 16 倍空间压缩,最高可生成 1536^3 分辨率的 3D 资产。该项目完全开源,提供论文、GitHub 代码以及 HuggingFace 在线演示链接。来源-reddit
2. 本地浏览器 AI Agent 利用 WebGPU 离线运行
介绍了一款完全本地、基于浏览器的 AI agent,由 Gemma 4 E2B 与 WebGPU 提供算力支持。该 agent 使用原生工具调用来搜索浏览历史、读取和总结网页内容、管理标签页,全程 100% 离线、无需任何服务器端支持。它还能在浏览器内部实现诸如 HLS 播放等功能。来源-x
3. 小米以 MIT 协议开放 MiMo-V2.5,可商业使用
小米以 MIT 开源协议发布 MiMo-V2.5,允许在无需额外授权的前提下进行商业部署、持续训练与微调。此次发布包含用于复杂 agent 与编程任务的 MiMo-V2.5-Pro(在 GDPVal-AA 和 ClawEval 上排名领先),以及具备强大 agent 能力的原生多模态模型 MiMo-V2.5,两者均支持 100 万 token 的上下文窗口;模型权重已在 HuggingFace 上发布,更多细节可在 MiMo 博客(mimo.xiaomi.com)查看。来源-x
📰 重点报道
开源动态
- DeepSeek AI v4 论文因开放且严谨的研究获赞 — 该论文因数学上的严谨性与彻底开放发布而备受称赞,强调其将数月到数年的研究工作免费公开,为更广泛的 AI 社区带来收益。来源-x
- Hermes Agent 仓库下载量超越 Claude 代码仓库 — 这被视为开源 AI 工具链势头不断增强、以及各类 AI 代码仓库竞争态势加剧的信号。来源-x
AI 安全
- 规范冲突会提高大型推理模型被越狱的风险 — 一篇 arXiv 论文表明,价值观/规范冲突会显著增加大型推理模型被越狱的风险,指出当前的对齐仍然较为浅层,安全缺口依旧存在。来源-x
- 创作者用 GPT-5.5 搭建项目,凸显 Claude 的缺陷 — 一位开发者使用 GPT-5.5 构建项目,并与 Claude 长期存在的问题进行对比,预告将发布一份 Claude 缺陷汇总及名为 “clawd rip” 的内容。来源-x
大模型 / 基准测试
- Nemotron-3 Nano 在金融、推理、代码的 4B 评测中夺冠 — 在覆盖 39 个任务的正面对比中,Nemotron-3 Nano 在 4B 级别模型中领跑,在金融与推理任务上表现出色,在代码任务上也保持稳健表现。来源-reddit
- Kimi K2.6 登顶 OpenRouter 周度 LLM 排行榜 — Kimi K2.6 升至 OpenRouter 周榜第 1 名,反映出其生态进展迅速,模型仍在持续迭代开发中。来源-x
硬件 / 推理
- Skymizer 单张 PCIe 卡实现超大规模 LLM 推理 — 一块集成 6 颗 HTX301 芯片、384 GB 内存的 PCIe 卡 reportedly 能在本地运行 700B 参数规模的大模型推理,每张卡功耗约 240W,从而降低对高显存 GPU 的依赖;更多细节预计将在 Computex 上公布。来源-reddit
⚡ 快讯速览
- UniT 提出统一物理语言用于人形机器人任务迁移 — 提出一种统一的“物理语言”来实现任务在人形体机器人之间的迁移。来源-huggingface
- Luce DFlash 在 RTX 3090 上实现 Qwen3.6-27B 两倍吞吐 — 在 RTX 3090 上为 Qwen3.6-27B 实现最高 2 倍推理吞吐提升。来源-reddit
- 开源项目 Cua 让 AI Agents 能控制完整桌面环境 — 使 AI agents 能够与完整桌面环境交互并执行控制操作。来源-github
- 中国阻止 Meta 旗下 Manus 被外国投资者收购 — 中国阻止外国投资者收购 Meta 的 Manus 资产交易。来源-reddit
- 2 张 5060 Ti:是否有更优的 Qwen 3.6 27B/35B 配置? — 社区讨论如何在 2×5060 Ti 上获得更佳的 Qwen 3.6 部署配置。来源-reddit
- OpenAI 隐私过滤器通过 ExecuTorch 在端侧运行 — OpenAI 的隐私过滤模型可借助 ExecuTorch 在本地设备上直接运行。来源-reddit
- GitHub Copilot 将于 6 月 1 日起改为按使用量计费 — Copilot 自 6 月 1 日起将采用基于使用量的计费模式。来源-x
- Symphony:用于 Issue 处理的开源 Codex Agent 协调器 — Symphony 提供一个类似 Codex 的开源 agent 编排器,用于自动处理各类 issue。来源-x
- Agentic World Modeling:基础、能力、规律及其拓展 — 提出关于 agentic 世界建模基础与能力的一种新视角和框架。来源-huggingface
- gpt-realtime-1.5 支持语音控制的交互式应用 — 通过 gpt-realtime-1.5 为交互式应用加入语音控制能力。来源-x
- AI 公司需依赖基准测试才能真正受益于模型进步 — 呼吁将基准测试作为驱动利用模型进步、提升产品效果的核心机制。来源-x
- 用于视频分析与生成的语义进度函数 — 提出一种语义进度函数,用于视频内容分析与生成过程建模。来源-huggingface
- mattpocock/skills:面向工程师的 Agent 技能库 — 一个为真实工程师分享与复用 agent 技能的仓库。来源-github
- Beads:面向 AI 编码 Agent 的 Dolt 驱动记忆图谱 — Beads 提供基于 Dolt 的记忆图谱,用于增强 AI 编码 agent 的长期记忆与上下文管理。来源-github
- OpenClaw 在个人设备上运行的本地 AI 助手 — OpenClaw 推出可在用户自有设备上本地运行的个人 AI 助手。来源-github
- 致 16GB 显存用户:把你的老显卡也插上 — 为仅有 16GB 显存的用户提供实用建议,鼓励将旧 GPU 一并利用以提升本地推理能力。来源-reddit
- GBNF 调优加速 Qwen3.6 35B-A3B 与 27B — 通过 GBNF 语法/数值约束进行调优,以加速 Qwen3.6 系列模型的推理速度。来源-reddit
- 多模态模型端到端微调教程 — 一份覆盖“完整旅程”的教程,讲解如何对多模态模型进行端到端微调。来源-reddit
- Grok 3 开源延迟引发外界质疑 — Grok 3 迟迟未开源在社区内引发越来越多的怀疑与不满声音。来源-reddit
- 汇总贴展示 Claude 多年来的各种问题 — 一条线程系统整理了 Claude 这些年来暴露出的各种问题与失败案例。来源-x
- Qwen 3.6 27B 跑在 Strix Halo 128GB 上的体验? — 用户讨论在 Strix Halo 128GB 平台上运行 Qwen 3.6 27B 的实际体验和性能表现。来源-reddit
- 56GB 显存本地 LLM:用 llamacpp 选哪个模型最好? — 围绕如何在 56GB 显存条件下、借助 llamacpp 运行本地 LLM 的模型选择与配置讨论。来源-reddit
- 多 Agent 协作相关内容在 Twitter/X 上被重点推荐 — 汇集并突出展示多 Agent 协作的讨论与案例线程。来源-x
由 AI News Agent 生成 | 2026-04-27
━━━━━━ End of Template ━━━━━━