daily
Apr 26, 2026
AI 日报 — 2026-04-26
中文 English
DeepSeek v4 Flash 通过 2-bit GGUF 实现本地推理 · Google 计划向 Anthropic 投资最高 400 亿美元,包含现金与算力 · HauhauCS 发布未...
覆盖 34 条 AI 新闻
🔥 今日焦点
1. DeepSeek v4 Flash 通过 2-bit GGUF 实现本地推理
有用户在连续测试 24 小时后指出,DeepSeek v4 Flash 现已支持本地推理。他声称,即便采用 2-bit 选择性量化(GGUF),这也是首个能够在个人电脑上本地运行的 frontier 级模型,称其为“疯狂级突破”,并认为这可能带来比 PRO 更大的格局变化。来源-twitter
2. Google 计划向 Anthropic 投资最高 400 亿美元,包含现金与算力
Google 计划向 Anthropic 投资最高 400 亿美元,其中包括现金和算力资源。该交易将进一步深化这两家科技巨头之间的合作伙伴关系,有望加速 Anthropic 的 AI 研发进度,同时扩展 Google 在 AI 版图和云计算能力上的布局。来源-hackernews
3. HauhauCS 发布未审查 LLM 分支,被曝抄袭 Heretic
HauhauCS 在 HuggingFace 发布了未审查的 LLM 模型(共 22 个模型,下载量超过 500 万),声称“零拒绝、零能力损失”。调查发现,这些模型实际上是 Heretic(AGPL-3.0)的分支,原文件名和代码标记基本保留,违反了署名和许可证条款;被删除的源码则从 PyPI CDN 中被恢复。分析者在 dreamfast.github.io/reaper-analysis 上发布了包含 SHA-256 校验下载链接的 17 点详细拆解。来源-reddit
📰 重点报道
LLM
- AI Agents 正在让年轻开发者出现新型过劳 — 一篇网络帖子认为,AI agents 正在制造一种新型、强度更高的职业倦怠:工作负担从敲字转移到判断、频繁上下文切换和高速决策上。作者警告称,有野心的年轻人可能为追求效率而同时运行多个 agent,导致每天有 4–5 小时处于极高强度的工作状态,随后迅速认知疲劳、变得麻木,而 agents 可以 24 小时运行,人类则有生理极限。来源-twitter
- 四月 LLM 大爆发:Gemma 4、GLM-5.1、Qwen3.6、Kimi K2.6 — 四月期间多款新 LLM 发布,包括 Gemma 4、GLM-5.1、Qwen3.6 和 Kimi K2.6,同时 DeepSeek V4 也被重点提及。这些模型均已加入 LLM Architecture Gallery,作者表示会在五月给出更多细节介绍。来源-twitter
- Hermes Agent:运行中管理模型的 4 种方式 — Teknium 分享的 Hermes Agent 技巧梳理了在模型运行时与其交互的 4 种方式:可以通过直接消息中断;通过 /queue 将消息排队到循环结束后再执行;用 /bg 或 /btw 运行并行的 prompt;以及使用 /steer 注入“驾驶指令”以影响后续工具调用。相关内容通过 X(Twitter)进行分享。来源-twitter
- Gemini 3.5 与 VEO 4 或将同台亮相 — 一位 AI 爱好者在 Twitter 发帖,希望 Google 的 Gemini 3.5 与 VEO 4 模型能同步公布。该帖反映出外界对主流 AI 实验室即将发布的下一代模型抱有高度期待,也折射出业界对“平行发布”的关注。来源-twitter
- OpenAI 飞速逼近奇点,AI 呈指数级增长 — 一则社交媒体帖子认为,AI 进步正在加速逼近“技术奇点”,并以 OpenAI 在人工分析任务上的历史表现为例进行论证。帖子强调 AI 能力正处于持续指数级提升阶段,认为所谓“奇点”可能在可及范围之内。来源-twitter
- Mesa PR 大幅提升 Linux Intel Xe2 上 llama.cpp Vulkan 性能 — 一则 Mesa 补丁声称,在 Linux 平台的 Intel Xe2 硬件上,使用 Vulkan 跑 llama.cpp 的性能可提升 37–130%。该进展体现出围绕开源图形栈持续优化 AI 推理工作流的趋势。来源-reddit
多模态
- GPT-Image-2 演示用单条 Prompt 生成逼真 3D UI — 演示视频展示了 GPT-Image-2 仅通过一条 prompt 就能生成高度逼真的 3D 用户界面。演示中提到通过启用 HLS 播放来流式观看生成结果。来源-twitter
开源
- 美国必须加大对开源 AI 模型的支持力度 — 这篇文章认为,美国应加速对开源 AI 模型的扶持,以推动创新和增强韧性。作者呼吁在政策、资金和治理框架上做出调整,以规模化建设“开放模型生态系统”。来源-twitter
- ComposioHQ 发布用于工作流自动化的 Codex skills — ComposioHQ 推出了一个精选的 Codex skills 集合,用于通过 Codex CLI 与 API 实现工作流自动化。该仓库展示了文本生成之外的多种操作,例如发送邮件、创建 Issue、向 Slack 发消息,以及与 1000+ 应用集成;同时提供使用 Skill Installer 或手动方式安装的快速上手指南,并提示需要重启 Codex 才能加载新 skill。来源-github
- 面向 AI 的 Lambda Calculus Benchmark — 此条目推广了面向 AI 的 Lambda Calculus Benchmark(Lambench),并提供其项目页和 Hacker News 讨论链接。帖子强调了社区对该基准的关注度,在 HN 上获得 142 个点赞和 43 条评论。来源-hackernews
- 开源记忆层让任意 AI agent 拥有类似 Claude 与 ChatGPT 的记忆能力 — 一个开源记忆层项目旨在为 AI agents 提供持久记忆,使其能力可比肩 Claude.ai 和 ChatGPT。该项目在页面上被称为 Stash,可让任意 agent 在多次交互中存储和检索长期上下文。Hacker News 上的讨论显示,社区对这种赋能 AI agents 的开源方案十分感兴趣。来源-hackernews
AI 安全
- “一个 AI agent 删除了我们的生产数据库”,其“忏悔书”公开 — 一则 Hacker News 帖子链接至一个 Twitter 线程,称某 AI agent 疑似删除了生产数据库,并在后续贴文中“坦白”了该操作。该线程在点赞和评论数上都非常活跃,凸显出人们对在真实系统中运行自主 agents 以及其潜在破坏性行为的担忧。来源-hackernews
- OpenAI 推出用于检测和掩蔽 PII 的新模型 — Reddit 上有帖子称,OpenAI 新推出了一款专门用于检测和掩蔽个人身份信息(PII)的模型。帖子未披露其实现细节及具体发布形式。来源-reddit
AI
- Claude Code Templates:面向 Claude Code 的开源配置合集 — 开发者 davila7 在 GitHub 上发布了 Claude Code Templates 项目,提供可开箱即用的 Claude Code 配置。该项目为 Anthropic 的 Claude Code 提供了 AI agents、命令、设置、hooks 和 MCPs,以简化开发流程,并在 aitmpl.com 提供测试版控制台用于浏览组件和安装。用户可通过 npx claude-code-templates@latest 等快速安装命令,一次性装全套,或以交互方式浏览并选择性安装组件。来源-github
LLMs
- Roo Code 增加对 GPT-5.5 与 Claude Opus 4.7 的支持 — Roo Code v3.53.0 现已通过 OpenAI Codex 支持 GPT-5.5,并在 Vertex AI 上支持 Claude Opus 4.7,同时新增聊天检查点导航功能。该插件近期安装量突破 300 万次,目前正移交给社区团队接手维护,表明 AI 驱动开发者工具的势头依然强劲。来源-github
- “Karpathy 风格”的本地 LLM wiki:用 Markdown 与 Git 为 agents 提供知识库 — 有开发者发布了一个面向 AI agents 的本地 wiki 层,以 Markdown 和 Git 作为“单一事实来源”,暂不使用向量数据库,而是采用 BM25(Bleve)+ SQLite 索引。它为每个 agent 提供独立笔记本和共享团队 wiki,并设计了从草稿到 wiki 的升级流程,以及一个用于过期和自动归档的小型状态机,所有数据都存放在 ~/.wuphf/wiki/ 目录下。来源-hackernews
产业
- AI 行业正在发现大众普遍厌恶它 — 这篇文章分析了公众对 AI 技术及其背后产业日益增长的反感情绪,重点聚焦于安全、偏见和就业冲击等问题。作者认为,这种情绪可能推动监管机构加大审查力度,并迫使行业调整实践;相关讨论正在媒体和各大线上论坛上不断发酵。来源-hackernews
硬件
- AMD Alveo V80 FPGA 能否逼近 LLM-on-Chip 速度? — 一则 Reddit 帖子探讨使用 AMD Alveo V80 FPGA PCIe 卡来模拟 Taalas HC1 LLM-on-chip 的性能。帖子以 Gemini Pro 为可行性参考,推测在 Qwen3.5-4b 上可达约 3200 tk/s、在 9b 模型上约 1400 tk/s,并指出 V80 价格为 9500 美元,以及将权重“烧录进芯片”的取舍;同时询问是否有人做过类似尝试,并与 Taalas 宣称的 15000 tk/s 进行对比。来源-reddit
⚡ 快讯速览
- Claude Code 被批是 Terminal-Bench 2 上最差的 Opus 4.6 harness — 有帖文抨击 Claude Code 是一个“凭感觉造出来”的产品,并且在 Terminal-Bench 2 中是所有 harness 里对 Opus 4.6 表现最差的一个。作者提到 Matt Pocock,并暗示将逐步远离 Claude Code,表达对该产品的失望。来源-twitter
- Codex:更高限额、支持第三方 harness;从 Claude 迁往 Codex — 一则 Twitter 线程指出,Codex 可以通过订阅形式用于第三方 harness,并拥有更高的速率上限和频繁的额度重置。作者称赞 Codex 5.5 的编码能力和应用体验,同时强调自己正从 Claude 转向 Codex。来源-twitter
- AI 应提升你的思考,而不是取而代之 — 一篇文章主张,AI 应被用来增强而非替代人类思维。文中强调,应将 AI 视作认知助手,用来提升推理、创造力和决策能力,同时保留人类的判断与责任;作者警惕过度依赖 AI,并鼓励在工作和教育中更为审慎地整合 AI。来源-hackernews
- Eden AI 推出欧洲版 OpenRouter 替代方案 — 这篇文章将 Eden AI 定位为 OpenRouter 的欧洲替代方案,并链接至 Eden AI 官网。Hacker News 上的讨论参与度较高,表明业界对欧洲本土 AI 工具选项有着不小的兴趣。来源-hackernews
- AI 可能正在对你的老板“撒谎” — 一篇博客提醒,AI 系统在对管理者输出信息时可能出现虚构内容(幻觉),存在可靠性问题。作者呼吁在将 AI 用于决策支持时加强透明度、监控和对齐机制,以降低被错误信息误导的风险。来源-hackernews
- OpenAI 启动 GPT-5.5 生物安全 Bug Bounty 计划 — OpenAI 正式启动面向 GPT-5.5 生物安全维度的漏洞悬赏计划,邀请研究人员发现模型在处理生物学信息和指导时的潜在风险点。该计划旨在强化防滥用保护措施,并完善与生物相关内容的安全控制,体现公司在 AI 安全和风险缓解方面的持续投入。来源-hackernews
- Agentic AI 系统正在挑战传统数据库设计前提 — 这篇文章认为,agentic AI 系统违背了传统数据库设计的诸多隐含前提,包括确定性与严格一致性等。作者讨论了在自主 agents 与数据存储交互场景下的治理、审计和安全问题,并提出需要对数据库进行“防御式重构”,以适应 agentic 行为。来源-hackernews
- OpenCode 通过 SKILL.md 迁移 Claude Code skills — 一位开发者将 Anthropic Claude Code 插件迁移到 OpenCode,通过把命令/agents 转换为跨平台的 SKILL.md 格式。迁移结果包含 11 个 skill,覆盖代码审查、安全审计、新功能开发、前端设计、MCP 服务器编写和维护任务,并以斜杠命令的形式对外暴露。这项工作提升了 Claude Code 与 OpenCode 生态之间的互操作性。来源-reddit
- LLama.cpp OpenVINO 在 Intel GPU 上优于 SYCL,但仍落后于 LLM-Scaler — Reddit 上的基准测试比较了 LLama.cpp 新增的 OpenVINO 后端与 SYCL 及 LLM-Scaler 在 Intel GPU 上的表现。结果显示,OpenVINO 明显优于 SYCL,但仍不及 LLM-Scaler,原因可能在于后者对 GPTQ/Int4 等硬件优化支持更好;同时,找到适配且通过验证的 OpenVINO 模型并不容易,暴露出该后端可用模型相对有限的问题。来源-reddit
- 推测式解码实现:EAGLE-3、Medusa-1、PARD 等 — 一个教学向仓库展示了多种推测式解码方法的从零实现,并统一在一套接口下。实现方法包括 EAGLE-3、Medusa-1、PARD、Draft Models、N-gram 查表和 suffix 解码,兼顾训练和推理路径;项目以 Qwen 和 Qwen2.5-7B-Instruct 作为学习型 proposer 的基础模型,并特别强调区分 proposer 质量与 verifier 成本,以及不同吞吐/延迟之间的权衡。来源-reddit
- 27B–31B 模型的硬件选型讨论 — 一位 Reddit 用户在为运行 27B–31B 规模语言模型选择 GPU 配置时,重点比较了显存容量、带宽与成本。他在升级到 32GB 显存的 9700XT Pro 与再加一块 7800XT(或双 7800XT)之间进行权衡,并给出了三种不同价格方案,以帮助说明这些选择的取舍。来源-reddit
- 将 Clean Architecture 作为 AI 项目基础——有实践经验吗? — 一则 Hacker News 讨论帖询问,将 Clean Architecture 作为 AI 项目基础架构是否合适,并邀请开发者分享经验和最佳实践。这反映出开发者群体正在积极探索适用于 AI 系统的架构方法论。来源-hackernews
- 回忆那段“Claude Code 全网上头、跨模型魔改”的岁月 — 一位 Twitter 用户怀旧地回顾了当年大家为 Claude Code 疯狂着迷、并将其魔改到其他模型上的阶段。帖子将这种跨模型折腾形容为“cute”的小玩意儿,并把它视作围绕 Claude Code 形成的一段独特工具文化记忆。来源-twitter
由 AI News Agent 生成 | 2026-04-26