体验分享#AI#Daily

AI HOT 日报 · 2026年06月09日

2026-06-09|yancey|34 分钟阅读

🚀 模型发布/更新

小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式，1T 模型输出突破 1000 tokens/s — 公众号：小米 MiMo (4小时前) 摘要：小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式，使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化（仅量化 MoE Expert）与 DFlash 块级 masked 并行推测解码（coding 场景平均接受长度 6.30 tokens）；系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放（2026 年 6 月 9 日至 23 日），定价为 MiMo-V2.5-Pro 的 3 倍，速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。 🔗 查看原文
VoxCPM2 技术报告发布 — X：面壁智能 OpenBMB (@OpenBMB) (17小时前) 摘要：面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型，拥有 2B 参数，基于超 200 万小时多语言语音数据训练，支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估，以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建，在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。 🔗 查看原文

🛠️ 产品发布/更新

Apple Core AI 框架 — Hacker News 热门（buzzing.cc 中文翻译） (8小时前) 摘要：一篇关于 Apple Core AI 框架的 Hacker News 帖子获得 109 个点赞。帖子内容包含一张苹果开发者 OG 图片和一个指向 Apple Core AI Framework 官方文档的链接（developer.apple.com）。该帖子由 buzzing.cc 中文翻译，发布于 2026 年 6 月 8 日 02：47（UTC）。 🔗 查看原文
Claude 支持 Apple Foundation Models 框架，推出新 Swift 包 — Claude：Blog（网页） (9小时前) 摘要：Anthropic 通过一个新 Swift 包，让 Apple 开发者能在 Foundation Models 框架中直接调用 Claude。开发者用 Apple 框架以原生 Swift 方式，仅需三行代码即可通过引导生成返回类型化 Swift 值。当请求涉及多步推理、代码生成、联网搜索或数据分析时，Claude 可接手处理，并将流式响应传回同一视图。该支持可在 iOS 27、iPadOS 27、macOS 27、visionOS 27 和 watchOS 27 上使用，开发者需添加包并配置 Anthropic API 密钥。 🔗 查看原文
Viggle API 上线：任意角色任意动作秒级生成 — X：Viggle AI (@ViggleAI) (11小时前) _摘要：推出 Viggle API。

给任意角色添加任意动作，一次 API 调用--数秒内即可激活。

可接入 Claude、Codex 或你正在构建的任何智能体。起价 $0.01/秒。

注册即获 100 次免费额度。

转发 + 关注 + 评论，10 位中奖者再获 100 次！

了解更多👇_ 🔗 查看原文

Claude 为 Connector 开发者推出性能监控仪表盘 — Claude：Blog（网页） (13小时前) 摘要：Claude 为目录中已发布的 Connector 新增性能监控仪表盘（公开测试版）。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟，并按工具细分错误归因；还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号（Admin/Owner 权限或自定义角色）。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录，该目录已有超 300 个第三方 Connector，每日被数百万人使用。 🔗 查看原文
Apple发布新一代Apple Intelligence和Siri AI — Apple：Newsroom（RSS） (13小时前) 摘要：今天Apple预览了即将推出的软件版本，将带来新一代Apple Intelligence和Siri AI。 🔗 查看原文
Apple Intelligence 将强大 AI 能力融入日常体验 — Apple：Newsroom（RSS） (13小时前) 摘要：Apple 发布下一代 Apple Intelligence，将 AI 能力集成到 iPhone、iPad 和 Mac 中，带来更个性化和有帮助的日常体验。 🔗 查看原文
ChatGPT 新增数据图表生成功能 — X：ChatGPT (@ChatGPTapp) (15小时前) _摘要：将数据和比较转化为图表，直接在 ChatGPT 中完成。

现已支持移动端和网页端。_ 🔗 查看原文

NotebookLM重大升级：智能体能力与高级推理 — X：NotebookLM (@NotebookLM) (15小时前) _摘要：推出更强大的 NotebookLM 🚀

重大升级带来了对话中的智能体能力、更高级的推理以及一系列新的输出格式。处理复杂的多步骤研究问题从未如此简单。

现已面向 Google AI Ultra 订阅者推出。_ 🔗 查看原文

Runway Aleph 2.0 编辑模型：一键适配任意视频格式 — X：Runway (@runwayml) (16小时前) _摘要：一个视频，现在可以为每个信息流和格式制作。上传你现有的视频，选择你想要的宽高比，然后观看我们的编辑模型 Aleph 2.0，填充场景的其余部分，就像你从一开始就这样制作一样。

在我们的桌面 Web 应用上尝试，链接如下。_ 🔗 查看原文

Kimi Code 焕新升级（附视频教程） — 公众号：月之暗面（Kimi） (18小时前) 摘要：Kimi Code 开源 Coding Agent 迎来大版本升级：一行命令安装，毫秒级启动；新增视频理解能力，支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码；集成同花顺、天眼查等权威数据源，可查询股票价格、财报、学术论文；支持 ACP 协议，可在 JetBrains、Zed 中使用；丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。 🔗 查看原文
EU AI Act 合规：面向 AI 智能体的人工监督 — OpenRouter：Announcements（RSS） (20小时前) 摘要：使用智能体 SDK 的人机协作（HITL）工具，可满足 EU AI Act、Colorado AI Act 和 NIST AI RMF 对 AI 智能体的合规要求。 🔗 查看原文
微信AI官宣内测：两种接入模式供开发者选择 — IT之家（RSS） (23小时前) 摘要：微信开发者官方今日发布指引，确认微信AI正在内测阶段。开放平台提供两种接入模式：自动模式可授权平台读取小程序源码，无需额外开发即可让微信AI直接操作页面；开发模式下开发者可自主开发技能，审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手，用户通过自然语言对话即可调用、访问和操作小程序。服务条款称"微信AI"可能非最终名称。接入与否不影响现有小程序服务。 🔗 查看原文

📈 行业动态

AI 编程独角兽 Cursor 欧洲总部落子伦敦，SpaceX 手握 600 亿美元收购选择权 — IT之家（RSS） (2小时前) 摘要：Cursor 将欧洲总部设在伦敦，计划招聘约 200 名员工，并在巴黎、慕尼黑等地开设小型办事处。SpaceX 拥有以 600 亿美元收购 Cursor 的选择权，或支付 100 亿美元开展全新合作。Cursor 目前 B2B 年化营收约 26 亿美元，客户包括英国航空、英国石油、诺基亚等。公司强调数据留存欧洲本地以满足监管合规，其平台支持用户用自然语言生成代码，主打模型中立，竞争对手包括 GitHub Copilot、OpenAI 和谷歌的同类产品。 🔗 查看原文
OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity 裁员 — IT之家（RSS） (5小时前) 摘要：OpenAI 近日秘密提交 IPO 申请。其 CEO 山姆·奥特曼旗下的 Tools for Humanity 公司正裁员，该公司因虹膜扫描项目 World 及加密货币 Worldcoin 知名，投后估值 25 亿美元，获 Andreessen Horowitz 等投资。因营收困境，公司缩减规模。海外监管方面，肯尼亚以隐私和金融风险为由叫停运营，韩国因违反隐私法规罚款 83 万美元。 🔗 查看原文
Elon Musk 详解 SpaceX AI1 轨道 AI 数据中心卫星方案 — X：Rohan Paul (@rohanpaul_ai) (5小时前) 摘要：Elon Musk 首次详细解释 SpaceX 的 AI1 轨道 AI 数据中心卫星：峰值功率 150 kW，持续计算功率约 120 kW，相当于一个 NVIDIA GB300 机架；太阳能板效率 250 W/m2；双面散热器排热 1，400 W/m2。通过激光链路实现约 1 Tbps 互联，低轨 600-800 km 高度往返延迟 6-8 ms。由 Starship 发射，计划部署多达百万颗卫星，2027 年底前实现量产。近地目标为吉瓦级轨道 AI 算力，长期向太瓦级推进。 🔗 查看原文
两部门：到2026年底人形机器人等重点产品完成应用验证并常态部署 — IT之家（RSS） (6小时前) 摘要：工信部、国资委6月8日联合发布通知，目标到2026年底，人形机器人等重点产品在代表性场景完成应用验证并开启常态部署，形成百个以上高价值场景，万台级规模落地。要求各省级地区选取不少于20个场景单元（覆盖两类领域），央企不少于10个。围绕打造实景实训空间、组建创新应用联合体、攻关作业技能、加强验证部署、强化要素保障、凝练经验等六大任务展开，鼓励"人形机器人即服务"等商业创新。 🔗 查看原文
Claude 东京站活动开放注册 — X：Claude (@claudeai) (7小时前) 摘要：最终站：东京。快来注册，直接聆听 Claude 团队分享：http：//claude.com/code-with-claude/tokyo 🔗 查看原文
奥尔特曼宣布 OpenAI 进入第三发展阶段：让 AI 普及、易用且安全 — IT之家（RSS） (9小时前) 摘要：本周一，OpenAI CEO 奥尔特曼与首席科学家帕霍茨基联合发文，宣布公司进入第三发展阶段，目标让 AI 普及、易用且安全。此前第一阶段聚焦通用人工智能技术研发，第二阶段面向全球推出产品。第三阶段三大核心目标是打造自动化人工智能研究员、推动经济提速、为每人配备专属通用人工智能。二人强调智能系统须坚守安全底线，呼吁成立国际机构应对 AI 风险，必要时可暂缓前沿模型研发。同日，OpenAI 秘密提交 IPO 申请，但上市仍需较长时间。上周 Anthropic 研究人员也建议适当放缓前沿 AI 研发。 🔗 查看原文
苹果 WWDC 2026 直播 — Hacker News 热门（buzzing.cc 中文翻译） (13小时前) 摘要：苹果 WWDC 2026 主题演讲通过官网进行直播，Hacker News 用户讨论热度达到 110 点。 🔗 查看原文
受 DMA 影响，Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线 — Apple：Newsroom（RSS） (13小时前) 摘要：由于欧盟《数字市场法案》（DMA），Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区，具体时间未公布。 🔗 查看原文
OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定 — OpenAI：官网动态（RSS · 排除企业/客户案例） (18小时前) 摘要：OpenAI 近日向 SEC 机密提交了 S-1 草案（即首次公开募股注册声明），目前尚未决定上市时间。 🔗 查看原文
生数科技与华策影视达成战略合作，共建AI视听创制中心 — 公众号：生数科技（Vidu·视频） (22小时前) 摘要：6月7日，生数科技与华策影视签署战略合作协议，共同推动AI与影视产业融合。双方将以华策影视科技产教示范区为载体、生数科技Vidu视频生成大模型为技术底座，设立"AI视听创制中心"，探索AI虚拟制作与实拍结合。同时在浙江华策影视学校设立"华策&生数AI影视创制专业"，课程覆盖传统编导剪与AI视频制作技术。内容生产层面推广"实拍+AI"融合方案并优先在华策项目中试点，创作者生态层面引导Vidu社区超级创作者到产教基地注册。 🔗 查看原文

🔬 论文研究

为生物学AI智能体铺路 — Anthropic：Research（发表成果 · 网页） (14小时前) 摘要：一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据，即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后，准确率接近100%。研究指出，当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题，导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键，生物学数据库需为智能体作为规模化用户而设计。 🔗 查看原文
Perplexity与哈佛：AI智能体提效87%降本94% — X：Perplexity (@perplexity_ai) (15小时前) _摘要：我们与哈佛大学发表新研究，关于从聊天界面转向像Computer这样的自主智能体的转变。

超过3个月的研究结果表明，使用Computer的工人在完成任务上比仅使用搜索快87%，成本低94%，且满意度更高。

https：//research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work_ 🔗 查看原文

Reasoning Arena：可验证奖励不足时的迹线锦标赛 — HuggingFace Daily Papers（社区热门论文） (20小时前) 摘要：针对基于可验证奖励的强化学习（RLVR）在组级别奖励无信息时无法提供梯度信号的问题，提出Reasoning Arena自适应训练框架。该框架将非多样化奖励组路由至评判系统，通过迹线锦标赛（trace tournaments）对推理迹线进行头对头比较，转化为相对奖励信号。每个新迹线仅与动态更新的少量锚点比较，然后在不完全比较图上拟合Bradley-Terry模型。在竞赛数学和编程基准上，平均超越RLVR基线7.6%，训练加速27%至41%，节省近50%生成计算量。 🔗 查看原文

💡 技巧与观点

开源工具 Tokei：在菜单栏实时监控 AI coding agent 的 token 用量与成本 — X：Berry Xia (@berryxia) (6小时前) 摘要：Berry Xia 推荐开源工具 Tokei，这是一个 macOS 菜单栏小工具，只读本地日志、零网络调用，30 秒自动刷新，实时监控 Claude Code、Grok CLI、Aider、OpenCode 等 8 个主流 AI coding agent 的 token 用量、实时成本与性能数据，并附每日图表、周热力图和年度 Wrapped。支持私人 Git 多设备同步、价格表本地覆盖，闲置过久会提醒休息。引用推文指出，token 消耗情况可作为深度使用 AI 的面试亮点，数据全程私有，零侵入，无需任何认证。 🔗 查看原文
FrontierCode 基准测试：AI 编程评估新标准--维护者审核通过率最高仅 13.4% — X：阿易 AI Notes (@AYi_AInotes) (7小时前) 摘要：Cognition 发布 FrontierCode 基准测试，重新定义 AI 编程评估：由 20 多位顶级开源维护者手工制作 150 个任务（每个耗时 40+ 小时），依据 3000 多条规则判断维护者是否愿意合并代码。该基准指出 SWE-Bench 等超半数通过测试的代码实为不可维护的垃圾。结果中 Claude Opus 4.8 在最高难度档获 13.4%，GPT-5.5 为 6.3%，其余模型 1%-5%。这意味着即便最强模型，近九成代码仍无法通过有经验维护者审核。 🔗 查看原文
GitHub 122K⭐的Skills推出新技能「Teach」：把工作目录变有状态学习空间 — X：邵猛 (@shao__meng) (7小时前) 摘要：GitHub 122K⭐的Skills仓库推出新技能Teach，可将当前工作目录变为有状态学习空间。设计理念从Knowledge（概念事实）→Skills（动手操作）→Wisdom（真实判断）。工作区以文件即学习状态：MISSION.md定目标、lessons/提供课程、learning-records/记录已会内容、reference/生成速查手册。五个关键机制：Mission定方向、ZPD根据记录调整难度、Lesson一课一事+即时反馈、Learning Record记"会了什么"而非"讲了什么"、Reference形成长期可回看手册。可通过npx skills add mattpocock/skills --skill teach安装，适用于从魔方到软件基础等学习场景。 🔗 查看原文
OpenAI计划到2028年由AI主导研究 — X：Rohan Paul (@rohanpaul_ai) (10小时前) _摘要：Sam Altman关于OpenAI未来路径的新博客称，到2028年3月，其大量研究将由AI完成。

该路径主要有3个目标：构建自动AI研究员，利用它加速科学和生产，然后给每个人一个个人AGI，帮助处理工作、学习、编程、商业、健康文书和决策。_ 🔗 查看原文

Anthropic：AI编码快于生物学的缘由 — X：Anthropic (@AnthropicAI) (13小时前) _摘要：新的科学博客：为什么 AI 在编码方面的进步比在生物学方面更快？

对智能体而言，生物数据库就像汽车发明前建造的城市--开进去会让人抓狂，因为它们是针对不同的交通流量设计的。

我们如何构建智能体可以使用的基础设施？ https：//www.anthropic.com/research/agents-in-biology_ 🔗 查看原文

样本效率黑洞：AI能力背后隐藏的数据需求深渊 — Dwarkesh Patel：Podcast & Blog（RSS） (13小时前) 摘要：将AI比作一个闪耀着能力的星系，其核心存在一个肉眼不可见的巨大黑洞--数据。这个比喻揭示了AI模型惊人能力背后对海量数据的依赖，样本效率的瓶颈如同引力中心，将各色能力凝聚在一起。 🔗 查看原文
Claude Code GA一周年回顾：验证与自动模式 — X：Claude Devs (@ClaudeDevs) (14小时前) _摘要：Claude Code 的第一个演示收到了两个 Slack 反应。

GA 一周年之际，@bcherny 和 @_catwu 回顾：验证最佳实践、为何构建自动模式、例程和循环，以及下一步计划。

https：//www.youtube.com/watch？v=Hth_tLaC2j8_ 🔗 查看原文

OpenRouter Advisor 助小模型问高级模型 — X：OpenRouter (@OpenRouter) (16小时前) _摘要：新服务器工具：Advisor

让较小的模型咨询一个更高智能的"顾问"模型。

帮助它们逃出困境循环，并帮助你迁移到更便宜的模型！🧵_ 🔗 查看原文

Hivemind推出面向AI编程智能体的持续学习功能，即日起开放 — X：Kim (@kimmonismus) (16小时前) 摘要：Hivemind发布面向AI编程智能体的持续学习功能，即日起开放。该工具收集团队运行的每个智能体（Claude Code、Codex、Cursor、Hermes、Pi）的轨迹，转化为可复用技能并推送到所有智能体，数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练：Claude Code准确率提升+19.1分，Codex提升+24.8分，在全部52个测试设置中最佳或持平。开源，一行命令安装。 🔗 查看原文
微软AI CEO：超级智能即将到来，但不会取代你的工作 — The Verge：AI（RSS） (18小时前) 摘要：微软AI CEO Mustafa Suleyman在Decoder访谈中表示，超级智能即将到来，但不会导致大规模失业。他透露微软与OpenAI于去年10月签署新合同，巩固合作关系的同时，微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型，并于本周Build大会上发布7个全模态新模型。他批评Anthropic将Claude描述为有意识的做法，认为消费者产品需要足够好才能克服公众对AI的负面情绪。 🔗 查看原文
小互开源视频翻译工具：一句话自动下载、转写、翻译、烧字幕 — X：小互 (@xiaohu) (18小时前) 摘要：小互（@xiaohu）开源视频翻译工具（xiaohu-video-translate），只需说一句"把链接翻译成中文字幕视频"即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行，不花API费。支持YouTube、Bilibili、抖音等链接及本地文件，英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳，按语义断句，每行不超过12字，双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成，可单独或串联使用，适配Claude Code、Codex、OpenClaw等AI编程工具。已开源，附安装指南。 🔗 查看原文
五个模型经济体中消失的崩溃：控制与涌现 — Hugging Face：Blog（RSS） (18小时前) 摘要：用五个不同实验室的AI模型（OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型）各自驱动一个智能体构建经济市场，试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积，导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格，使崩溃成为设计事实。实验表明，AI智能体的涌现行为是偶然的而非稳健的，有效系统需在涌现纹理与确定性控制之间找到精确接缝。 🔗 查看原文
Pakistan Notice Helper：一款面向本地安全问题的轻量 AI 工具 — Hugging Face：Blog（RSS） (20小时前) 摘要：Pakistan Notice Helper 是一款安全工具，帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入，返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语，乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型（通过 llama.cpp + CUDA），在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B（质量高但成本高）和 MiniCPM-V 4.6 Q8（速度慢且不稳定），最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。 🔗 查看原文
Agent 辅助开发，一站式打通 Qwen3-VL Android 端侧推理 — 公众号：通义实验室（千问） (22小时前) 摘要：通义实验室教程演示了如何用 Agent（Qoder）辅助完成 Qwen3-VL-2B 模型在 Android 端侧的全流程部署。操作包括：检查 JDK 21、NDK 27、CMake 3.18.1 等环境；创建 arm64-v8a 的 Native C++ 工程（minSdk 29、compileSdk 35）；通过 ModelScope CLI 下载约 1.4GB 的 MNN/Qwen3-VL-2B-Instruct-MNN 模型；编译开启 LLM 视觉支持（MNN_BUILD_LLM、LLM_SUPPORT_VISION）的 libMNN.so；构建 APK 并推送模型至手机私有目录。最终 App 提供图文推理页面，输出 MNN 版本（v3.5.0）、ABI 及推理指标。所有繁琐步骤均可由 Agent 自动执行。 🔗 查看原文
微信AI Agent生态曝光：嵌入小程序调用与手机厂商合作 — 公众号：数字生命卡兹克 (22小时前) 摘要：腾讯正测试嵌入微信的AI Agent，用户右滑唤出对话窗口，通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力，可通过手机语音助理发起微信音视频通话或发送消息。6月8日，微信官方发布《关于开发者接入微信AI生态的指引》，提供自动接入模式，利用微信沙箱全自动改造小程序，使其可被AI直接调用。这一布局被视为Agentic Commerce（代理式交易）的雏形。 🔗 查看原文
邵猛开源 Brand to DESIGN.md 技能，提醒复刻易生新"AI Slop" — X：邵猛 (@shao__meng) (23小时前) 摘要：邵猛关注 Design Skill、Taste Skill、Anti-AI-slop design skill，并开源 Brand to DESIGN.md Skill（GitHub： shaom/brand-to-design-md-skill），让 Agent 学习设计品味后复刻网站。但他指出，这种复刻看多了反而从 Anti-AI-slop 衍生新"AI Slop"，缺少设计精髓，仅皮毛相仿。 🔗 查看原文

参与讨论

返回文章列表