AI HOT 日报 · 2026年06月09日
🚀 模型发布/更新
- 小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s — 公众号:小米 MiMo (4小时前) 摘要:小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens);系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放(2026 年 6 月 9 日至 23 日),定价为 MiMo-V2.5-Pro 的 3 倍,速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。 🔗 查看原文
- VoxCPM2 技术报告发布 — X:面壁智能 OpenBMB (@OpenBMB) (17小时前) 摘要:面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。 🔗 查看原文
🛠️ 产品发布/更新
- Apple Core AI 框架 — Hacker News 热门(buzzing.cc 中文翻译) (8小时前) 摘要:一篇关于 Apple Core AI 框架的 Hacker News 帖子获得 109 个点赞。帖子内容包含一张苹果开发者 OG 图片和一个指向 Apple Core AI Framework 官方文档的链接(developer.apple.com)。该帖子由 buzzing.cc 中文翻译,发布于 2026 年 6 月 8 日 02:47(UTC)。 🔗 查看原文
- Claude 支持 Apple Foundation Models 框架,推出新 Swift 包 — Claude:Blog(网页) (9小时前) 摘要:Anthropic 通过一个新 Swift 包,让 Apple 开发者能在 Foundation Models 框架中直接调用 Claude。开发者用 Apple 框架以原生 Swift 方式,仅需三行代码即可通过引导生成返回类型化 Swift 值。当请求涉及多步推理、代码生成、联网搜索或数据分析时,Claude 可接手处理,并将流式响应传回同一视图。该支持可在 iOS 27、iPadOS 27、macOS 27、visionOS 27 和 watchOS 27 上使用,开发者需添加包并配置 Anthropic API 密钥。 🔗 查看原文
- Viggle API 上线:任意角色任意动作秒级生成 — X:Viggle AI (@ViggleAI) (11小时前) _摘要:推出 Viggle API。
给任意角色添加任意动作,一次 API 调用--数秒内即可激活。
可接入 Claude、Codex 或你正在构建的任何智能体。起价 $0.01/秒。
注册即获 100 次免费额度。
转发 + 关注 + 评论,10 位中奖者再获 100 次!
了解更多👇_ 🔗 查看原文
- Claude 为 Connector 开发者推出性能监控仪表盘 — Claude:Blog(网页) (13小时前) 摘要:Claude 为目录中已发布的 Connector 新增性能监控仪表盘(公开测试版)。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因;还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号(Admin/Owner 权限或自定义角色)。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录,该目录已有超 300 个第三方 Connector,每日被数百万人使用。 🔗 查看原文
- Apple发布新一代Apple Intelligence和Siri AI — Apple:Newsroom(RSS) (13小时前) 摘要:今天Apple预览了即将推出的软件版本,将带来新一代Apple Intelligence和Siri AI。 🔗 查看原文
- Apple Intelligence 将强大 AI 能力融入日常体验 — Apple:Newsroom(RSS) (13小时前) 摘要:Apple 发布下一代 Apple Intelligence,将 AI 能力集成到 iPhone、iPad 和 Mac 中,带来更个性化和有帮助的日常体验。 🔗 查看原文
- ChatGPT 新增数据图表生成功能 — X:ChatGPT (@ChatGPTapp) (15小时前) _摘要:将数据和比较转化为图表,直接在 ChatGPT 中完成。
现已支持移动端和网页端。_ 🔗 查看原文
- NotebookLM重大升级:智能体能力与高级推理 — X:NotebookLM (@NotebookLM) (15小时前) _摘要:推出更强大的 NotebookLM 🚀
重大升级带来了对话中的智能体能力、更高级的推理以及一系列新的输出格式。处理复杂的多步骤研究问题从未如此简单。
现已面向 Google AI Ultra 订阅者推出。_ 🔗 查看原文
- Runway Aleph 2.0 编辑模型:一键适配任意视频格式 — X:Runway (@runwayml) (16小时前) _摘要:一个视频,现在可以为每个信息流和格式制作。上传你现有的视频,选择你想要的宽高比,然后观看我们的编辑模型 Aleph 2.0,填充场景的其余部分,就像你从一开始就这样制作一样。
在我们的桌面 Web 应用上尝试,链接如下。_ 🔗 查看原文
- Kimi Code 焕新升级(附视频教程) — 公众号:月之暗面(Kimi) (18小时前) 摘要:Kimi Code 开源 Coding Agent 迎来大版本升级:一行命令安装,毫秒级启动;新增视频理解能力,支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码;集成同花顺、天眼查等权威数据源,可查询股票价格、财报、学术论文;支持 ACP 协议,可在 JetBrains、Zed 中使用;丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。 🔗 查看原文
- EU AI Act 合规:面向 AI 智能体的人工监督 — OpenRouter:Announcements(RSS) (20小时前) 摘要:使用智能体 SDK 的人机协作(HITL)工具,可满足 EU AI Act、Colorado AI Act 和 NIST AI RMF 对 AI 智能体的合规要求。 🔗 查看原文
- 微信AI官宣内测:两种接入模式供开发者选择 — IT之家(RSS) (23小时前) 摘要:微信开发者官方今日发布指引,确认微信AI正在内测阶段。开放平台提供两种接入模式:自动模式可授权平台读取小程序源码,无需额外开发即可让微信AI直接操作页面;开发模式下开发者可自主开发技能,审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手,用户通过自然语言对话即可调用、访问和操作小程序。服务条款称"微信AI"可能非最终名称。接入与否不影响现有小程序服务。 🔗 查看原文
📈 行业动态
- AI 编程独角兽 Cursor 欧洲总部落子伦敦,SpaceX 手握 600 亿美元收购选择权 — IT之家(RSS) (2小时前) 摘要:Cursor 将欧洲总部设在伦敦,计划招聘约 200 名员工,并在巴黎、慕尼黑等地开设小型办事处。SpaceX 拥有以 600 亿美元收购 Cursor 的选择权,或支付 100 亿美元开展全新合作。Cursor 目前 B2B 年化营收约 26 亿美元,客户包括英国航空、英国石油、诺基亚等。公司强调数据留存欧洲本地以满足监管合规,其平台支持用户用自然语言生成代码,主打模型中立,竞争对手包括 GitHub Copilot、OpenAI 和谷歌的同类产品。 🔗 查看原文
- OpenAI 秘密提交 IPO 申请,奥特曼旗下 Tools for Humanity 裁员 — IT之家(RSS) (5小时前) 摘要:OpenAI 近日秘密提交 IPO 申请。其 CEO 山姆·奥特曼旗下的 Tools for Humanity 公司正裁员,该公司因虹膜扫描项目 World 及加密货币 Worldcoin 知名,投后估值 25 亿美元,获 Andreessen Horowitz 等投资。因营收困境,公司缩减规模。海外监管方面,肯尼亚以隐私和金融风险为由叫停运营,韩国因违反隐私法规罚款 83 万美元。 🔗 查看原文
- Elon Musk 详解 SpaceX AI1 轨道 AI 数据中心卫星方案 — X:Rohan Paul (@rohanpaul_ai) (5小时前) 摘要:Elon Musk 首次详细解释 SpaceX 的 AI1 轨道 AI 数据中心卫星:峰值功率 150 kW,持续计算功率约 120 kW,相当于一个 NVIDIA GB300 机架;太阳能板效率 250 W/m2;双面散热器排热 1,400 W/m2。通过激光链路实现约 1 Tbps 互联,低轨 600-800 km 高度往返延迟 6-8 ms。由 Starship 发射,计划部署多达百万颗卫星,2027 年底前实现量产。近地目标为吉瓦级轨道 AI 算力,长期向太瓦级推进。 🔗 查看原文
- 两部门:到2026年底人形机器人等重点产品完成应用验证并常态部署 — IT之家(RSS) (6小时前) 摘要:工信部、国资委6月8日联合发布通知,目标到2026年底,人形机器人等重点产品在代表性场景完成应用验证并开启常态部署,形成百个以上高价值场景,万台级规模落地。要求各省级地区选取不少于20个场景单元(覆盖两类领域),央企不少于10个。围绕打造实景实训空间、组建创新应用联合体、攻关作业技能、加强验证部署、强化要素保障、凝练经验等六大任务展开,鼓励"人形机器人即服务"等商业创新。 🔗 查看原文
- Claude 东京站活动开放注册 — X:Claude (@claudeai) (7小时前) 摘要:最终站:东京。 快来注册,直接聆听 Claude 团队分享:http://claude.com/code-with-claude/tokyo 🔗 查看原文
- 奥尔特曼宣布 OpenAI 进入第三发展阶段:让 AI 普及、易用且安全 — IT之家(RSS) (9小时前) 摘要:本周一,OpenAI CEO 奥尔特曼与首席科学家帕霍茨基联合发文,宣布公司进入第三发展阶段,目标让 AI 普及、易用且安全。此前第一阶段聚焦通用人工智能技术研发,第二阶段面向全球推出产品。第三阶段三大核心目标是打造自动化人工智能研究员、推动经济提速、为每人配备专属通用人工智能。二人强调智能系统须坚守安全底线,呼吁成立国际机构应对 AI 风险,必要时可暂缓前沿模型研发。同日,OpenAI 秘密提交 IPO 申请,但上市仍需较长时间。上周 Anthropic 研究人员也建议适当放缓前沿 AI 研发。 🔗 查看原文
- 苹果 WWDC 2026 直播 — Hacker News 热门(buzzing.cc 中文翻译) (13小时前) 摘要:苹果 WWDC 2026 主题演讲通过官网进行直播,Hacker News 用户讨论热度达到 110 点。 🔗 查看原文
- 受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线 — Apple:Newsroom(RSS) (13小时前) 摘要:由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。 🔗 查看原文
- OpenAI 向 SEC 机密提交 S-1 草案,上市时间未定 — OpenAI:官网动态(RSS · 排除企业/客户案例) (18小时前) 摘要:OpenAI 近日向 SEC 机密提交了 S-1 草案(即首次公开募股注册声明),目前尚未决定上市时间。 🔗 查看原文
- 生数科技与华策影视达成战略合作,共建AI视听创制中心 — 公众号:生数科技(Vidu·视频) (22小时前) 摘要:6月7日,生数科技与华策影视签署战略合作协议,共同推动AI与影视产业融合。双方将以华策影视科技产教示范区为载体、生数科技Vidu视频生成大模型为技术底座,设立"AI视听创制中心",探索AI虚拟制作与实拍结合。同时在浙江华策影视学校设立"华策&生数AI影视创制专业",课程覆盖传统编导剪与AI视频制作技术。内容生产层面推广"实拍+AI"融合方案并优先在华策项目中试点,创作者生态层面引导Vidu社区超级创作者到产教基地注册。 🔗 查看原文
🔬 论文研究
- 为生物学AI智能体铺路 — Anthropic:Research(发表成果 · 网页) (14小时前) 摘要:一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后,准确率接近100%。研究指出,当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题,导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键,生物学数据库需为智能体作为规模化用户而设计。 🔗 查看原文
- Perplexity与哈佛:AI智能体提效87%降本94% — X:Perplexity (@perplexity_ai) (15小时前) _摘要:我们与哈佛大学发表新研究,关于从聊天界面转向像Computer这样的自主智能体的转变。
超过3个月的研究结果表明,使用Computer的工人在完成任务上比仅使用搜索快87%,成本低94%,且满意度更高。
https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work_ 🔗 查看原文
- Reasoning Arena:可验证奖励不足时的迹线锦标赛 — HuggingFace Daily Papers(社区热门论文) (20小时前) 摘要:针对基于可验证奖励的强化学习(RLVR)在组级别奖励无信息时无法提供梯度信号的问题,提出Reasoning Arena自适应训练框架。该框架将非多样化奖励组路由至评判系统,通过迹线锦标赛(trace tournaments)对推理迹线进行头对头比较,转化为相对奖励信号。每个新迹线仅与动态更新的少量锚点比较,然后在不完全比较图上拟合Bradley-Terry模型。在竞赛数学和编程基准上,平均超越RLVR基线7.6%,训练加速27%至41%,节省近50%生成计算量。 🔗 查看原文
💡 技巧与观点
- 开源工具 Tokei:在菜单栏实时监控 AI coding agent 的 token 用量与成本 — X:Berry Xia (@berryxia) (6小时前) 摘要:Berry Xia 推荐开源工具 Tokei,这是一个 macOS 菜单栏小工具,只读本地日志、零网络调用,30 秒自动刷新,实时监控 Claude Code、Grok CLI、Aider、OpenCode 等 8 个主流 AI coding agent 的 token 用量、实时成本与性能数据,并附每日图表、周热力图和年度 Wrapped。支持私人 Git 多设备同步、价格表本地覆盖,闲置过久会提醒休息。引用推文指出,token 消耗情况可作为深度使用 AI 的面试亮点,数据全程私有,零侵入,无需任何认证。 🔗 查看原文
- FrontierCode 基准测试:AI 编程评估新标准--维护者审核通过率最高仅 13.4% — X:阿易 AI Notes (@AYi_AInotes) (7小时前) 摘要:Cognition 发布 FrontierCode 基准测试,重新定义 AI 编程评估:由 20 多位顶级开源维护者手工制作 150 个任务(每个耗时 40+ 小时),依据 3000 多条规则判断维护者是否愿意合并代码。该基准指出 SWE-Bench 等超半数通过测试的代码实为不可维护的垃圾。结果中 Claude Opus 4.8 在最高难度档获 13.4%,GPT-5.5 为 6.3%,其余模型 1%-5%。这意味着即便最强模型,近九成代码仍无法通过有经验维护者审核。 🔗 查看原文
- GitHub 122K⭐的Skills推出新技能「Teach」:把工作目录变有状态学习空间 — X:邵猛 (@shao__meng) (7小时前) 摘要:GitHub 122K⭐的Skills仓库推出新技能Teach,可将当前工作目录变为有状态学习空间。设计理念从Knowledge(概念事实)→Skills(动手操作)→Wisdom(真实判断)。工作区以文件即学习状态:MISSION.md定目标、lessons/提供课程、learning-records/记录已会内容、reference/生成速查手册。五个关键机制:Mission定方向、ZPD根据记录调整难度、Lesson一课一事+即时反馈、Learning Record记"会了什么"而非"讲了什么"、Reference形成长期可回看手册。可通过npx skills add mattpocock/skills --skill teach安装,适用于从魔方到软件基础等学习场景。 🔗 查看原文
- OpenAI计划到2028年由AI主导研究 — X:Rohan Paul (@rohanpaul_ai) (10小时前) _摘要:Sam Altman关于OpenAI未来路径的新博客称,到2028年3月,其大量研究将由AI完成。
该路径主要有3个目标:构建自动AI研究员,利用它加速科学和生产,然后给每个人一个个人AGI,帮助处理工作、学习、编程、商业、健康文书和决策。_ 🔗 查看原文
- Anthropic:AI编码快于生物学的缘由 — X:Anthropic (@AnthropicAI) (13小时前) _摘要:新的科学博客:为什么 AI 在编码方面的进步比在生物学方面更快?
对智能体而言,生物数据库就像汽车发明前建造的城市--开进去会让人抓狂,因为它们是针对不同的交通流量设计的。
我们如何构建智能体可以使用的基础设施? https://www.anthropic.com/research/agents-in-biology_ 🔗 查看原文
- 样本效率黑洞:AI能力背后隐藏的数据需求深渊 — Dwarkesh Patel:Podcast & Blog(RSS) (13小时前) 摘要:将AI比作一个闪耀着能力的星系,其核心存在一个肉眼不可见的巨大黑洞--数据。这个比喻揭示了AI模型惊人能力背后对海量数据的依赖,样本效率的瓶颈如同引力中心,将各色能力凝聚在一起。 🔗 查看原文
- Claude Code GA一周年回顾:验证与自动模式 — X:Claude Devs (@ClaudeDevs) (14小时前) _摘要:Claude Code 的第一个演示收到了两个 Slack 反应。
GA 一周年之际,@bcherny 和 @_catwu 回顾:验证最佳实践、为何构建自动模式、例程和循环,以及下一步计划。
https://www.youtube.com/watch?v=Hth_tLaC2j8_ 🔗 查看原文
- OpenRouter Advisor 助小模型问高级模型 — X:OpenRouter (@OpenRouter) (16小时前) _摘要:新服务器工具:Advisor
让较小的模型咨询一个更高智能的"顾问"模型。
帮助它们逃出困境循环,并帮助你迁移到更便宜的模型!🧵_ 🔗 查看原文
- Hivemind推出面向AI编程智能体的持续学习功能,即日起开放 — X:Kim (@kimmonismus) (16小时前) 摘要:Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。 🔗 查看原文
- 微软AI CEO:超级智能即将到来,但不会取代你的工作 — The Verge:AI(RSS) (18小时前) 摘要:微软AI CEO Mustafa Suleyman在Decoder访谈中表示,超级智能即将到来,但不会导致大规模失业。他透露微软与OpenAI于去年10月签署新合同,巩固合作关系的同时,微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型,并于本周Build大会上发布7个全模态新模型。他批评Anthropic将Claude描述为有意识的做法,认为消费者产品需要足够好才能克服公众对AI的负面情绪。 🔗 查看原文
- 小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕 — X:小互 (@xiaohu) (18小时前) 摘要:小互(@xiaohu)开源视频翻译工具(xiaohu-video-translate),只需说一句"把链接翻译成中文字幕视频"即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行,不花API费。支持YouTube、Bilibili、抖音等链接及本地文件,英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超过12字,双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex、OpenClaw等AI编程工具。已开源,附安装指南。 🔗 查看原文
- 五个模型经济体中消失的崩溃:控制与涌现 — Hugging Face:Blog(RSS) (18小时前) 摘要:用五个不同实验室的AI模型(OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型)各自驱动一个智能体构建经济市场,试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积,导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格,使崩溃成为设计事实。实验表明,AI智能体的涌现行为是偶然的而非稳健的,有效系统需在涌现纹理与确定性控制之间找到精确接缝。 🔗 查看原文
- Pakistan Notice Helper:一款面向本地安全问题的轻量 AI 工具 — Hugging Face:Blog(RSS) (20小时前) 摘要:Pakistan Notice Helper 是一款安全工具,帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入,返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语,乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型(通过 llama.cpp + CUDA),在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B(质量高但成本高)和 MiniCPM-V 4.6 Q8(速度慢且不稳定),最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。 🔗 查看原文
- Agent 辅助开发,一站式打通 Qwen3-VL Android 端侧推理 — 公众号:通义实验室(千问) (22小时前) 摘要:通义实验室教程演示了如何用 Agent(Qoder)辅助完成 Qwen3-VL-2B 模型在 Android 端侧的全流程部署。操作包括:检查 JDK 21、NDK 27、CMake 3.18.1 等环境;创建 arm64-v8a 的 Native C++ 工程(minSdk 29、compileSdk 35);通过 ModelScope CLI 下载约 1.4GB 的 MNN/Qwen3-VL-2B-Instruct-MNN 模型;编译开启 LLM 视觉支持(MNN_BUILD_LLM、LLM_SUPPORT_VISION)的 libMNN.so;构建 APK 并推送模型至手机私有目录。最终 App 提供图文推理页面,输出 MNN 版本(v3.5.0)、ABI 及推理指标。所有繁琐步骤均可由 Agent 自动执行。 🔗 查看原文
- 微信AI Agent生态曝光:嵌入小程序调用与手机厂商合作 — 公众号:数字生命卡兹克 (22小时前) 摘要:腾讯正测试嵌入微信的AI Agent,用户右滑唤出对话窗口,通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力,可通过手机语音助理发起微信音视频通话或发送消息。6月8日,微信官方发布《关于开发者接入微信AI生态的指引》,提供自动接入模式,利用微信沙箱全自动改造小程序,使其可被AI直接调用。这一布局被视为Agentic Commerce(代理式交易)的雏形。 🔗 查看原文
- 邵猛开源 Brand to DESIGN.md 技能,提醒复刻易生新"AI Slop" — X:邵猛 (@shao__meng) (23小时前) 摘要:邵猛关注 Design Skill、Taste Skill、Anti-AI-slop design skill,并开源 Brand to DESIGN.md Skill(GitHub: shaom/brand-to-design-md-skill),让 Agent 学习设计品味后复刻网站。但他指出,这种复刻看多了反而从 Anti-AI-slop 衍生新"AI Slop",缺少设计精髓,仅皮毛相仿。 🔗 查看原文