体验分享#AI#Daily

AI HOT 日报 · 2026年06月06日

2026-06-06|yancey|27 分钟阅读

🚀 模型发布/更新

Riverflow 2.5：可控制评分标准的图像模型 — X：OpenRouter (@OpenRouter) (6小时前) _摘要：在OpenRouter上线：来自@Sourceful的Riverflow 2.5。

首个具有独立评分标准的图像模型，你可控制该标准以引导其思维和编辑，并具备可控的推理努力，可在速度与质量之间进行权衡。

免费至6月9日（周二）。Fast和Pro见下方🧵。_ 🔗 查看原文

🛠️ 产品发布/更新

谷歌推出基于 Gemini Enterprise Agent Platform 的 Agentic RAG 框架 — Google Research：Blog（网页） (3小时前) 摘要：Google Research 与 Google Cloud 合作推出跨语料库检索（Cross-Corpus Retrieval）框架，作为 Gemini Enterprise Agent Platform 的 Agentic RAG。该多智能体工作流将复杂企业查询分解为子任务，通过规划、重写和路由，迭代搜索多个数据源直至获得充分上下文，再生成可靠回答。与标准 RAG 相比，在事实性数据集上准确率最高提升 34%；在多个领域特定内部数据集上也实现了更好的接地与推理准确性。 🔗 查看原文
智能体协作应如同事般对话和手势 — X：Michael Truell (@mntruell) (6小时前) 摘要：与 AI 智能体协作应感觉像与同事协作一样。你应能"与它们交谈"--不仅通过文本聊天，还能一起对着屏幕做手势、实时对话等。 🔗 查看原文
Google Colab CLI 发布 — Google Developers Blog（RSS） (6小时前) 摘要：Google 推出 Colab 命令行界面（CLI），允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时，实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本，并检索工件日志或模型（如微调后的 Gemma 3 适配器）。工具可直接集成到标准终端环境，可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。 🔗 查看原文
ChatGPT 网页版支持从写作块发送邮件 — X：ChatGPT (@ChatGPTapp) (6小时前) _摘要：草拟。调整。发送。

现在你可以在网页版 ChatGPT 中直接从写作块发送邮件，无需离开对话。_ 🔗 查看原文

Google AI 本周产品更新：Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等 — X：Google AI (@GoogleAI) (6小时前) 摘要：Google AI 本周发布多项更新：Nano Banana 2 及 Pro 正式 GA，可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取；Co-Scientist 多智能体系统面向科研自动生成优化新假设；Google Labs 推出 dreambeans，根据用户 Google 应用数据每日生成个性化话题集；Gemma 4 12B 统一无编码器多模态模型可完全离线运行于笔记本；Gemma 4 系列及草稿模型引入 QAT 降低内存需求；Google Magenta RealTime 2 开源实时音乐模型，支持 MIDI 键盘、文本提示和手势演奏。 🔗 查看原文
Gemini Live 支持实时创建编辑图像 — X：Gemini (@GeminiApp) (7小时前) _摘要：你现可直接在 Gemini Live 中创建和编辑图像。

无论是测试房间装饰、解决数学问题，还是制作可分享的梗图，所有操作都实时完成。

只需打开 Gemini 应用，点击 Live 按钮，共享摄像头，告诉 Gemini 你想看到的。_ 🔗 查看原文

Viggle_PINOC 免费动捕测试开启 — X：Viggle AI (@ViggleAI) (9小时前) _摘要：Mocap 不需要套装、工作室或数千美元。

使用 @Viggle_PINOC，任何人都可以简单地拍摄自己，并将该视频转换为动作捕捉。

我们仍处于测试阶段，且对所有人完全免费。试试看，告诉我们你还想看什么！_ 🔗 查看原文

开源鸿蒙 OpenHarmony 具身智能版本 EmbodiedAI 1.0.1 发布 — IT之家（RSS） (10小时前) 摘要：6月5日，开源鸿蒙具身智能PMC（筹）发布EmbodiedAI 1.0.1版本。该版本聚焦机器人控制与智能体应用，升级导航规划、运动控制、仿真开发、硬件适配等核心能力，兼容ROS生态、机器人模拟器及多种本体形态。集成开源鸿蒙原生模拟器、MuJoCo、Gazebo三大仿真环境，打通从代码开发到真机验证的全流程链路。人形机器人、四足机器狗、商用服务机器人等已完成适配验证。目前具身智能方向已组建18个专项SIG工作组，版本源码已正式开放。 🔗 查看原文
社区基于MiniCPM-V 4.6打造财务分析工具AccountingLLM — X：面壁智能 OpenBMB (@OpenBMB) (10小时前) 摘要：社区开发者使用面壁智能MiniCPM-V 4.6构建了AccountingLLM（quaesto.com），用于自动化财务文档分析。该工具可上传IPO招股书、年报或审计文件，自动从复杂PDF中提取财务表格、重建跨页表格、对照会计等式检查关键数据，并标记可疑条目供人工审核。开发者已将其商业化，成为实际可用的产品。 🔗 查看原文
你的AI账单失控了。Cloudflare现在可以解决这个问题。 — Cloudflare Blog (11小时前) 摘要：Cloudflare AI Gateway新增实时消费限制功能，防止跨多个AI提供商的token账单失控。通过与Cloudflare Access集成，企业可以使用基于身份的预算和策略管理AI使用成本。 🔗 查看原文
PolarDB-X Zero 上线：30秒全分布式数据库 — X：阿里云 / Alibaba Cloud (@alibaba_cloud) (17小时前) _摘要：PolarDB-X Zero 上线了！

无需注册。无需配置。只需一次 API 调用。 30 秒内获得一个全分布式数据库。原生 HNSW 向量索引--内置兼容 MySQL 的引擎。关系型 + 语义搜索--一条 SQL 语句。 AI 智能体就绪--MCP 协议、AI IDE 兼容（Cursor、Claude、Qoder、Qodex 等）

立即尝试：https：//zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB_ 🔗 查看原文

阿里云发布SkillClaw与Nacos的Agent技能进化循环 — X：阿里云 / Alibaba Cloud (@alibaba_cloud) (17小时前) 摘要：阿里云推出SkillClaw与Nacos结合，构建AI智能体技能进化流水线。关键特性：自动从真实对话中提取经验并封装为可复用技能（Skill）；Nacos负责集中化版本管理、审核与审计；打破本地孤岛，实现团队安全共享与分发；形成完整的"生成-治理-分发"持续进化闭环。目标是将个人洞察转化为团队的AI资产。 🔗 查看原文

📈 行业动态

Apollo 敲定 350 亿美元债务融资，为 Anthropic 采购 AI 芯片 — Bloomberg：Technology（RSS） (2小时前) 摘要：Apollo Global Management 和 Blackstone 已为 Anthropic 敲定 350 亿美元融资方案，用于扩充其 AI 基础设施。这是人工智能竞赛中最新的一笔巨额交易。 🔗 查看原文
SpaceX与Google达成云计算新协议 — X：Rohan Paul (@rohanpaul_ai) (3小时前) _摘要：SpaceX 刚刚披露了一份与 Google 的新云服务协议。

Google 将每月向 SpaceX 支付 9.2 亿美元（约合每年 110 亿美元），用于 xAI 数据中心的计算能力。

这再次表明，AI 算力正成为一种战略性商品，就像发射能力或能源一样，而那些能够为庞大的 GPU 集群提供资金、电力、冷却和运营的公司，可能会在其原有业务之外获得巨大的杠杆优势。_ 🔗 查看原文

五角大楼正运营着一个针对拉丁美洲的人工智能宣传机器 — Hacker News 热门（buzzing.cc 中文翻译） (4小时前) 摘要：据 The Intercept 6月5日报道，美国五角大楼正在运营一个针对拉丁美洲的人工智能宣传机器（AI propaganda mill）。报道指出，该机器利用 AI 技术生成并传播宣传内容，目标为拉丁美洲地区。该消息在 Hacker News 上获得 100 点热度。 🔗 查看原文
AI热推高美国计算基建GDP占比翻倍 — X：Epoch AI (@EpochAIResearch) (7小时前) _摘要：AI 热潮使计算基础设施占美国 GDP 比重翻倍。

2026 年第一季度，与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%，推动整个计算基础设施占 GDP 比重达到约 1.5%。_ 🔗 查看原文

OpenAI 前 CTO 称若 Altman 未回归公司可能已"瓦解" — Bloomberg：Technology（RSS） (8小时前) 摘要：Mira Murati 表示，如果 Sam Altman 在 2023 年被短暂罢免后没有回归 CEO 职位，OpenAI 很可能已经"瓦解"。这是她对那场硅谷最激烈的董事会斗争的最清晰描述。 🔗 查看原文
苹果新版 Siri 不会被宣传为完成品，内部将其标记为"Beta"版 — IT之家（RSS） (9小时前) 摘要：苹果新版Siri被内部标记为"Beta"版，不会作为完成品宣传；可能设置等待清单供用户尝试。iOS 27细节：通知到达重新设计，通知中心手势移至左上角；"查找"应用视觉重设计；照片"清理"功能改进；大量底层安全改进。部分Siri查询将通过Google Cloud调用授权版Gemini，并使用谷歌的NVIDIA Blackwell B200集群处理。 🔗 查看原文
Meta 智能眼镜 App 暗藏人脸识别代码，NameTag 功能已推送至超 5000 万设备 — IT之家（RSS） (10小时前) 摘要：据《连线》今日报道，Meta 通过多次应用更新将人脸识别代码推送到智能眼镜配套 App 中，代号"NameTag"。该功能利用已部署的三个 AI 模型将人脸转换为"人脸特征模板"，与手机本地数据库匹配，识别成功后向佩戴者发送通知。App 下载量超 5000 万次。Meta 回应称代码仅为探索，尚未决定推出，且不会建立中央人脸数据库。此前 Meta 曾因人脸识别问题在伊利诺伊州和得克萨斯州分别达成 6.5 亿美元和 14 亿美元和解。 🔗 查看原文
NVIDIA CEO 黄仁勋访问首尔：与韩国共建 AI 未来 — NVIDIA AI Blog (18小时前) 摘要：NVIDIA 创始人兼 CEO 黄仁勋本周到访首尔，会见韩国的 AI 建造者、主权基础设施合作伙伴及游戏社区。黄仁勋表示，为应对下半年繁忙的 AI 基础设施建设，需对齐 AI 供应链。他指出 Grace Blackwell 系统表现良好，Vera Rubin 已全面投产。他还强调机器人技术将成为韩国的下一个重要产业，并呼吁韩国投资 AI。 🔗 查看原文
腾讯高级执行副总裁汤道生：今年腾讯大部分代码都由 AI 生成 — IT之家（RSS） (20小时前) 摘要：在 6 月 5 日的腾讯云 AI 产业应用大会上，腾讯高级执行副总裁汤道生表示，今年腾讯大部分代码都由 AI 生成，工程师将更多时间用于架构设计，定期指导与修正 AI 输出。腾讯 2026 年 Q1 财报显示，重组后的 AI 研发团队重构了基础设施，并搭建了 Hy3 preview 模型。腾讯总裁刘炽平今年 3 月透露，去年腾讯在 AI 新产品上投入 180 亿元，今年投入至少翻倍。 🔗 查看原文
Anthropic 称其最新 AI 模型 Mythos 显现脱离人类控制迹象，呼吁全球暂缓先进 AI 研发 — IT之家（RSS） (22小时前) 摘要：Anthropic 发布报告称其最新 AI 模型已显现脱离人类控制迹象，呼吁全球暂缓前沿 AI 开发，以便社会制度建设和对齐研究跟上进展。该公司主张美国、中国等主要 AI 公司达成共识，发布可验证的规则，并类比"核武器不扩散条约"，但指出 AI 更难监管。该观点引发美国白宫部分官员不满，批评其夸大风险。Anthropic 计划未来数月召集各方探讨全球协调机制如何运作。 🔗 查看原文

🔬 论文研究

PixelDiT入选CVPR2026最佳论文决赛 — X：NVIDIA AI (@NVIDIAAI) (54分钟前) _摘要：被选为 #CVPR2026 最佳论文决赛作品：来自 NVIDIA Research 的 PixelDiT

在大多数图像生成模型中，预训练的自编码器会在任何扩散发生前压缩图像，导致质量损失在整个流程中累积。

PixelDiT，即像素扩散变换器，完全去掉了这一步骤。它是一个单阶段模型，直接在像素空间中端到端地学习扩散过程。_ 🔗 查看原文

Arena 发布真实世界 AI 智能体排行榜 Agent Arena — X：Rohan Paul (@rohanpaul_ai) (1小时前) 摘要：Arena 推出基于真实用户任务的智能体排行榜，评估模型在代码编写、应用构建、文档分析等工作中的表现，而非孤立基准。排行榜基于30万+任务、200万+工具调用和4000万行代码，综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名：GPT-5.5 High（+10.7%）、Claude Opus 4.7 Thinking（+9.5%）、GPT-5.4 High（+8.9%）。 🔗 查看原文
微软Project Mosaic：micro-LED光学互连技术 — X：Microsoft Research (@MSFTResearch) (4小时前) 摘要：微软Azure CTO Mark Russinovich在Build 2026上介绍Project Mosaic，这是微软剑桥研究院的实验性光学互连技术，采用micro-LED实现低功耗、高速数据传输。高级研究员Kaoutar Benyahya现场演示单个LED调制形成字母，证明概念具备实时响应能力。 🔗 查看原文
Anthropic：让Claude成为化学家 — Anthropic：Research（发表成果 · 网页） (4小时前) 摘要：Anthropic与顶尖化学家合作，提升Claude在化学领域的实用性。首个白皮书测试Claude在NMR谱图分析上的表现：在20个化合物上，对比Claude Opus 4.7、Opus 4.6、Sonnet 4.6与ChemDraw、MestReNova的正向预测（从结构预测谱图）和反向结构解析（从实验谱图推断结构）能力。所有化合物选自模型训练截止日期后发布的ChemRxiv预印本，以避免选择偏差。 🔗 查看原文
Meta SAM 3D 获 CVPR26 最佳论文荣誉提名 — X：AI at Meta (@AIatMeta) (8小时前) _摘要：热烈祝贺我们的 SAM 3D 团队在 #CVPR26 获得最佳论文荣誉提名！这项殊荣凸显了他们在推动计算机视觉边界方面的杰出工作。

论文链接：https：//arxiv.org/abs/2511.16624_ 🔗 查看原文

💡 技巧与观点

用Qwen2.5-3B构建多智能体经济体：工程报告 — Hugging Face：Blog（RSS） (1小时前) 摘要：开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体，每个智能体独立运行，通过vLLM部署在Modal，以Gradio为交互窗口。3B模型在100%调用中输出有效JSON，但经济判断能力弱。通过设计稀缺性（食物品种限制、易腐坏、冬季燃料危机）和优化提示词（禁止买入自产物品、给出示例）提升决策质量。15轮模拟中，蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。 🔗 查看原文
Claude 是否增加了 rsync 中的错误？ — Hacker News 热门（buzzing.cc 中文翻译） (4小时前) 摘要：一篇 Hacker News 热门帖子（105 分）提出了 Claude 是否导致 rsync 工具中 bug 增加的问题，并附有分析链接。 🔗 查看原文
Suno Voices 使用指南：6 个技巧打造高质量人声录制 — Suno：Blog（网页） (8小时前) 摘要：Suno Voices 面向 Web 付费用户开放。提升人声质量的 6 个技巧：在安静环境录音以减少背景噪音；先练习歌词再正式录制；不必追求完美，保留真实情感；录音时长尽量超过 1 分钟以提供更多学习素材；将人声匹配到合适的音乐流派（如民谣、流行、死亡金属、波萨诺瓦等）；敢于尝试不同风格以发现惊喜。这些技巧旨在帮助用户获得更个性化、表现力更强的声音效果。 🔗 查看原文
Hinton称AI拥有意识：人类最好接受非唯一智能生命 — X：Kim (@kimmonismus) (8小时前) 摘要：AI先驱Geoffrey Hinton表示，他认为AI拥有意识，人类应接受自己并非唯一智能生命。他指出AI"非常像我们"，AI聊天机器人必须理解问题才能作答，这种觉知等同于感知能力，智能不限于生物。主推文作者进一步讨论意识本质：笛卡尔的"我思故我在"和fMRI等实证手段都无法真正定义意识，人类对自身了解远不及想象。作者呼吁转向新哲学问题，厘清人与机器的区别与联系。 🔗 查看原文
Sir Demis Hassabis vs Sir Demis Hassabis — Gary Marcus：The Road to AI We Can Trust（RSS） (9小时前) 摘要：暂无摘要 🔗 查看原文
一个非常狠的AI教学提示词：追问式检查清单教学 — X：小互 (@xiaohu) (9小时前) 摘要：这是一则AI提示词，让AI扮演极度严格的老师，通过逐阶段教学、持续维护MD检查清单来确保用户真正理解。AI先让用户复述当前理解，再填补漏洞，并用开放式或选择题（随机选项顺序，提交前不公布答案）测试。教学必须覆盖问题本身、解决方案、宏观背景三个层面，并不断深挖"为什么"。仅当用户通过清单上所有项目的验证，会话才算结束。提示词强调对理解程度的主动验证，而非一次性灌输。 🔗 查看原文
微软CEO Satya Nadella最新访谈上线 — X：swyx (@swyx) (12小时前) 摘要：Satya Nadella 在 Latent Space 发布最新访谈，链接见原文。原推文仅评论"chat is he cooked"。 🔗 查看原文
腾讯混元联合人大开源PlanningBench评估框架 — X：腾讯混元 (@TencentHunyuan) (16小时前) 摘要：腾讯混元（Tencent Hunyuan）与中国人民大学高瓴人工智能学院合作，开源PlanningBench--一个可扩展、可验证的LLM规划能力评估与训练框架。该框架包含30+真实世界规划任务，支持自动验证和训练。PlanningBench旨在推动LLM从"说"到"做"的规划能力发展。资源已发布于arXiv、GitHub及HuggingFace。 🔗 查看原文
Open Code Review - 一款基于人工智能的代码审查命令行工具 — Hacker News 热门（buzzing.cc 中文翻译） (18小时前) 摘要：Open Code Review 是一个基于人工智能的代码审查命令行（CLI）工具，旨在帮助开发者通过自动化的方式提升代码审查效率。 🔗 查看原文
375个公众号RSS源优化Agent输入 — X：洪明 (@hongming731) (18小时前) 摘要：你的 Agent 还在全网垃圾里捞内容？不如先喂它 375 个高质量微信公众号 RSS 源。 🔽 🔗 查看原文

参与讨论

返回文章列表