AI HOT 日报 · 2026年06月04日
🚀 模型发布/更新
- MiniMax M3 1M token 解码加速 15.6 倍 — X:MiniMax (@MiniMax_AI) (26分钟前) _摘要:15.6× faster decoding at 1M tokens 🔥
感谢 @FireworksAI_HQ 为 M3 提供推理支持。
立即尝试 👇_ 🔗 查看原文
- Grok Imagine 1.5 预览版发布 — X:cb_doge (@cb_doge) (5小时前) 摘要:Grok Imagine 1.5 预览版已发布,即日起可在 API 中体验。SpaceXAI 正在发力。 🔗 查看原文
- Ideogram v4.0 发布:2K 分辨率和 JSON 提示支持 — X:Krea AI (@krea_ai) (6小时前) _摘要:介绍 Ideogram v4.0。
原生 2K 分辨率,出色的文字渲染,支持 JSON 提示词。
立即在 Krea 中体验。_ 🔗 查看原文
- Miso One 开源语音模型:8B 参数、110ms 延迟、一次语音克隆 — X:Kim (@kimmonismus) (7小时前) 摘要:Miso One 正式发布,一个 8B 参数的开源权重语音模型(TTS),旨在模拟真实人类朗读的温暖与节奏。它支持一次语音克隆(只需短样本),推理延迟仅 110ms。模型权重已开源至 GitHub,无需 API 即可自托管,音频数据不离开本地。API 访问即将推出。演示已上线,可先试听再克隆仓库。 🔗 查看原文
🛠️ 产品发布/更新
- Grok模型登陆Cloudflare AI Gateway — X:xAI (@xai) (1小时前) 摘要:在 @Cloudflare 的 AI Gateway 上尝试 Grok 模型! 🔗 查看原文
- OpenClaw 2026.6.1发布:新增Windows节点与技能工坊 — X:OpenClaw (@openclaw) (2小时前) _摘要:OpenClaw 2026.6.1 已上线 🦞
🪟 原生 Windows 节点主机 🛠️ 用于自主学习型智能体的技能工坊(Skill Workshop) 📋 工作板(Workboard)编排 🧠 支持 MiniMax M3
Windows 加入集群。无需企鹅服。 https://github.com/openclaw/openclaw/releases/tag/v2026.6.1_ 🔗 查看原文
- 黄仁勋与纳德拉共议智能体AI时代 — X:NVIDIA (@nvidia) (6小时前) _摘要:智能体AI时代来了。
从台北,黄仁勋与@satyanadella共同出席#MSBuild,展示NVIDIA与@Microsoft如何携手构建,从Windows设备到规模化AI工厂。
▶️ 观看对话:https://nvda.ws/4uefQbs_ 🔗 查看原文
- Replit上线SEO Agent助应用被发现 — X:Replit (@Replit) (7小时前) _摘要:你发布了你的应用。然后呢?
你的应用可能看起来很棒,但如果没人能找到它,它就依然不可见。
发布只是开始。
认识一下SEO Agent。它会为你运行一次扫描,并建议修复措施,帮助你的应用在网页搜索和AI搜索中被发现。_ 🔗 查看原文
- OpenShell v0.0.55 发布:新增 Vertex AI 推理支持 — X:NVIDIA AI (@NVIDIAAI) (7小时前) _摘要:OpenShell v0.0.55
🧩 Google Vertex AI 推理提供者 🔒 基于配置文件的策略可见性 🐳 网关中更好的 Podman 检测 🖥️ 恢复 GPU procfs 基准行为 🔧 CI 与文档修复
运行智能体对接 Vertex AI,同时拥有改进的策略可见性以及更可靠的 Podman 和 GPU 沙箱行为。
https://github.com/NVIDIA/OpenShell/releases/tag/v0.0.55_ 🔗 查看原文
- xAI Grok语音模型上线Vapi平台 — X:xAI (@xai) (7小时前) _摘要:试试 @Vapi_AI 上最自然的TTS和性价比最高的STT API。
来自 @xai 的Grok STT和Grok TTS现已在企业语音AI平台Vapi上线。基于Vapi构建自定义语音智能体,可让它们用客户的语言交流、在受监管的工作流中捕捉重要细节,并在每次通话中明显更具人性化。_ 🔗 查看原文
- Perplexity Personal Computer 登陆 Windows — X:Perplexity (@perplexity_ai) (8小时前) _摘要:Personal Computer 即将登陆 Windows。
面向 Windows 的 Personal Computer 在你的机器上运行,并协调你每天使用的应用和文件。
我们将首先向等候名单上的付费 Max 和 Enterprise Max 订阅用户推送。_ 🔗 查看原文
- Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线 — TechCrunch:AI(RSS) (10小时前) 摘要:Meta 为 WhatsApp Business 打造的 AI 智能体面向全球商家开放,将按照模型 token 使用量向企业收费。 🔗 查看原文
- 介绍 Claude Partner Network 的 Services Track 和 Partner Hub — Anthropic:Newsroom(网页) (10小时前) 摘要:Anthropic 扩展 Claude Partner Network,推出 Services Track 分级体系和 Partner Hub 门户。Services Track 设 Select、Preferred、Global Premier 三级,按认证人数、投产客户数及客户推荐信量化评定。Partner Hub 提供每日更新仪表盘和公开目录,方便合作伙伴查看进展、客户寻找供应商。该网络三月启动以来已有超 4 万家公司申请,逾 1 万顾问获认证;Accenture 训练 3 万人,Cognizant 部署约 35 万员工,Deloitte 惠及 47 万人,KPMG 覆盖 27.6 万,Infosys 构建行业智能体,PwC 先在美推广再扩至全球。 🔗 查看原文
- Cursor Enterprise 推出 Organizations 组织管理功能 — Cursor Blog (12小时前) 摘要:Cursor Enterprise 正式推出 Organizations 结构,允许企业在统一面板中管理多个团队。每个团队可独立设置预算、安全策略、模型访问和功能控制。新增 Groups 作为跨团队或团队内的轻量级用户集合,用于分段管理模型访问、花销上限和智能体权限,不同设置取最宽松权限生效。管理员可创建沙箱团队预先测试新功能,再向全公司推送;也可按部门划分模型访问和预算。组织级仪表盘汇总所有团队的 token 用量与花费,支持按团队、用户等维度筛选。身份提供商和 SCIM 目录在组织层面一次配置,成员自动同步。该功能现已全面开放给所有 Enterprise 客户。 🔗 查看原文
- NousResearch 发布 Hermes Agent 桌面应用公测版 — X:硅基流动 SiliconFlow (@SiliconFlowAI) (18小时前) 摘要:官方 Hermes Agent 桌面应用现已推出! 🔗 查看原文
📈 行业动态
- Suno完成4亿美元D轮融资 — X:Suno (@suno) (9小时前) _摘要:我们激动地宣布Suno的新篇章:4亿美元D轮融资,估值54亿美元!🚀 我们的使命一直很简单:让更多人能体验制作音乐的乐趣。非常感谢我们不可思议的社区和投资者与我们共同建设。
点击此处阅读Mikey的博客:https://suno.com/blog/series-d-announcement_ 🔗 查看原文
- 微软与OpenAI分道扬镳--如今双方准备正面交锋 — The Verge:订阅版科技(RSS) (9小时前) 摘要:微软与OpenAI的合作关系已彻底破裂,双方进入正面竞争态势。前DeepMind高管、现任微软AI主管Mustafa Suleyman明确表示,微软现在必须从头证明自己能独立完成所有必需的任务。这标志着两家科技巨头从紧密合作伙伴转变为直接竞争对手。 🔗 查看原文
- 欧盟公布全面技术主权计划,推动芯片与AI自主发展 — Bloomberg:Technology(RSS) (11小时前) 摘要:欧盟公布一项全面技术主权计划,旨在扩大本土半导体、人工智能和云计算供应链,以减少对美国和亚洲的依赖。该计划覆盖芯片制造、AI基础设施及云计算服务等多个关键领域,目标是增强欧洲在核心技术上的自主能力。 🔗 查看原文
- Qwen Cloud全球AI黑客马拉松启动 — X:阿里云 / Alibaba Cloud (@alibaba_cloud) (13小时前) _摘要:首届Qwen Cloud全球AI黑客马拉松现已启动!
参与5大高级赛道,在全球舞台上挑战AI智能体极限。
总奖金池超过70,000美元(赛道冠军1万美元)。
立即在Devpost报名:https://click.qwencloud.com/m/20000000281/_ 🔗 查看原文
- 消息称 DeepSeek 首轮融资拟筹集 500 亿元,腾讯、宁德时代等参投 — IT之家(RSS) (19小时前) 摘要:DeepSeek 计划在首轮融资中从腾讯、宁德时代等投资方处筹集约 500 亿元人民币。融资落地后,其投后估值预计在 3500 亿至 4000 亿元。创始人梁文峰将出资 200 亿元,腾讯和宁德时代分别拟投资 100 亿元和 50 亿元,成为最大外部投资者。DeepSeek 去年凭借 V3 大模型与 R1 推理模型获得广泛认可。此次融资凸显了中国正打造从大模型到算力能源基建的全链条 AI 产业。 🔗 查看原文
- Satya Nadella 谈微软 Build 大会主旨演讲 — X:Satya Nadella (@satyanadella) (19小时前) _摘要:与我们共同构建前沿智能生态系统。
今早我在 Microsoft Build 上的主旨演讲亮点。_ 🔗 查看原文
- 宏利香港与阿里云达成AI战略合作 — X:阿里云 / Alibaba Cloud (@alibaba_cloud) (20小时前) 摘要:宏利香港宣布与阿里云建立战略合作伙伴关系,旨在构建一个专注于推进负责任的AI创新,并加速AI技术在业务中部署的合作框架。 🔗 查看原文
- Sensor Tower:OpenAI 旗下 ChatGPT 月活已破 10 亿,史上最快 — IT之家(RSS) (22小时前) 摘要:据市场情报机构 Sensor Tower 估计,OpenAI 旗下 ChatGPT 全球月活跃用户在 2025 年 5 月突破 10 亿,成为达成此里程碑最快的应用,增速超过 Google Maps、TikTok 等。同期,其竞争对手 Anthropic 的 Claude 月活达 5600 万,同比增幅约 640%,增长势头迅猛。数据显示,部分用户已开始在 Claude 与 ChatGPT 间切换使用。在达成用户里程碑之际,Anthropic 已秘密递交 IPO 申请,OpenAI 也计划筹备上市。 🔗 查看原文
🔬 论文研究
- 微软研究:装瓶厂AI从聊天到决策 — X:Microsoft Research (@MSFTResearch) (7小时前) 摘要:一份在中西部装瓶厂进行的三个月试点显示,当AI超越聊天进入决策领域时会发生什么--约束条件变化、风险真实、答案必须可靠。 https://msft.it/6015vjYUN 🔗 查看原文
- NVIDIA Research 在 CVPR 2026 发表三篇论文:规模化训练实现抓取、自动驾驶与智能体泛化 — NVIDIA AI Blog (8小时前) 摘要:NVIDIA Research 在 CVPR 2026 上发表三篇论文,展示规模化训练带来的泛化能力。GraspGen-X 是首个零样本抓取基础模型,基于 20 亿次模拟抓取训练,可为任意末端执行器生成抓取姿态。LCDrive 用紧凑潜在表示替代文本推理,让自动驾驶在嵌入式硬件上更快推理。NitroGen 基于 Isaac GR00T 架构,在大量虚拟环境中训练具身智能体。此外还发布了新的物理 AI 智能体技能,以及配合 GraspGen-X 使用的 CUDA 加速运动规划库 curoboV2 和闭环抓取论文 Grasp-MPC。 🔗 查看原文
- Anthropic 分析 832 个 AI 恶意账户:中高风险攻击者半年从 33% 跃至 56% — Anthropic:Research(发表成果 · 网页) (14小时前) 摘要:Anthropic 分析 2025 年 3 月至 2026 年 3 月间 832 个被封禁的恶意账户,映射至 MITRE ATT&CK 框架。67.3% 使用 AI 编写恶意软件,6.5% 用于横向移动。六个月间中高风险攻击者占比从 33% 升至 56%。AI 用于账户发现增长 8.9%,AI 辅助钓鱼下降 8.6%。传统基于技术数量或平台(Claude Code、API、聊天界面)的威胁评估失效,而 MITRE ATT&CK 框架尚未收录此类智能体编排行为。 🔗 查看原文
- 斯坦福大学法学院研究:人工智能的表现优于法学教授 — Hacker News 热门(buzzing.cc 中文翻译) (21小时前) 摘要:斯坦福大学法学院的一项研究表明,人工智能的表现优于法学教授。该发现引发了广泛关注,在Hacker News平台获得了104个Points。 🔗 查看原文
💡 技巧与观点
- 优步每月 1,500 美元的 AI 使用上限为 AI 工具定价提供参考 — Hacker News 热门(buzzing.cc 中文翻译) (5小时前) 摘要:优步将 AI 工具每月使用上限定为 1500 美元,这一做法为行业 AI 工具定价提供了有价值的参考信号。 🔗 查看原文
- 世界模型的功能分类 — X:Fei-Fei Li (@drfeifei, World Labs) (5小时前) 摘要:World Labs团队与李飞飞发文,梳理"世界模型"这一被滥用的术语。对比语言模型学习文本统计,世界模型学习空间与时间统计(如光照、物理规律)。基于部分可观马尔可夫决策过程(POMDP)框架,智能体通过动作影响世界状态,观测是部分视图。当前被称为"世界模型"的不同系统本质上是同一循环的不同投影:第一类为渲染器,输出给人眼看的像素,以视觉保真度为核心。文章着重于概念分层,未给出具体模型名、参数或基准分数。 🔗 查看原文
- 洪水韧性新篇章:Google 开源水文建模框架 — Google Research:Blog(网页) (5小时前) 摘要:Google Research 在 GitHub 开源了其水文建模框架,这是一个基于 PyTorch 的 Python 包,采用与 Flood Hub 河段洪水预报相同的模型架构和训练数据。该框架允许研究者和预报员训练 AI 洪水预报模型、添加新模型与数据,并已与捷克水文气象研究所(CHMI)等合作测试。开放模型架构和训练管线旨在让各国气象水文部门在保留数据完全控制权的同时,整合基于 AI 的洪水预报。 🔗 查看原文
- Anthropic 用 Claude 赋能自助数据分析 — Claude:Blog(网页) (6小时前) 摘要:Anthropic 使用 Claude 自动化了 95% 的业务分析查询,整体准确率约 95%。其关键在于构建智能体分析栈(agentic analytics stack),通过数据基础层、维护验证流程和技能(skills)分别解决概念-实体歧义、数据过时和检索失败三大错误来源。相比编码场景,数据分析的难点在于将用户问题映射到正确的数据实体,而执行 SQL 反而是简单的。Anthropic 的数据科学团队因此得以专注于因果建模、预测和机器学习等战略工作。 🔗 查看原文
- 超越聊天机器人的直接偏好优化 — Hugging Face:Blog(RSS) (11小时前) 摘要:Dharma-AI 在 Hugging Face 博客发文,探讨直接偏好优化(Direct Preference Optimization,DPO)在聊天机器人之外的更广泛应用场景。 🔗 查看原文
- Karpathy 的 llm-wiki 项目获超五千星 — X:硅基流动 SiliconFlow (@SiliconFlowAI) (17小时前) _摘要:@karpathy 的 llm-wiki 在几周内获得了 5,000+ 颗星。
其理念是:停止在每个会话中重新发现知识。让一个大语言模型构建并维护一个维基,每次使用时它都会变得更智能。
以下是如何使用 @opencode + @justsisyphus OMO + SiliconFlow 构建你自己的版本 🧵_ 🔗 查看原文
- 智能体工程实战窍门全录 — X:邵猛 (@shao__meng) (23小时前) 摘要:该内容源自@mvanhorn的分享,介绍了"智能体工程"如何重塑软件开发。其核心是从"人主导编码"转向"人主导方向、智能体执行",中心从IDE变为终端与计划文件。方法论遵循Research → Plan → Work循环,核心是让plan.md约束智能体行为。分享者总结了22条实战技巧,涵盖规划、并行执行、输入方式、远程控制等方面,并列出了完整的工具栈。 🔗 查看原文