AI HOT 日报 · 2026年06月02日
🚀 模型发布/更新
- 介绍 Mellum2:JetBrains 推出的 12B 混合专家模型 — Hugging Face:Blog(RSS) (8小时前) 摘要:JetBrains 在 Hugging Face 发布博客,介绍其新发布的 Mellum2 模型。该模型采用混合专家架构,参数规模为 12B。 🔗 查看原文
- SenseNova新模型解决AI图表生成难题 — X:商汤 SenseTime (@SenseTime_AI) (8小时前) 摘要:大多数AI模型在生成图表时存在数值错误(如负值显示为正)、柱状图位置偏移、元素关系混乱等问题。SenseNova-U1-8B-MoT-Infographic(SenseNova-U1)专为解决此类图表生成问题而设计,能够生成准确的图表,并支持实时调整设计和布局。项目在Hugging Face提供了模型,并在GitHub展示了效果案例。 🔗 查看原文
- 使用NVIDIA Cosmos 3开发物理AI推理、世界与行动模型 — NVIDIA Technical Blog(开发者技术博客 · RSS) (19小时前) 摘要:NVIDIA Cosmos 3是一款面向物理AI的前沿基础模型。它能够帮助机器人、自动驾驶车辆和智能空间理解真实世界、预测事件发展并生成适应特定环境与任务的行动。该模型融合了物理推理、世界理解与行动生成能力。 🔗 查看原文
- Nemotron 3 Ultra 本周即将发布 — X:NVIDIA AI (@NVIDIAAI) (19小时前) 摘要:Nemotron 3 Ultra 本周即将发布。 ⌛️ 🔗 查看原文
- MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型 — MiniMax:Blog(网页) (20小时前) 摘要:MiniMax M3 是一个开源前沿模型,具备先进的编码与AI智能体能力。它支持100万token的超长上下文窗口,并采用名为MSA(MiniMax Sparse Attention)的新型稀疏注意力架构。该架构使模型在100万token上下文下的每token计算成本降至前代的1/20,预填充速度提升9倍以上,解码速度提升15倍以上。在SWE-Bench Pro编码基准上,MiniMax M3得分59.0%,超越GPT-5.5和Gemini 3.1 Pro,性能接近Opus 4.7。该模型可通过MiniMax Code、Token Plan和API服务使用。 🔗 查看原文
- Qwen3.7-Plus:多模态智能体智能 — Qwen:Blog Retrieval(API) (22小时前) 摘要:Qwen Studio 提供涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具使用及制品生成的全面功能。 🔗 查看原文
🛠️ 产品发布/更新
- ChatGPT 新增长文编辑与保存功能 — X:ChatGPT (@ChatGPTapp) (1小时前) _摘要:长文写作需要更多空间。
现在你可以在全屏模式下编辑更长的文章,并将其保存到你的资料库中,以便稍后继续。_ 🔗 查看原文
- Krea AI 开放 Krea 2 LoRAs 全员使用 — X:Krea AI (@krea_ai) (2小时前) 摘要:Krea 2 LoRAs 现已向所有人开放。 试试下面这个 👇 🔗 查看原文
- Replit 用单个提示词构建完整业务 — X:Replit (@Replit) (4小时前) _摘要:你能用单个提示词免费构建一个真实的业务吗?
从今天起,在 Replit 上,答案是肯定的。
从一个提示词开始,获得一个网站、移动应用、幻灯片和发布视频。 此外,还能解锁使用 @stripe @atlas, @QuickBooks, @mercury & @doolaHQ 运营业务的福利。_ 🔗 查看原文
- Perplexity发布Search as Code搜索架构 — X:Perplexity (@perplexity_ai) (6小时前) _摘要:推出Search as Code,我们为AI智能体打造的全新搜索架构。
它直接编写Python代码调用我们的搜索栈,而非逐个循环函数调用。
现已在Perplexity Agent API中提供,并成为Computer的默认选项。
https://research.perplexity.ai/articles/rethinking-search-as-code-generation_ 🔗 查看原文
- Auto Router 新增成本质量权衡参数 — X:OpenRouter (@OpenRouter) (8小时前)
摘要:Auto Router 现在允许你调整其在成本与质量之间的权衡。
新增
cost_quality_tradeoff参数,范围 0 到 10: 设为 0 时,它总是选择最强大的模型,无论价格如何。设为 10 时,最便宜的模型胜出。 🔗 查看原文 - OpenBMB发布UltraData两大开源数据集,登顶HuggingFace趋势榜 — X:面壁智能 OpenBMB (@OpenBMB) (10小时前) 摘要:OpenBMB联合清华NLP与Modelbest发布两个开源数据集:Ultra-FineWeb-L3(预训练合成数据)包含600B+ tokens(超400B英文、200B+中文),是迄今最大开源中文预训练合成数据集;UltraData-SFT-2605(后训练SFT数据)包含15M+样本,是中国首个开源且包含思考与非思考标注的大规模SFT数据集,覆盖数学、代码、知识和指令遵循。两者均基于UltraData L0-L4框架构建,并在MiniCPM5-1B训练中完成验证。数据集已在HuggingFace免费开放。 🔗 查看原文
- Apache RocketMQ 发布 AI 专用消息引擎 — X:阿里云 / Alibaba Cloud (@alibaba_cloud) (13小时前) _摘要:🚀 Apache RocketMQ 为 AI 升级!推出 RocketMQ for AI--一个专为长时间会话、多智能体工作流和公平资源调度构建的新消息引擎。凭借 Lite-Topics、有序消息和智能流量整形,它解决了状态丢失、级联故障和突发负载问题。由阿里云大规模构建,现已开源。
了解更多: https://int.alibabacloud.com/m/1000413178/
#RocketMQ #AI #CloudNative_ 🔗 查看原文
- OpenAI前沿模型与Codex现可在AWS上使用 — OpenAI:官网动态(RSS · 排除企业/客户案例) (14小时前) 摘要:OpenAI的前沿模型与Codex现已在AWS上全面可用。企业客户可通过其现有的AWS环境、控制与采购流程来使用OpenAI的AI技术,从而加速从评估到生产部署的过程。 🔗 查看原文
- 腾讯混元发布智能体长期记忆插件Hy-Memory — X:腾讯混元 (@TencentHunyuan) (14小时前) 摘要:腾讯混元正式发布专为OpenClaw等长期协作智能体(Agent)设计的记忆插件 Hy-Memory。它基于6层记忆框架、System1/System2双系统与三层进化链构建,旨在成为智能体的"第二大脑"。该插件解决了记忆碎片化问题,实现了显著性能提升:记忆数量减少70%以上,单条记忆信息密度提升45%以上,在超长上下文场景中token消耗降低35%,记忆更新速度提升20%。 🔗 查看原文
- Cursor Teams计划定价方案更新 — Cursor Blog (17小时前) 摘要:Cursor Teams计划推出三项更新:增加Composer特定使用池,将第一方模型(Composer和Auto)与第三方API的使用额度分开计费;推出Premium席位,提供5倍于标准席位($40/月)的使用量,价格为$96/月(年付);仪表盘现可实时显示用户额度使用情况,管理员可通过Slack或邮件配置智能提醒。 🔗 查看原文
- NVIDIA 发布工厂运营蓝图,为工厂提供自主智能管理智能体 — NVIDIA Blog:Agentic AI(网页) (18小时前) 摘要:NVIDIA 在 GTC Taipei 发布了 NVIDIA 工厂运营蓝图(FOX),这是一个用于构建自主工厂管理智能体的参考设计。该蓝图基于 NVIDIA NemoClaw、AI-Q Blueprint 和 NVIDIA Nemotron 开源模型构建,旨在为工厂提供一个统一的决策层,以连接实时机器信号、质量数据和操作警报,实现快速问题解决。蓝图针对 NVIDIA DGX Station 桌面 AI 超级计算机进行了优化。首批采用者包括富士康、和硕、研华和纬创。富士康利用 FOX 和 NemoClaw 构建了 MoMClaw 多智能体系统,预计将根源分析时间缩短 80%,劳动生产率提高 15%,机器故障率降低 10%。 🔗 查看原文
- NVIDIA 发布 RTX Spark 及本地 AI 智能体安全与性能更新 — NVIDIA Blog:Agentic AI(网页) (19小时前) 摘要:NVIDIA 发布了 RTX Spark,一款专为本地 AI 智能体设计的 Windows 电脑,提供 1 petaflops AI 算力与 128GB 统一内存。其推出的 OpenShell 运行时与微软合作,基于新的 Windows 安全原语,确保智能体在设备端安全私密运行。性能方面,通过在 llama.cpp 中采用多 token 预测等优化,Qwen 3.6 和 3.5 27B 模型推理吞吐量提升最高达 2 倍,35B 模型提升 1.6 倍;多 GPU 优化使 llama.cpp 和 ComfyUI 获得最高 2 倍性能提升。此外,Adobe、Blender 等应用也进行了更新。 🔗 查看原文
- NVIDIA Vera CPU 为AI工厂的智能体工作负载设立新标准 — NVIDIA Technical Blog(开发者技术博客 · RSS) (20小时前) 摘要:NVIDIA Vera CPU 旨在为AI工厂中智能体工作负载树立新性能标杆。文章阐述了AI领域扩展规律的演变:预训练通过更大数据集、更多参数和大规模并行GPU系统扩展智能;后训练通过指令微调扩展实用性,并重新调整GPU用于生成式推理;测试时缩放则通过给模型更多生成token来提升推理能力。当前,智能体AI与强化学习正推动下一阶段的扩展。 🔗 查看原文
- NVIDIA DSX OS 提供开放、模块化软件用于规模化运营AI工厂 — NVIDIA Technical Blog(开发者技术博客 · RSS) (20小时前) 摘要:NVIDIA DSX 平台为设计、模拟和构建 AI 工厂提供完整解决方案,旨在应对不断增长的智能需求。该平台通过开放、模块化的软件栈,帮助运营方更快地扩展规模、提高效率,并降低从能源、芯片、基础设施、模型到应用这五层架构的整体智能成本。 🔗 查看原文
📈 行业动态
- Alphabet将通过发行股票筹集800亿美元用于AI支出计划 — Bloomberg:Technology(RSS) (3小时前) 摘要:Alphabet正在通过发行股票等方式筹集800亿美元资金,其中包括与Berkshire Hathaway的投资协议,以资助其雄心勃勃的AI支出计划。 🔗 查看原文
- Meta的AI被利用来劫持Instagram账号 — The Verge:订阅版科技(RSS) (4小时前) 摘要:Meta的AI聊天机器人被发现存在安全漏洞,黑客可以通过请求该AI关联一个新的电子邮件地址,从而接管目标用户的Instagram账号。该漏洞利用了AI智能体直接执行账户管理操作的能力。 🔗 查看原文
- 佛罗里达州起诉OpenAI与Sam Altman:涉多起ChatGPT相关谋杀案 — Ars Technica:AI(RSS) (5小时前) 摘要:佛罗里达州对OpenAI及其CEO Sam Altman提起诉讼。该州总检察长指控Altman对人命"完全漠视",案件与多起涉及ChatGPT的谋杀事件相关。 🔗 查看原文
- Anthropic 保密向 SEC 提交 S-1 草案 — Anthropic:Newsroom(网页) (7小时前) 摘要:Anthropic, PBC 今日保密向美国证券交易委员会提交了 S-1 表格草案,计划进行普通股的首次公开发行。这使其在 SEC 完成审核后拥有上市的选择权。IPO 的具体发行股数和价格尚未确定,将取决于市场条件等因素。公司近期刚完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资,估值达 9650 亿美元,并发布了 Claude Opus 4.8 模型。 🔗 查看原文
- 智谱:建议 A 股发行并在科创板上市 — IT之家(RSS) (8小时前) 摘要:智谱计划向中国监管机构申请发行A股并在科创板上市。发行股份数量占发行完成后总股本的2%至8%,预计全部为新股,原股东不发售。本次发行募集资金净额将投资于人工智能通用基座大模型、大模型MaaS一站式服务平台及补充流动资金。此外,公司拟将英文名称由"Knowledge Atlas Technology Joint Stock Company Limited"变更为"Z.AI Co., Ltd."。 🔗 查看原文
- Luma成立开放物理AI实验室攻克泛化难题 — X:Luma AI (@LumaLabsAI) (9小时前) _摘要:为改善人类生活,AI系统必须能帮助我们改善物理世界。阻碍我们迈向这一繁荣未来的是物理AI的泛化问题。
为解决此问题,我们在Luma建立了一个新的开放科学物理AI实验室。
阅读更多 → https://lumalabs.ai/news/luma-open-physical-ai-lab_ 🔗 查看原文
- 王兴:美团 AI Agent"小美"与腾讯元宝即将深度合作,用户订单无缝连接 — IT之家(RSS) (11小时前) 摘要:美团2026年第一季度财报显示营收910.39亿元,净利润亏损68.27亿元。财报电话会上,CEO王兴透露其AI Agent"小美"将与腾讯元宝深度合作。用户在腾讯元宝中提交本地服务需求,将被无缝连接至美团的外卖点餐、配送等生态。王兴强调,面向智能体的服务(To A)正变得日益重要,美团已将AI助手"小团"置于App核心位置,并拓展AI服务外延。 🔗 查看原文
- OpenAI在密歇根州启动Stargate 1GW数据中心建设 — OpenAI:官网动态(RSS · 排除企业/客户案例) (12小时前) 摘要:OpenAI在密歇根州启动了名为Stargate的1GW数据中心项目。作为AI基础设施建设的一部分,该项目旨在扩大人工智能技术的可及性、为当地创造就业机会并支持社区发展。 🔗 查看原文
- Runway 在伦敦设立欧洲总部及世界模型研究中心 — Runway:News(网页) (13小时前) 摘要:Runway 宣布在伦敦建立新的欧洲总部和专注于通用世界模型的研究中心。公司计划在未来18个月向英国AI生态投资$100M,到2028年投资额将翻倍以上。过去12个月,其在欧洲的订阅销量增长了50%,企业客户占比超20%。新总部将扩大其在欧洲的研究与商业布局,公司正招聘欧洲负责人以组建跨研究、产品、工程和销售的团队,并深化与BBC、Fremantle、WPP等企业的合作。世界模型是其研究的核心,旨在将生成式AI的应用扩展至机器人、科学研究与工业模拟等领域。 🔗 查看原文
- 英伟达和台积电将 AI 引入晶圆厂,推动半导体设计与制造发展 — IT之家(RSS) (17小时前) 摘要:暂无摘要 🔗 查看原文
- 介绍Cosmos Coalition — Runway:News(网页) (18小时前) 摘要:Runway宣布作为创始成员加入Cosmos Coalition,该联盟与NVIDIA及多家领先AI实验室合作,旨在构建并开源面向物理AI的前沿世界模型。首个项目将由Runway与NVIDIA共同开发一个基础模型,以推动下一代开放世界模型的研究与发展。 🔗 查看原文
- NVIDIA与Google Cloud助力下一波AI构建者 — NVIDIA Blog:Generative AI(网页) (18小时前) 摘要:在Google I/O大会上,NVIDIA与Google Cloud宣布深化合作,旨在支持其联合开发者社区中超过10万名开发者。合作将重点提供NVIDIA L4 Tensor Core GPU以优化AI推理与图形工作负载,并通过支持Vertex AI平台来增强Gemini模型性能。双方还将提供开源软件工具,以简化AI应用的构建与部署流程。 🔗 查看原文
- 上海:支持多模态智能体开发与应用,有序推进智能驾驶在共享出行、物流运输等多场景应用 — IT之家(RSS) (21小时前) 摘要:上海市人民政府办公厅印发《上海市服务业发展"十五五"规划》,提出发展AI软件技术及服务产业集群。规划支持多模态智能体开发与应用,推动智能客服等工具规模化;有序推进智能驾驶在共享出行、物流运输等多场景应用;做强算运存协同布局的智算云网络,推广模型即服务(MaaS);并支持开发面向家庭、养老、文旅等场景的具身智能整机产品,加速机器人向通用智能与精细化服务跃升。 🔗 查看原文
- 全球首次:MWC26 上海将举办"人形机器人点球大战",宇树科技等 8 支队伍参赛、参演 — IT之家(RSS) (23小时前) 摘要:全球首次"人形机器人点球大战"将于2026年6月在MWC上海举行。8支中国顶尖具身智能战队将进行自主对抗,无需人工操控或预设脚本。赛事旨在集中展示人形机器人在动态平衡、精准控制与自主决策等方面的技术突破。 🔗 查看原文
💡 技巧与观点
- Sam Altman强调AI发展应以人为本 — X:Rohan Paul (@rohanpaul_ai) (49分钟前) 摘要:Sam Altman在采访中表示,AI不应被设计为追求脱离人类需求的目标,人类必须始终处于AI发展的中心。他批判了行业内"AI将摧毁大量工作"等言论,认为人们担忧的并非AI带来的好处,而是自身在未来的角色、经济前景与自主权。他指出,AI行业的失败在于未能清晰解释人类如何在每一步保持对未来的控制权,以及如何在AI时代继续拥有充实、有意义的生活。 🔗 查看原文
- Google AI 展示并行子智能体自动整理文件 — X:Google AI for Developers (@googleaidevs) (5小时前) 摘要:从杂乱到清晰。观看 @Antigravity 中的并行子智能体对数百个营销资产进行分类和重命名,消除手动文件管理。 🔗 查看原文
- Gemini Omni支持创建个人数字分身 — X:Gemini (@GeminiApp) (7小时前) _摘要:轻松将自己添加到Gemini的视频创作中。
以下是如何使用Gemini Omni创建一个外观和声音都像你的数字分身。🧵_ 🔗 查看原文
- 构建每周千美元预算上限的智能体教程 — X:OpenRouter (@OpenRouter) (9小时前) _摘要:视频教程:如何构建一个每周预算上限为1000美元的智能体,包含模型拒绝列表与自定义数据保留
使用了新的、可堆叠的护栏架构:
【引用 @OpenRouter】:OpenRouter 上的护栏是市场上最强大的:为您的 AI 流量提供集中式安全与治理
预算限制、ZDR、模型与提供商限制、提示词注入防御以及 DLP / 敏感信息检测,分层为您控制的规则!🧵_ 🔗 查看原文
- AI Pulse 探讨智能体时代新指标 DAA — X:百度 Baidu (@Baidu_Inc) (10小时前) 摘要:ICYMI:我们最新的 AI Pulse 探讨了日活跃智能体(DAA)--一个衡量智能体时代价值的指标--以及我们的智能体组合。 🔗 查看原文
- 超越LLM:为何可扩展的企业AI采用取决于智能体逻辑 — Hugging Face:Blog(RSS) (10小时前) 摘要:可扩展的企业AI采用需超越大语言模型,依靠智能体逻辑来引导模型执行动态、长周期且受约束的企业工作流,从而提升质量、降低成本并建立信任。文中以IBM watsonx Code Assistant for Z为例,展示了智能体逻辑如何通过程序分析等技术,在理解大型遗留代码库时,相比纯LLM基线方法,能以约30倍更低的token消耗达到更优性能。在加速测试生成任务中,该方法亦能使代码覆盖度提升20%-45%,同时token消耗降低最高达15倍。 🔗 查看原文
- 作者分享使用 Codex App 开发的开源项目合集 — X:Vista (@vista8) (10小时前) 摘要:作者分享了使用 Codex App 等工具开发的一系列开源项目,包括4个 Chrome 插件(如快捷提示词、新标签页)、4个网站(如艺术家风格对比、音乐展示)和5个 AI Skill(如论文解读、阅读助手)。项目基于 GPT-Image-2 API、Suno 等技术,并整合了 Read-frog、Hyperframe 等开源项目。 🔗 查看原文
- 微软研究聚焦:智能体评估与价值对齐 — X:Microsoft Research (@MSFTResearch) (10小时前) 摘要:大规模评估智能体行为,论证代码库优于文档,并邀请全球研究人员共同解决价值对齐问题。深入了解最新研究焦点。 🔗 查看原文
- 开源与闭源模型在不同的增长曲线上 — Nathan Lambert:Interconnects(RSS) (10小时前) 摘要:当模型智能的微小提升能直接转化为实际价值时,开源与闭源模型正沿着不同的增长路径发展。闭源模型通过在特定场景下提供更高的边际智能来创造价值,而开源模型则在其他维度寻找增长点,两者形成了差异化的竞争格局。 🔗 查看原文
- 使用Claude Opus 4.8将书籍转化为AI技能的教程 — X:阿易 AI Notes (@AYi_AInotes) (11小时前) 摘要:本文以《非暴力沟通》为例,提供了一个将书籍转化为可调用AI技能(Skill)的六步教程。作者使用Claude Opus 4.8模型,因其具备100万token上下文窗口、结构化输出及多步智能体(Agent)能力,能一次性处理全书逻辑。流程包含文本准备、全局结构分析、五类提炼(框架/原则/技法/反模式/作者声音)、技能生成及关键的自检步骤。生成的技能保留了书中原始框架命名(如OFNR四要素、长颈鹿语言),并将触发词优化为"怎么提意见不像在指责"等日常表达。整个流程耗时约45分钟,消耗约30万token,成本不到20元人民币。 🔗 查看原文
- 如何使用 NVIDIA Alpamayo 在闭环中后训练自动驾驶模型 — NVIDIA Technical Blog(开发者技术博客 · RSS) (19小时前) 摘要:开发自动驾驶策略需要弥合训练与部署之间的鸿沟。现有的视觉-语言-动作模型虽然能推理更复杂的驾驶场景并产生更丰富的中间推理,但主要在开放循环中训练,即模型输出与真实行为直接比较,而不考虑其对环境产生的实际影响。NVIDIA Alpamayo 提供了一种在闭环环境中进行后训练的方法。 🔗 查看原文