AI HOT 日报 · 2026年05月21日
🚀 模型发布/更新
- Stability AI 推出音频模型 Stability Audio 3.0,可生成最长 6 分钟专业级歌曲 — IT之家(RSS) (9小时前) 摘要:Stability AI 推出 Stability Audio 3.0 音频生成模型家族,包含四款不同规格模型,参数从45900万到27亿。小型模型专注设备端运行,可本地生成两分钟以内的音频;中型和大型模型支持创作超过6分20秒的完整音乐, 🔗 查看原文
- SenseNova U1:同时思考文本与图像的AI — X:商汤 SenseTime (@SenseTime_AI) (14小时前) _摘要:将你的想法转化为激发故事的视觉画面 🧨
【引用 @Adamaestr0_】:大多数AI工具可以写作或生成图像。
但这个能同时做这两件事。
向你介绍 SenseNova U1。 一个能同时思考文本和图像的AI。
这改变了一切 🧵_ 🔗 查看原文
- Kling AI推出全球首个原生4K视频生成模型 — X:可灵 Kling AI (@Kling_ai) (21小时前) 摘要:4月23日,Kling AI正式推出全球首个原生4K视频生成模型,专为专业内容创作设计。该功能支持一键生成真4K画质视频,显著提升画面细节与制作效率。模型已获得好莱坞团队、动画工作室等多方采用。好莱坞制片人指出,这是其工作流中首个使用的原生4K基础模型;Wonder Studios强调,原生4K从底层生成避免了传统放大技术的角色变形问题,保持了画面一致性;动画导演则认为,该模型在保留艺术色调与复杂特效纹理方面优于同类产品。 🔗 查看原文
- Qwen3.7:智能体前沿 — Qwen:Blog Retrieval(API) (23小时前) 摘要:Qwen Studio推出Qwen3.7模型,提供覆盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具调用及工件生成等功能。该模型整合了当前AI智能体的关键能力,旨在推动多模态交互与实际任务执行向更综合、自主的方向发展。 🔗 查看原文
🛠️ 产品发布/更新
- 在OpenClaw中使用Grok — xAI:News(网页) (刚刚) 摘要:5月22日,xAI宣布,其用户现可在开源个人助理OpenClaw中直接使用Grok模型。所有持有SuperGrok或X Premium订阅的用户均可使用该功能。OpenClaw是一个开源的、本地优先的智能助手,可在多种硬件上运行并保持跨会话记忆,同时能接入WhatsApp、Telegram等多款主流通讯平台。用户通过简单安装和登录,即可在自有设备上运行OpenClaw,并通过其界面或关联的聊天工具与Grok交互。此举进一步扩展了Grok的应用场景,未来还将推出更多开源代理与集成支持。 🔗 查看原文
- Grok Build现已登陆OpenCode平台 — X:opencode (@opencode) (1小时前) 摘要:Grok Build现已在OpenCode中可用 🔗 查看原文
- 腾讯张军官宣操作系统层级 AI 助手"马维斯"正式上工,Windows、Mac、安卓端同步上线 — IT之家(RSS) (1小时前) 摘要:腾讯于5月21日发布了操作系统层级AI助手"马维斯",支持Windows、Mac和安卓平台同步上线。该助手具备文档归类解析、图片智能识别处理、系统维护等功能,并强调与操作系统深度集成,可调度不同模型处理任务,部分功能可在离线状态下使用。腾讯表示"马维斯"能完成市面主流Agent的大部分工作,并具备桌面操控手机应用等能力。这是继3月WorkBuddy和"龙虾"产品矩阵后,腾讯推出的又一AI助手产品。 🔗 查看原文
- Google Stitch更新:AI设计助手实现全流程构建 — X:Google AI for Developers (@googleaidevs) (3小时前) 摘要:Google推出了其AI设计伙伴Stitch的多项重要更新。新功能支持实时流式构建设计,允许用户在不中断流程的情况下直接进行编辑和互动反馈。Stitch现已能够导入现有代码库或Design.md文件,基于实际生产组件进行设计以保持品牌一致性。同时,工具新增了动态界面生成功能,并可将设计项目直接导出为可分享的线上URL,简化了从原型到生产的部署流程。该工具现已面向全球用户开放。 🔗 查看原文
- OpenClaw 2026.5.19版本发布 — X:OpenClaw (@openclaw) (4小时前) _摘要:OpenClaw 2026.5.19 🦞
📱 Android Talk Mode 实现实时化 🍎 Mac 设置界面更清爽 🔐 xAI 登录支持无头模式 🧵 Telegram 话题功能更稳定
大版本更新,简短公告。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.19_ 🔗 查看原文
- V8.1新增反向提示功能 — X:Midjourney (@midjourney) (5小时前) 摘要:今日小幅更新。许多用户要求为V8模型恢复"反向提示"功能(旧版本已有),我们称之为--no标志。该功能现已在V8.1中上线!如果您想从图像中排除某些元素(例如人物),可以尝试使用--no people。玩得开心! 🔗 查看原文
- GPT-5即将发布 — X:ChatGPT (@ChatGPTapp) (5小时前) 摘要:GPT-5即将发布 🚢 🔗 查看原文
- MiniMax语音模型新增600余种声音 — X:MiniMax (@MiniMax_AI) (5小时前) _摘要:600多种由MiniMax Speech 2.8 Turbo驱动的新声音现已登陆Together AI @togethercompute 🎙️✨
立即体验:https://voicefinder.together.ai/minimax--speech-2.8-turbo_ 🔗 查看原文
-
上下文压缩技术提升搜索效率与准确性 — X:Perplexity (@perplexity_ai) (7小时前) 摘要:我们已将查询感知压缩技术投入生产,以实现更快、更清晰、更准确的搜索。 更好的上下文优于更多的上下文。 我们的系统可将上下文令牌最多削减70%,同时提升回答质量。 🔗 查看原文
-
ChatGPT移动端支持Codex,实现跨设备协作 — X:OpenAI Developers (@OpenAIDevs) (8小时前) 摘要:你的笔记本电脑可以留在家里。 通过ChatGPT移动应用使用Codex,随时随地回答问题,之后还能在电脑上继续同一对话。 🔗 查看原文
-
AI视频一致性始于动作之前 — X:PixVerse (@PixVerse_) (10小时前) 摘要:AI视频的一致性始于动作之前。 对于这个15秒的烹饪短片,我们首先在PixVerse中生成了一个清晰的角色分镜。 然后将其用作视频的参考。 相同的角色。清晰的故事节点。 镜头指导。动作细节。 转发 + 关注 + 回复 = 分镜工作流 🔗 查看原文
-
MSE AI调度器:让Agent自主工作 — X:阿里云 / Alibaba Cloud (@alibaba_cloud) (14小时前) 摘要:将Agent转变为自主工作者!🚀 ❌ 开源痛点:可用性低、运维成本高、可观测性差。 ✅ MSE AI调度器通过以下方式解决: • 高可用分布式调度 • 统一管理与细粒度权限 • 弹性伸缩以降低成本 • 全链路可观测性 支持OpenClaw、Dify等。免费公测现已开放! 🔗 https://int.alibabacloud.com/m/1000413115/ #AI #Agent #MSE 🔗 查看原文
-
Gemini 3.5 Flash登陆OpenCode平台 — X:opencode (@opencode) (16小时前) _摘要:Gemini 3.5 Flash现已在OpenCode上线
-
速度极快
-
100万上下文
-
定价与GLM、Kimi和DeepSeek Pro相近_ 🔗 查看原文
📈 行业动态
- 冲刺 9 月上市,OpenAI 最快本周五提交 IPO 招股书草案 — IT之家(RSS) (2小时前) 摘要:据CNBC报道,OpenAI预计最快本周五递交首次公开募股(IPO)招股书草案,这标志着公司向资本市场迈出关键一步。首席执行官萨姆·奥尔特曼设定最早于2026年9月上市的目标。公司正与高盛和摩根士丹利合作,借助这两家投行的资源推动上市申报和承销安排。此前,埃隆·马斯克针对OpenAI的诉讼失利后,上市障碍消除,进程明显加速。OpenAI目前私募估值超过8500亿美元,若顺利推进,可能成为公开市场历史上规模最大的首发之一。此外,公司最早考虑在今年第四季度上市,内部治理和运作已开始向上市公司转型,准备工作持续进行。 🔗 查看原文
- SpaceX与Anthropic合作提供大规模AI算力服务 — X:Elon Musk (@elonmusk, xAI) (2小时前) _摘要:正如最近与@AnthropicAI扩大合作所展示的,@SpaceX正在大规模提供AI算力服务。
我们正在与其他公司进行类似合作的讨论。
随着时间的推移,特别是通过轨道数据中心,我们预计将以极高的规模提供AI服务。_ 🔗 查看原文
- xAI去年亏损64亿美元--SpaceX的IPO文件揭示其支出远未停止的原因 — TechCrunch:AI(RSS) (2小时前) 摘要:SpaceX的IPO文件首次披露了xAI在2025年的财务状况,显示该AI公司去年亏损高达64亿美元。文件同时揭示了xAI计划对Grok进行大规模扩张的战略,解释了马斯克旗下AI业务持续高额支出的原因。这份公开文件为外界提供了观察马斯克AI产业投资规模与财务表现的罕见窗口。 🔗 查看原文
- Nvidia再创季度营收纪录,披露对初创企业430亿美元持股 — TechCrunch:AI(RSS) (3小时前) 摘要:英伟达在最新季度财报中公布了创纪录的营收数据,但同时预测下一季度的收入增长将出现放缓。财报同时披露,该公司在初创企业的投资组合规模已达到430亿美元。这一数据反映了英伟达在人工智能芯片主导地位之外,通过战略投资深度参与科技生态系统的扩张策略。营收持续增长与未来放缓的预期,共同勾勒出当前高性能计算市场需求旺盛但可能面临波动的发展态势。 🔗 查看原文
- 英伟达 2027 财年第一财季归母净利润 583.21 亿美元,同比增长 211% — IT之家(RSS) (4小时前) 摘要:英伟达2027财年第一季度业绩创新高,营业总收入达816.15亿美元,同比增长85%。净利润为583.21亿美元,同比激增211%。数据中心业务是核心增长引擎,营收达752亿美元,同比大增92%。公司毛利率提升至74.9%,并宣布了800亿美元股票回购及提高季度股息。展望第二季度,公司预计营收为910亿美元。 🔗 查看原文
- Meta万人重组:裁员与AI转型并举 — X:Rohan Paul (@rohanpaul_ai) (5小时前) 摘要:Meta启动大规模裁员,计划削减约8000个岗位。与此同时,约7000名员工将被调配至新的AI相关职位。此次调整并非单纯的削减成本,更是公司围绕AI进行内部结构重塑的关键举措,重点将资源集中于AI基础设施、基础模型的构建以及AI技术的商业化,旨在打造从模型训练、产品开发到实现盈利的完整链条。 🔗 查看原文
- Gemini与XPRIZE联合举办全球黑客松 — X:Google AI for Developers (@googleaidevs) (6小时前) _摘要:用Gemini构建,改变世界🌍
我们正与@xprize合作,发起一场全球黑客松,旨在利用我们全新的智能体工具解决现实世界的挑战。
点击加入:https://www.geminixprize.com/_ 🔗 查看原文
- OpenAI筹备IPO,最早可能九月启动 — TechCrunch:AI(RSS) (7小时前) 摘要:OpenAI正加速推进首次公开募股(IPO)进程,最早可能于今年九月启动。这一进展发生在埃隆·马斯克对OpenAI的结构、领导层及财务发起的诉讼败诉次日,标志着公司正重回上市准备轨道。目前具体估值与融资细节尚未披露,但此次IPO若成功,将成为近年来人工智能领域最受关注的资本市场事件之一。 🔗 查看原文
- 谷歌的人工智能正遭到操纵。这家搜索巨头正在悄然反击 — Hacker News 热门(buzzing.cc 中文翻译) (8小时前) 摘要:谷歌的AI系统正面临被操纵的风险。为应对这一挑战,这家科技巨头已悄然启动防御措施,以保护其AI生成内容的结果免受恶意干扰。此举旨在确保搜索和AI服务的可靠性与可信度,反映了当前人工智能安全领域日益增长的对抗性问题。谷歌在未公开宣传的情况下,正在通过技术手段加强对其AI系统的防护。 🔗 查看原文
- Qwen 2026大会:AI原生云架构蓝图发布 — X:阿里云 / Alibaba Cloud (@alibaba_cloud) (14小时前) _摘要:Qwen Conference 2026:主题演讲议程
AI原生云、Agent原生云架构、推理的未来,以及多模态视觉技术发布。没有冗余内容,只有面向全球规模的工程蓝图。
注册:https://click.qwencloud.com/m/20000000190/_ 🔗 查看原文
- 投资超 600 亿美元,孙正义豪赌 OpenAI 引发内部质疑"迷信奥尔特曼如追星" — IT之家(RSS) (14小时前) 摘要:软银对OpenAI的投资承诺已超600亿美元,引发内部对孙正义过度信任其创始人奥尔特曼的担忧。部分高管质疑将巨额资本集中于单一公司存在风险,且软银虽持股超10%却无董事会席位,缺乏决策影响力。同时,Anthropic等竞争对手的崛起加剧了对OpenAI领先地位的挑战。尽管软银表示对OpenAI抱有"高度信心",并已从中获得账面收益,但其股价下跌及信用展望被下调反映出市场对其豪赌的顾虑。 🔗 查看原文
- 欧盟委员会发布《欧盟人工智能法》高风险AI系统分类指导草案并开启公众咨询 — DataGuidance:Artificial Intelligence(网页) (17小时前) 摘要:欧盟委员会于2026年5月19日发布了关于《欧盟人工智能法》第六条项下高风险AI系统分类的指导草案。该草案旨在为AI系统的提供商、部署者及市场监管机构提供明确的分类标准,以确保在欧盟范围内执法的一致性。分类主要依据AI系统的预期用途,例如作为受监管产品的组件或用于特定高风险场景。草案也规定了部分豁免条件,例如仅执行辅助性任务时可能不被视为高风险。公众咨询期至206月23日。 🔗 查看原文
- OpenAI向所有YC创业公司提供200万美元API投资 — X:Greg Brockman (@gdb) (21小时前) 摘要:OpenAI宣布向Y Combinator当前批次的每家创业公司提供价值200万美元的API信用额度投资,以换取股权。此举旨在为初创公司提供AI算力资源,支持下一代创新。这让人联想到Sam Altman在YC合伙人时期,Yuri Milner向每家创业公司提供投资的先例。OpenAI希望通过此举释放创业者潜力,推动AI应用创新。 🔗 查看原文
- 消息称微软内部示警:GitHub 面临生存级风险,AI 编程工具削弱托管必要性 — IT之家(RSS) (22小时前) 摘要:微软内部发出警告,称其代码托管平台GitHub正面临"生存级风险"。主要原因是Cursor、Claude Code等AI编程助手兴起,改变了开发者工作流,削弱了持续将代码上传至GitHub的必要性。为统一工具链并控制成本,微软已要求部分团队在2026年6月底前停止试用Claude Code,转而使用自有工具GitHub Copilot CLI。同时,OpenAI曾考虑自建替代平台,也加剧了对GitHub地位的潜在威胁。 🔗 查看原文
🔬 论文研究
- OpenAI 声称其解决了一道存在了80年的数学问题--这次来真的 — TechCrunch:AI(RSS) (4小时前) 摘要:OpenAI 宣布其推理模型成功证伪了一道自1946年起悬而未决的几何猜想。与以往不同,此次声称获得了此前曾指出OpenAI相关声明存在错误的数学家们的认可与支持,这为其结论的可靠性提供了关键背书。 🔗 查看原文
- ZCube:超大规模大模型推理的网络优化 — 智谱:研究(网页内嵌数据) (5小时前) 摘要:针对超大规模大模型推理,ZCube网络架构通过取消Spine层、将Leaf交换机分组并全互联等创新设计,有效解决了推理网络的拥塞问题。该架构在集群实测中,实现了交换机与光模块资本支出减少33%、GPU平均推理吞吐提升15%,同时将首token延迟的P99值大幅降低40.6%,在降低成本的同时显著提升了推理性能。 🔗 查看原文
💡 技巧与观点
- Anthropic销售负责人如何利用Claude Cowork管理4000个客户账户 — Claude:Blog(网页) (8小时前) 摘要:Anthropic美国中端市场业务负责人Travis Bryant利用Claude Cowork自动化销售管理工作。该工具帮助他高效完成客户倾向性评分、每日客户简报准备及每周销售预测报告生成,每晚自动处理4000个账户数据,替代了以往跨部门团队需数百小时完成的工作。通过自动化日常任务调度,他每天节省约90分钟,并将数据整合为可交互的销售仪表板,使其能更专注于客户沟通与战略决策。 🔗 查看原文
- OpenRouter自动路由缓存机制说明 — X:OpenRouter (@OpenRouter) (9小时前) 摘要:提示💡 你无需担心自动路由(以及所有单独模型)的缓存未命中问题 OpenRouter会将你的会话固定在一个模型/提供商上,直到缓存过期 🔗 查看原文
- 开源插件为Codex App增添高级功能 — X:Vista (@vista8) (9小时前) 摘要:一个开源项目允许用户增强Codex App的功能。即使通过API登录,也能通过安装插件的方式启用Computer Use特性并添加Goal指令。项目还支持界面自定义,例如调整为类似Chrome浏览器的顶部Tab样式,并可设置任务开始和完成的提醒音效。相关开源项目地址已在评论区提供。 🔗 查看原文
- Prompt驱动AI生成超真实足球自拍视频 — X:PixVerse (@PixVerse_) (17小时前) 摘要:这条推文展示了一个用于在PixVerse平台生成视频的复杂提示词。核心目标是制作一段在大型体育场内,五位朋友进行超真实智能手机自拍风格的视频。提示词的关键在于,它通过极其详细的设定来确保生成内容的连贯性和真实感:包括对五个角色外貌的严格一致性要求、具体的球场环境、模拟真实手机拍摄的镜头运动(如抖动、失焦)以及一系列自然的动作序列。 🔗 查看原文
- 开源油猴脚本实现多平台截图上传与内容处理 — X:Vista (@vista8) (18小时前) 摘要:开源油猴脚本实现小红书、抖音、微信公众号的截图粘贴自动上传,并支持YouTube字幕复制、倍速调节及内容导出至NotebookLM、ChatGPT等工具。主推文作者表示,该工具增强了将X平台内容同步至国内平台的意愿,尽管部分平台体验欠佳。 🔗 查看原文