体验分享#AI#Daily

AI HOT 日报 · 2026年05月28日

2026-05-28|yancey|24 分钟阅读

🛠️ 产品发布/更新

Web 更新 — Midjourney：Updates（RSS） (5小时前) 摘要：对话模式在文本和语音输入方面进行了改进。语音会话开始时，可访问用户的图像提示、风格参考、侧边栏设置和最近任务。图像提示功能现可从托盘和侧边栏直接使用。在语音提交过程中，托盘中的图像将保持不变，直至用户手动移除。 🔗 查看原文
OpenAI产品支持私有MCP服务器安全连接 — X：OpenAI Developers (@OpenAIDevs) (5小时前) 摘要：您的团队可以在内部网络中保留MCP服务器，同时ChatGPT、Codex和Responses API通过仅出站HTTPS进行连接。 🔗 查看原文
OpenCode与MiMo V2.5限时免费开放 — X：opencode (@opencode) (6小时前) _摘要：OpenCode x MiMo V2.5 - 限时免费

1M 上下文 • 推理 • 文本 • 图像_ 🔗 查看原文

开源FastVideo Dreamverse实时视频生成工具 — X：Sky Computing Lab (@haoailab) (6小时前) _摘要：🚀仅需7秒即可生成30秒1080p视频！

我们开源了FastVideo Dreamverse：基于单张NVIDIA B200 GPU和LTX-2模型，实现实时视频生成的氛围引导工具。

Repo： https：//github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse Blog： https：//haoailab.com/blogs/fastvideo-dreamverse-release/_ 🔗 查看原文

Google Pay 最新更新 — Google Developers Blog（RSS） (6小时前) 摘要：Google Pay 正向"智能体商务"演进，推出了通用商务协议和新的 MCP 服务器，允许 AI 智能体管理集成与分析趋势。Android 平台更新引入了动态回调以支持快速结账，并通过 WebView 将支付功能扩展至社交媒体应用。此外，平台还推出了跨设备生物认证和新的交易信号，旨在帮助商家减少流程摩擦。 🔗 查看原文
Grok编程智能体登陆Kilo IDE平台 — X：xAI (@xai) (7小时前) _摘要：在 @kilocode 中使用您的 SuperGrok 或 X Premium+ 订阅。

尝试 grok-build-0.1，享受高速和智能体编程智能，可在 Kilo IDE 扩展或 CLI 中使用。

https：//x.ai/news/grok-kilocode_ 🔗 查看原文

Perplexity开源Unigram分词器降低CPU占用 — X：Perplexity (@perplexity_ai) (8小时前) 摘要：我们开源了重新构建的Unigram分词器，可将CPU占用降低5-6倍。小型重排序器和嵌入模型在GPU上运行时间仅为个位数毫秒，使得CPU分词成为总延迟的重要组成部分。 http：//github.com/perplexityai/pplx-garden 🔗 查看原文
Claude Marketplace 新增五家合作伙伴 — X：Claude (@claudeai) (8小时前) _摘要：Claude Marketplace 新增成员：@augmentcode、@boltdotnew、@coderabbitai、@hebbia 和 @WeAreLegora。

您现有的 Anthropic 消费承诺可用于购买其 Claude 驱动的产品。

了解更多：http：//claude.com/platform/marketplace_ 🔗 查看原文

Krea 2 API发布，支持多平台与智能体 — X：Krea AI (@krea_ai) (9小时前) 摘要：今天，我们发布了 Krea 2 的 API。现已在 @fal 或 @ComfyUI 等平台可用，通过 @NousResearch 的 Hermes 等智能体使用，并全面支持 Claude、Codex 或 OpenClaw。了解如何设置 👇 🔗 查看原文
Runway 推出 Model Context Protocol 服务器 — Runway：News（网页） (9小时前) 摘要：Runway 正式推出 Runway MCP 服务器，允许任何兼容 MCP 的 AI 智能体（如 Claude、ChatGPT、Cursor）在对话界面中直接生成图像与视频，无需切换工作流。该服务器接入了 Runway 最新的多款 SOTA 模型，包括 Gen-4.5、Seedance 2.0、GPT Image 2、Kling 3.0 及 Nano Banana Pro。其应用场景涵盖为产品制作营销视频、批量生成网站视觉素材、创作角色广告以及在应用开发中集成视觉内容。用户设置简便，通过 runwayml.com/mcp 添加服务器并登录现有 Runway 账户即可使用，无需单独申请 API 密钥。 🔗 查看原文
Qoder平台限时半价使用Qwen3.7-Max模型 — X：通义千问 / Qwen (@Alibaba_Qwen) (13小时前) _摘要：🙌🙌

【引用 @qoder_ai_ide】：Qwen3.7-Max，半价。

从今天起，Qwen3.7-Max--通义千问（Qwen）家族的最新旗舰模型--在Qoder上半价提供。限时活动。

新用户？你每天还能获得100次免费模型调用。自动应用，无需领取，无需开关。桌面端、JetBrains插件、CLI、QoderWork、QoderWake--全部覆盖。

现在正是用它处理难题的好时机。_ 🔗 查看原文

Claude Code v2.1.152 更新发布 — Claude Code：GitHub Releases（RSS） (22小时前) 摘要：Claude Code 发布 v2.1.152 版本更新。核心改进包括：/code-review --fix 现在会将审查建议直接应用于工作目录；技能与斜杠命令支持通过 frontmatter 的 disallowed-tools 移除模型工具；新增 /reload-skills 命令可不重启会话重新扫描技能目录；SessionStart 钩子现可返回 reloadSkills： true 重新扫描技能，并可通过 hookSpecificOutput.sessionTitle 设置会话标题；新增 MessageDisplay 钩子事件以变换或隐藏助手消息。其他更新涉及插件市场管理、主模型不可用时自动切换至 --fallback-model、会话用量统计优化等。同时修复了终端样式退化、沙箱警告显示、思考摘要、MCP 服务器去重、远程会话连接及多种会话卡顿问题。 🔗 查看原文

📈 行业动态

Cognition成为全球最大独立智能体实验室 — X：swyx (@swyx) (4小时前) 摘要：Cognition宣布已成为全球最大的独立智能体实验室。公司完成超10亿美元融资，估值达260亿美元，由Lux Capital、General Catalyst等领投。其企业使用量自年初增长超10倍，年化收入增至4.92亿美元。Cognition于两年前推出Devin，定位为首个AI软件工程师。公司强调其拥有多项领先优势，包括首个编码智能体、顶级代码审查能力等，并得到了Peter Thiel的重大投资。 🔗 查看原文
黄仁勋展示英伟达台湾新园区 — X：Rohan Paul (@rohanpaul_ai) (6小时前) 摘要：黄仁勋展示了新的台湾园区。英伟达计划每年在台湾投资约1500亿美元。就在竞争对手AMD宣布将向台湾AI领域投资超过100亿美元一周后。 🔗 查看原文
Replit入选Redpoint 2026 InfraRed 100榜单 — X：Replit (@Replit) (6小时前) 摘要：Replit 被列入 @Redpoint 的 2026 InfraRed 100 榜单。这是一份构建 AI 运行基础设施的公司名单。很荣幸能入选，与 Stripe、Snowflake 和 HashiCorp 等往届入选者并列。致每一位在 Replit 上发布产品的构建者：这份荣誉属于你们。 https：//www.redpoint.com/infrared/report/ 🔗 查看原文
教皇没对AGI上头 — The Verge：AI（RSS） (12小时前) 摘要：教皇 Leo XIV 发布题为《Magnifica Humanitas》的通谕，警告人工智能的使用绝非纯粹技术问题，当其进入影响人类生活的过程时，便触及权利、机会、地位与自由。通谕发布时，Anthropic 联合创始人 Christopher Olah 出席。文件引发了科技界内外的广泛反应。 🔗 查看原文
思科与OpenAI携手Codex重新定义企业工程 — OpenAI：官网动态（RSS · 排除企业/客户案例） (13小时前) 摘要：思科正与OpenAI合作，利用Codex重新定义企业工程实践。此次合作旨在帮助思科扩展AI原生开发能力、加速其AI Defense安全工作，并实现缺陷修复流程的自动化。 🔗 查看原文
阿里云入选Omdia智能体AI市场雷达领导者 — X：阿里云 / Alibaba Cloud (@alibaba_cloud) (18小时前) 摘要：阿里云在Omdia的智能体AI市场雷达中被评为领导者。Omdia强调了阿里云在每一层的全栈能力，认可其是首个将整个平台围绕智能体范式进行构建的云服务商。 🔗 查看原文
我国将加快研究推进人工智能健康发展综合性立法、低空经济立法等 — IT之家（RSS） (21小时前) 摘要：暂无摘要 🔗 查看原文
阿里云成为PyTorch基金会白金会员 — X：阿里云 / Alibaba Cloud (@alibaba_cloud) (22小时前) 摘要：阿里云宣布以白金会员身份加入PyTorch基金会。作为AI基础设施全球领导者，阿里云是开源模型家族Qwen的缔造方，已在多样化硬件上大规模运行PyTorch，将为社区带来生产级工程经验。 🔗 查看原文
消息称高通与字节跳动达成 AI ASIC 芯片合作，采购量在数百万颗级别 — IT之家（RSS） (22小时前) 摘要：暂无摘要 🔗 查看原文

🔬 论文研究

社会科学中的编码智能体 — Anthropic：Research（发表成果 · 网页） (53分钟前) 摘要：一项针对1260名定量社会科学家的调查显示，虽然81%的受访者用过AI聊天机器人，但仅有20%将Claude Code、Codex等编码智能体常规应用于工作。采用率存在显著差异：以男性名字命名的研究者使用率是女性研究者的两倍；顶尖大学研究者可能性高出40%。用户产出更多工作论文和基金申请，但这可能反映早期采用者自身差异。研究者对AI助力撰写可发表论文更乐观，但对重塑整个社会科学领域持保留态度。这是一项初步调查，更深入研究仍在进行中。 🔗 查看原文
通过零信任聚合实现的隐私分析 — Google Research：Blog（网页） (6小时前) 摘要：Google Research 推出了一种新的隐私分析解决方案。该方案结合了一种新的密码学安全聚合协议与可信执行环境（TEE）的透明性，旨在实现前沿的隐私与安全保证。其核心是基于零信任原则，通过密码学与硬件保护的结合，确保系统仅能获取群体的匿名化聚合洞察。 🔗 查看原文
ITBench-AA：前沿大模型在首个智能体企业IT任务基准测试中得分均低于50% — Hugging Face：Blog（RSS） (6小时前) 摘要：由Artificial Analysis和IBM推出的ITBench-AA SRE基准测试显示，所有前沿大模型得分均未超过50%。Claude Opus 4.7（自适应推理，最大努力）以47%领先，GPT-5.5（xhigh）和Qwen3.7 Max分别得46%和42%。该测试包含59个需要通过Shell命令调查Kubernetes事件快照并提交根因诊断的智能体任务。关键发现是模型推理轮次差异近3倍，但更长的轨迹并不转化为更高准确率，过度调查的模型会因提交误报而受罚。在成本方面，开源模型Gemma 4 31B（Reasoning）以每任务$0.14的成本获得37%得分，优于成本更高但得分更低的闭源模型。 🔗 查看原文
Fast， faster， Qwen. 🚀 — X：通义千问 / Qwen (@Alibaba_Qwen) (7小时前) 摘要：Qwen3.5在TokenSpeed推理引擎上，针对智能体工作负载达到了创纪录的580 tokens per second （tps）速度。这一成果由通义千问推理团队、lightseekorg Foundation TokenSpeed团队、NVIDIA及Mooncake团队共同实现，并采用了tri_dao的FlashAttention-4 （FA4）优化。此里程碑标志着开源大语言模型推理性能的边界得到了推动，相关详情可查阅PyTorch社区博客。 🔗 查看原文

💡 技巧与观点

用好 Coding Agent，重点是两头，尤其是开头的部分，如果一开始就走偏了后面怎么改都改不好。 — X：宝玉 (@dotey) (51分钟前) 摘要：用好 Coding Agent 的关键在于初始规划。方法是先将需求整理后，用最强模型（如 GPT-5.5、Claude Opus 4.7）分别在 Codex、Claude Code、Cursor 的 Plan 模式下生成设计方案，选择最优方案并借鉴其他版本。对于复杂计划，可将其拆分为多个 Phases 并明确要求与验证标准，形成 Markdown 文档。执行时按 Phases 进行，并辅以人工审核纠偏。最后的代码审核（Code Review）用 GPT-5.5 审核代码质量与设计符合度即可。应避免让多个智能体交叉 Review，否则可能导致代码越改越多。 🔗 查看原文
使用大语言模型保障源代码安全 — Claude：Blog（网页） (1小时前) 摘要：本文分享了使用 Claude Opus 构建威胁模型、发现代码漏洞并进行验证、分类和修复的最佳实践。其核心流程是一个六步循环：威胁建模、沙箱隔离、漏洞发现、验证、分类和修复。作者指出，漏洞发现现在易于并行化，瓶颈已转移到后续的验证与处理阶段。以他们对开源软件的扫描为例，截至2026年5月22日已披露1，596个漏洞，其中97个已修补。指南建议结合代码库文档和专家访谈来构建准确的威胁模型，以降低误报，提升发现的可利用性。 🔗 查看原文
AI智能体的零信任安全框架 — Claude：Blog（网页） (5小时前) 摘要：Anthropic 发布了针对企业部署自主 AI 智能体的安全框架，指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险：基础设施易受 AI 加速攻击，且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构（基础、高级、优化级）及八阶段实施流程，并概述了提示注入、工具投毒、记忆投毒等特有威胁。 🔗 查看原文
我认为 Anthropic 和 OpenAI 找到了产品市场契合点 — Simon Willison 博客 (7小时前) 摘要：Anthropic 与 OpenAI 通过编程智能体找到了产品市场契合点，这导致企业客户成本显著上升。两家公司已于 2026 年 4 月前后调整了企业套餐定价，从原先的高额折扣改为与 API 用量挂钩。Anthropic Enterprise 套餐变为每席位 20 美元/月外加 API 费用，OpenAI Codex 则按 API token 用量计费。同期发布的新模型 GPT-5.5（4月23日）和 Opus 4.7（4月16日）的 API 定价也显著高于前代版本。 🔗 查看原文
与Google搜索产品副总裁Robby Stein的访谈：AI原生搜索时代 — X：Kim (@kimmonismus) (7小时前) 摘要：本文记录了与Google搜索产品副总裁Robby Stein在Google I/O的访谈，核心探讨Google Search向"AI原生"模式的重大转变。讨论话题包括AI Mode是进化还是重塑、如何将复杂问题拆解为多轮搜索、AI搜索的高运行成本、Google TPU及基础设施的优势、AI时代搜索量不减反增的原因，以及优质AI回答与出版商流量之间的张力。访谈还涉及Google决定展示哪些信息源与链接的逻辑，并围绕一个核心问题展开：如果Google直接给出答案，传统的基于链接的网页生态将走向何方？ 🔗 查看原文
藏师傅发布小红书图文排版AI Skill，集成地图与自动配图 — X：歸藏 (@op7418) (13小时前) 摘要：该推文介绍了guizang-social-card-skill，一款针对小红书图文常见类别进行优化的AI Skill。其亮点在于为旅行博主集成了地图组件，用户输入目的地和线路后，AI能自动在底图上标记并嵌入图片。根据引用，该Skill完全基于HTML和实拍图片生成内容，不会被平台标注为AI生成，并会主动从高质量图片网站寻找对应主题图片，以优化图文排版。 🔗 查看原文
OpenAI 奥尔特曼称 AI 对白领冲击不如预期般严重：我很高兴自己当时错了 — IT之家（RSS） (16小时前) 摘要：暂无摘要 🔗 查看原文
使用 Codex 构建自改进税务智能体 — OpenAI：官网动态（RSS · 排除企业/客户案例） (17小时前) 摘要：OpenAI、Thrive 与 Crete 合作，使用 Codex 构建了一个自改进的税务智能体。该智能体能够自动处理报税流程，提升工作准确性并加速整体工作流。 🔗 查看原文

参与讨论

返回文章列表