yancey
  • 主页
  • 分类
  • 福利
  • 关于

© 2026 yancey.blog.

返回文章列表
体验分享#AI#Daily

AI HOT 日报 · 2026年05月22日

2026-05-22|yancey|23 分钟阅读

🚀 模型发布/更新

  • Aleph 2.0 与 Edit Studio — Runway:Changelog(网页) (5小时前) 摘要:正式发布 Aleph 2.0 及配套的 Edit Studio 创作工具。此次更新实现了创作流程的全面整合,将内容生成、编辑与后期制作集中于统一平台。新版本显著优化了多模态内容的处理效率,并提供了从构思到成品的一站式解决方案,旨在为创作者提供更流畅、集成的数字内容制作体验。 🔗 查看原文
  • LongCat-Video-Avatar-1.5:升级版音频驱动数字人视频生成框架 — 美团 LongCat:HuggingFace 新模型 (14小时前) 摘要:美团LongCat团队发布了LongCat-Video-Avatar-1.5,一个专注于音频驱动数字人视频生成的开源框架。其核心升级在于采用Whisper-Large音频编码器,显著优化了唇部动态的流畅度与自然度。该版本实现了精准的唇形同步、全身时序稳定性以及长视频中的身份一致性,并能泛化应用于动漫、动物及多人交互等复杂场景。通过基于DMD2的步蒸馏技术,模型仅需8步即可高效推理。团队还构建了一个涵盖多场景、多语言的人工评估基准,通过大规模主观评分与专家分析,验证了其在多项关键维度上的优异性能。 🔗 查看原文
  • 腾讯开源Hy-MT2多语言翻译模型 — X:腾讯混元 (@TencentHunyuan) (15小时前) 摘要:腾讯正式开源Hy-MT2多语言翻译模型,支持33种语言间的无缝互译。其7B与30B-A3B版本在开源模型中达到最先进的翻译性能,超越了许多参数规模大数十倍的模型。更具突破性的是,1.8B轻量级版本性能超越微软等主流商业API,并凭借腾讯AngelSlim 1.25-bit极量化技术,仅需440MB存储空间,即可在主流手机芯片上本地运行,推理速度较前代提升1.5倍,显著降低了高质量AI翻译的部署门槛。 🔗 查看原文

🛠️ 产品发布/更新

  • v2.1.147版本更新 — Claude Code:GitHub Releases(RSS) (3小时前) 摘要:本次更新引入了Workflow工具,支持确定性多智能体编排(默认关闭)。将/simplify命令重命名为/code-review,现可报告代码正确性问题并支持生成GitHub PR内联评论。改进了自动更新器(增加重试与错误报告)、大文件diff渲染性能,并优化了提示历史记录以避免重复条目。修复了多个关键问题,包括企业登录限制未生效、Windows下的PowerShell工具与终端闪烁问题、插件系统及shell快照的bug,并增强了沙箱安全性与终端兼容性。 🔗 查看原文
  • ChatGPT现已支持在PowerPoint中直接创建编辑演示文稿 — X:ChatGPT (@ChatGPTapp) (3小时前) _摘要:你是否曾这样想过:我真的不想做这个PPT。

好消息:ChatGPT现在可以直接在PowerPoint中创建和编辑演示文稿。

在PowerPoint中直接构建、更新、理解和优化演示文稿,同时保持幻灯片可编辑。

目前处于测试阶段,我们期待您的反馈 👀_ 🔗 查看原文

  • Gemini扩展应用连接,支持更多服务 — X:Gemini (@GeminiApp) (4小时前) _摘要:Gemini现在可以连接更多应用,包括@OpenTable、@Canva和@Instacart。

无论您是预订餐厅、制作传单还是订购杂货,Gemini不仅能查找信息,还能通过连接的应用帮助您无缝采取行动。_ 🔗 查看原文

  • Datasette Agent — Simon Willison 博客 (4小时前) 摘要:Datasette Agent是Datasette推出的首个可扩展AI助手,为用户提供对话式界面以查询数据,并支持通过插件生成图表。该工具基于其LLM Python库构建,是LLM与Datasette整合的重要成果。目前提供图表生成、AI图像创建和沙箱代码执行等官方插件。它既可运行于Gemini 3.1 Flash-Lite等云端模型,也支持通过LM Studio连接本地开源模型,具备可靠的工具调用与查询能力。 🔗 查看原文
  • Viggle推出3D格斗派对游戏Fight Anyone 3D — X:Viggle AI (@ViggleAI) (4小时前) _摘要:介绍Fight Anyone 3D🥊一款3D派对格斗游戏,可能是上班时玩起来最爽的游戏。

上传任何人的照片 → 一个可玩的3D格斗角色,带有语音、个性+招牌动作,由Viggle自研游戏引擎+模型打造。

公测期间100%免费+赠送20张礼品卡。玩得越多,赢得越多!

和同事对战。和朋友对战。和任何人对战。链接+教程+更多内容见下方推文串 ↓_ 🔗 查看原文

  • Codex实现全天候跨设备安全操控Mac — X:OpenAI Developers (@OpenAIDevs) (5小时前) 摘要:Codex随时随地,无处不在。 现在您的Mac无需解锁,Codex即可使用您的电脑。 通过手机,Codex可以安全地使用您Mac上的应用程序,即使屏幕关闭且处于锁定状态。 https://developers.openai.com/codex/app/computer-use#locked-use 🔗 查看原文
  • Codex周四更新:Appshots功能上线 — X:OpenAI Developers (@OpenAIDevs) (5小时前) 摘要:又是Codex周四,我们带来了更新。 首先是Appshots,一种将你工作上下文引入Codex的新方式。 在Mac上,按Command-Command即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac各计划中推出,企业版访问权限即将上线。 🔗 查看原文
  • 合作伙伴如何运用Opus强化网络安全 — Claude:Blog(网页) (6小时前) 摘要:多家企业正利用Claude Opus模型强化网络安全防御。Wiz通过其Red Agent,每周对超过15万个生产资产进行持续渗透测试,发现数千个高风险漏洞且误报率为零。Palo Alto Networks在不到三周内完成了相当于一年的渗透测试工作量。埃森哲将安全测试覆盖率从约10%提升至80%以上,涉及1600个应用和50万+个API,扫描周期从3-5天缩短至1小时内。应用主要围绕三个方向:开展大规模攻击性测试、缩短漏洞发现与修复的间隔,以及将受控AI系统部署到生产环境。 🔗 查看原文
  • Claude现已支持更多安全合规工具 — Claude:Blog(网页) (6小时前) 摘要:Anthropic宣布为Claude企业版及平台新增28项安全与合规工具集成。这些集成均通过Claude Compliance API实现,允许企业安全团队统一获取Claude的对话内容与活动事件,从而将其纳入现有的DLP、SIEM等监控与合规流程。新增合作伙伴包括Cloudflare、CrowdStrike、Microsoft Purview等28家供应商,覆盖数据安全、身份验证等多个关键领域,帮助企业快速将Claude接入现有安全平台,实现跨组织工具的统一治理与可视化监控。 🔗 查看原文
  • Gemini每日简报助你高效规划一天 — X:Gemini (@GeminiApp) (7小时前) 摘要:用Daily Brief开启高效一天。 Gemini现在能主动将最重要的事项整理成易于理解的待办清单,让你在早餐结束前就为一天做好准备。 🔗 查看原文
  • 发布 Kotlin版ADK与Android版ADK 0.1.0:在Android及其他平台构建AI Agent — Google Developers Blog(RSS) (7小时前) 摘要:Google发布了面向开发者的新工具包:Kotlin版ADK与Android版ADK 0.1.0。这两个工具包旨在帮助开发者构建AI Agent。其中,Kotlin版ADK将代理工作流引入后端项目开发;Android版ADK则专注于移动端应用,提供了构建AI代理所需的特定功能。此次发布为开发者提供了在Android生态及更广泛平台创建AI应用的官方工具基础。 🔗 查看原文
  • 推出 Gemini for Home 赋能服务提供商与硬件合作伙伴 — Google Developers Blog(RSS) (7小时前) 摘要:Google 通过推出全栈 Gemini AI 解决方案扩展其智能家居生态系统。该方案集成了先进的摄像头智能、自然语言查询功能和日常活动摘要能力。它为服务提供商和硬件制造商提供了现成的参考设计与API,使其无需大量研发投入即可构建主动式、品牌化的智能家居服务。该计划旨在超越基础设备控制,迈向能够理解情境并实时响应用户需求的AI原生智能家居。 🔗 查看原文
  • Shoplift by PixVerse快速生成平台原生广告视频 — X:PixVerse (@PixVerse_) (7小时前) 摘要:无需工作室,无需编辑队列。 将产品URL粘贴到Shoplift by PixVerse,几分钟内即可发布平台原生广告视频 --专为持续进行创意测试的DTC团队打造。 免费早期访问:https://shoplift.pixverse.ai 转发+关注+回复=300积分(仅限72小时) 🔗 查看原文
  • Replit企业版现已开放自助购买 — X:Replit (@Replit) (7小时前) _摘要:Replit Enterprise现已支持自助服务!

几分钟内即可:

  • 购买Replit Enterprise
  • 配置SSO + SCIM
  • 与团队开始协作开发

无需合同谈判,无需等待。_ 🔗 查看原文

  • Krea 2 推出 LoRA 微调系统 — X:Krea AI (@krea_ai) (9小时前) _摘要:为 Krea 2(测试版)引入 LoRA。

我们迄今最强大的微调系统;现在你可以用惊人的精度,在 Krea 2 上训练你自己的特定风格、对象或角色。

了解其工作原理 👇_ 🔗 查看原文

📈 行业动态

  • 加州州长纽森签署首创性行政令,为应对AI可能带来的劳动力市场冲击做准备 — X:Rohan Paul (@rohanpaul_ai) (3小时前) 摘要:加州州长纽森签署行政令,首次将AI引发的失业问题正式列为公共政策议题,要求各部门研究遣散费、就业保险及员工持股等保障措施。该命令认识到AI可能渐进式替代岗位任务,而非一次性取代整个职位,因此计划建立新的劳动力数据看板,以更早捕捉行业受到的冲击。政策核心在于探讨如何将AI带来的生产力红利,通过股权、薪酬支持等方式在企业与员工间进行更公平的分配。同时指出,单纯的职业培训可能无法解决被AI彻底取代的岗位所带来的根本性就业错配问题。 🔗 查看原文
  • 谷歌DeepMind在亚太启动AI气候加速器 — Google DeepMind:Blog(RSS) (4小时前) 摘要:亚太地区经济增长迅速,但极易受到气候变化影响,且现有绿色技术发展速度跟不上环境风险的增长。为此,Google DeepMind宣布启动首届专注于"AI for the Planet"的加速器计划。该计划为期三个月,面向亚太地区的初创企业、研究团队和非营利组织,旨在利用前沿人工智能技术解决自然、气候、农业和能源等领域的挑战。入选组织将获得专家指导、定制化支持,并可集成Google AI的前沿模型。计划将从新加坡的线下训练营开始,现已开放注册。 🔗 查看原文
  • Anthropic即将成为首个盈利的AI实验室 — The Decoder:AI News(RSS) (8小时前) 摘要:根据《华尔街日报》报道,Anthropic正接近实现其首个盈利季度,预计第二季度营收达109亿美元,运营利润为5.59亿美元。该公司在去年夏季时还预计最早在2028年才能盈利。主要增长动力来自编程工具和Claude的代理功能使用,其需求一度超过了可用的算力容量。这一转变标志着Anthropic可能成为业界首个实现盈利的领先AI研发机构。 🔗 查看原文
  • Intuit将裁员逾3000人,以重新聚焦人工智能 — Hacker News 热门(buzzing.cc 中文翻译) (19小时前) 摘要:软件公司Intuit宣布将裁员超过3000人,作为其战略重组的一部分。此次裁员旨在将公司资源重新聚焦于人工智能(AI)领域的发展,以适应技术趋势并提升长期竞争力。裁员规模约占其全球员工总数的10%。 🔗 查看原文
  • 首部100%AI生成电影亮相戛纳,剑指2026院线 — X:可灵 Kling AI (@Kling_ai) (21小时前) 摘要:AI电影项目RAPHAEL在戛纳亮相。该片由Mateo AI Studio与韩国MBC C&I的AI内容实验室联合开发,全程使用Kling AI视频模型进行制作,旨在实现独特的视觉效果与差异化的观影体验。项目计划于2026年登陆院线,其大规模制作旨在证明纯AI电影制作的工业可行性,标志着AI原生院线电影新趋势的开端。 🔗 查看原文
  • 商汤连续十年领跑中国计算机视觉市场 — X:商汤 SenseTime (@SenseTime_AI) (21小时前) 摘要:商汤科技被IDC连续十年评为中国计算机视觉市场第一。其关键驱动因素包括:主导推进CV 2.0架构演进,原生嵌入生成式AI能力;海外市场扩展至12个国际区域,服务超500家企业客户并保持高留存率;以年度经常性收入增长为锚点实现盈利性增长;并从项目制交付转型为高度可扩展的AI平台。这一十年市场领导地位为其引领计算机视觉与生成式AI的融合浪潮奠定了基础。 🔗 查看原文
  • FSD正式登陆中国大陆市场 — X:小互 (@xiaohu) (22小时前) _摘要:FSD来了…

官宣进入大陆…_ 🔗 查看原文

💡 技巧与观点

  • Cloudflare首席执行官谈如何决定用人工智能取代哪些员工 — Hacker News 热门(buzzing.cc 中文翻译) (4小时前) 摘要:Cloudflare首席执行官在《华尔街日报》撰文,分享其公司用AI替代部分员工的决策逻辑。该文于2026年5月21日发布,引发了技术社区的广泛讨论,在Hacker News上获得100个点赞。 🔗 查看原文
  • 核算OpenAI和Anthropic最新动态背后的数学 — Gary Marcus:The Road to AI We Can Trust(RSS) (6小时前) 摘要:OpenAI与Anthropic近期相继发布重要产品更新。Claude 3.5 Sonnet在多项基准测试中超越GPT-4o,同时宣布API价格下调50%。Anthropic披露其模型训练成本年均增长约3.2倍,而OpenAI被曝已通过企业服务实现单季度超10亿美元营收。两家公司在技术突破与商业化竞赛中,正通过精密的成本核算与性能权衡重塑行业格局。 🔗 查看原文
  • 构建云端智能体的经验总结 — Cursor Blog (12小时前) 摘要:云端智能体已从本地智能体的简单扩展,发展为具备独立环境、可并行无人值守处理长任务的系统。构建的核心经验在于:完整的开发环境是输出质量的关键,这需重建大量基础设施;可靠性方面,团队从自研架构迁移至Temporal平台,将可靠性提升至99.9%以上,该平台每日处理超5000万次操作,支撑超40%的代码拉取请求;同时,实现了智能体循环、机器状态与对话状态的解耦,以适应复杂的跨环境协作。 🔗 查看原文
  • 游戏开发门槛被AI大幅降低 — X:阿易 AI Notes (@AYi_AInotes) (15小时前) 摘要:Grok展示了AI深度介入游戏开发的全新工作流。通过"提示词生成角色图→图片转动画视频→自动拼接成Spritesheet→导入引擎"四步流程,将传统需要美术与动画师耗时数天的工作,在几分钟内完成。这标志着AI不再仅生成静态内容,而是能实时生成可直接导入Unity或Godot等游戏引擎的可运行资产。该技术极大压缩了游戏原型的迭代周期,将反馈循环从"天"缩短至"秒",使得独立开发者也能快速实现创意,显著降低了游戏创作的门槛。 🔗 查看原文
  • 谷歌高级副总裁曼尼卡:AI短期内不会摧毁就业市场 — IT之家(RSS) (16小时前) 摘要:谷歌高级副总裁詹姆斯·曼尼卡近日表示,AI短期内不会摧毁就业市场,也不同意"大规模失业"的激进预测。他援引其2017年参与的麦肯锡报告指出,自动化将同时导致岗位减少、新岗位出现以及现有岗位被重新定义。他认为当前争议在于这三种情况的占比,而非是否发生。曼尼卡批评AI行业放大了公众焦虑,这种恐慌可能削弱技术价值。他强调,AI最大的影响是改变工作内容与方式,而非让职业消失。 🔗 查看原文
  • 开源Suno技能:一键生成任意风格AI音乐 — X:Vista (@vista8) (21小时前) 摘要:这是基于Suno AI音乐生成工具的技能实现,可通过简单指令按用户需求生成不同风格的歌曲(例如德语空灵风格)。该技能订阅费用为每月10美元,支持高度自定义的风格生成。技术层面已优化,新增近6000个音乐风格检索以提升准确性,并可通过谷歌CDP免登录直接调用。项目已开源,提供GitHub仓库地址与安装指令,降低了创作门槛。目前AI生成音乐在艺术性上仍与人工制作存在差距,但实现了快速、灵活的创作可能。 🔗 查看原文

参与讨论

  • 🚀 模型发布/更新
  • 🛠️ 产品发布/更新
  • 📈 行业动态
  • 💡 技巧与观点