yancey
  • 主页
  • 分类
  • 福利
  • 关于

© 2026 yancey.blog.

返回文章列表
体验分享#AI#Daily

AI HOT 日报 · 2026年05月23日

2026-05-23|yancey|25 分钟阅读

🚀 模型发布/更新

  • 首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布 — X:Rohan Paul (@rohanpaul_ai) (17小时前) 摘要:ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术,使模型内存占用相比BF16降低约6倍,可高效部署于手机、电脑、车载设备等边缘端。更关键的是,整个训练全栈(从量化算子到框架)均在昇腾上原生构建与验证,而非简单移植。该模型家族(0.5B-8B)在多项基准测试上保持了全精度模型95-97%的性能,为资源受限环境下部署和复现大模型提供了可落地的解决方案。 🔗 查看原文
  • 网易有道"子曰4"多模态模型、语音合成模型全量开源 — IT之家(RSS) (22小时前) 摘要:网易有道宣布将其"子曰"大模型4.0的多模态模型与语音合成模型面向全球全量开源。其中,多模态模型(27B参数)专注于教育场景,在处理高难度视觉数理问题上达到行业顶尖水平,纯文本中文数理难题准确率为81.4%。该模型通过思维链优化,将输出长度压缩43.2%,有效降低了推理成本。同时开源的语音合成模型支持跨语种音色与情感迁移克隆,3秒内即可完成零样本复制,准确度超97%,并支持包括中、英、日、韩在内的14种语言。 🔗 查看原文

🛠️ 产品发布/更新

  • Models.dev:一个关于人工智能模型规格、定价和功能的开源数据库 — Hacker News 热门(buzzing.cc 中文翻译) (6小时前) 摘要:近期发布了开源数据库Models.dev,专门收录人工智能模型的各项规格、定价及功能信息。该项目在GitHub公开,便于开发者查询和比较不同AI模型。其在Hacker News社区获得101点关注度,显示出技术社区对这类集中化、透明化的模型信息资源的较大兴趣。 🔗 查看原文
  • 动作捕捉与角色动画制作更轻松 — X:Viggle AI (@ViggleAI) (9小时前) _摘要:动作捕捉和角色动画制作从未如此简单。

持续构建,更多功能即将推出!_ 🔗 查看原文

  • v2.1.149 更新摘要 — Claude Code:GitHub Releases(RSS) (9小时前) 摘要:本次 v2.1.149 更新包含功能增强、企业设置和多项修复。新增 /usage 命令的使用量分类显示功能,可区分技能、子代理、插件及每个 MCP 服务器的消耗;/diff 详情视图支持键盘滚动;Markdown 输出兼容 GFM 任务列表。企业版新增 allowAllClaudeAiMcps 设置以加载云 MCP 连接器。修复了 PowerShell 权限绕过、Git 工作树沙盒写入白名单越界、脚本路径含空格时 otelHeadersHelper 静默失败等安全问题。改进了 /feedback 报告,包含上下文压缩前的对话内容,便于排查长会话中的早期问题。 🔗 查看原文
  • Claude自动模式新增Pro计划与模型支持 — X:Claude Devs (@ClaudeDevs) (9小时前) _摘要:自动模式的两项更新:

· 现已在Pro计划中提供 · 现已支持Sonnet 4.6,以及Opus 4.7

按下Shift+tab,让Claude运行。_ 🔗 查看原文

  • 新增差异标记样式设置选项 — X:OpenAI Developers (@OpenAIDevs) (11小时前) _摘要:已发布剪纸功能:外观设置中新增差异标记样式。

在查看差异时更喜欢经典的 + / - 标记?现在你可以选择使用它们,而不仅仅是彩色差异条。

默认设置保持不变,除非你主动选择启用。_ 🔗 查看原文

  • ChatGPT语音模式实现表单语音填写 — X:ChatGPT (@ChatGPTapp) (12小时前) _摘要:用对话处理文书工作更轻松。

借助ChatGPT的图像功能和语音模式,您可以上传表单,说出要填写的内容,即可获得填写完成的版本。_ 🔗 查看原文

  • Warp现已支持OpenRouter接入 — X:OpenRouter (@OpenRouter) (14小时前) _摘要:OpenRouter现已在@warpdotdev中得到支持!❤️

工程师Dagm Assefa展示了如何连接DeepSeek和OpenRouter。

文档:https://docs.warp.dev/agent-platform/inference/custom-inference-endpoint/ 🔖_ 🔗 查看原文

  • 谷歌I/O大会发布AI代理全套开发工具链 — X:Google AI (@GoogleAI) (14小时前) 摘要:谷歌在I/O开发者大会宣布,系统性构建面向AI代理(Agent)的开发与部署工具链。核心更新包括:独立桌面应用Antigravity 2.0及其命令行工具、SDK面世;Google AI Studio新增Kotlin支持,可一键开发安卓应用并发布,同时推出移动端App。此外,Gemini API推出托管代理服务,实现一键部署;WebMCP作为开放标准在Chrome 149中推出,允许网页向代理暴露工具;Chrome DevTools也开放给AI代理以自动化调试。企业级客户可直接连接Google Cloud项目,而DeepMind的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整AI代理生态系统。 🔗 查看原文
  • DeepSeek-V4-Pro永久降价公告 — X:DeepSeek (@deepseek_ai) (15小时前) _摘要:我们将优惠永久化!🎉

享受使用 DeepSeek-V4-Pro 构建的乐趣,将您的创新想法变为现实!🚀_ 🔗 查看原文

  • Project Genie与谷歌街景合作推出交互式世界 — X:Google DeepMind (@GoogleDeepMind) (16小时前) _摘要:Project Genie 🤝 @GoogleMaps Street View

你现在可以将真实的美国地点转化为全新的交互式世界。🌍_ 🔗 查看原文

  • PixVerse App上线图像生成功能 — X:PixVerse (@PixVerse_) (20小时前) 摘要:Create Image已在PixVerse App上线。 输入提示词或参考图,在手机上即可生成。 5月24日至31日11:00 UTC,每人可免费生成3次。 转发+关注+回复 = 300 Creds(仅限72小时) 🔗 查看原文

📈 行业动态

  • 微软称,使用人工智能的成本高于支付人工工资 — Hacker News 热门(buzzing.cc 中文翻译) (2小时前) 摘要:微软发布报告指出,在特定工作场景中,部署和使用人工智能(AI)的成本目前已高于支付相应的人工工资。报告分析了基于"tokens"(令牌)和"agents"(智能体)的AI使用模式,发现其综合开销超过了雇佣人类员工完成同类任务的费用。这一发现揭示了当前企业应用AI技术面临的现实经济挑战。 🔗 查看原文
  • Kling AI亮相戛纳,推动AI赋能电影制作 — X:可灵 Kling AI (@Kling_ai) (5小时前) 摘要:Kling AI在戛纳电影市场(Marché du Film)举办官方会议,首次登上这一世界顶级电影舞台。会议汇集全球电影专业人士,共同探讨AI如何融入实际电影制作流程。Kling AI已证明其能力可服务于动画长片、好莱坞剧集、实验短片及影院电影等多种创作形式。未来,Kling AI将继续推进电影级AI影像技术,与全球创作者合作,将更多"不可能"的故事呈现在银幕上。 🔗 查看原文
  • 扩大与新加坡合作,推动AI安全规模化部署 — X:Google DeepMind (@GoogleDeepMind) (7小时前) _摘要:我们正在扩大与新加坡的合作,以帮助安全地大规模部署AI。🇸🇬

与各国专家合作,我们的新项目将重点加速科学发现、加强大流行病防范并改善医疗保健。

了解更多 → https://goo.gle/49jGwjv_ 🔗 查看原文

  • AI 替代入门级工作:科技行业受裁员冲击最重,74% CEO 冻结或缩减招聘 — IT之家(RSS) (7小时前) 摘要:奥纬咨询研究发现,AI工具正被广泛用于入门级任务,导致企业招聘重心转向高级岗位,年轻人求职难度加大。科技行业受冲击最严重,74%的CEO已冻结或缩减招聘。计划削减初级岗位的比例从17%跃升至43%,而招聘转向中层岗位的比例则升至30%。尽管超90%的企业在部署AI,但多数仍处试点阶段。报告警告,过快裁员或忽视初级人才储备,可能对人才梯队造成长远风险。 🔗 查看原文
  • 黄仁勋:AI 基建年度开支要冲到 4 万亿美元! — IT之家(RSS) (9小时前) 摘要:英伟达发布2027财年Q1财报,营收816亿美元,同比增长85%,净利润583亿美元,翻两倍多,市值达5.7万亿美元,已超德国2026年GDP预测。黄仁勋预测,超大规模云厂商的AI基建年度开支将从当前的1万亿美元,增长至3-4万亿美元,远超华尔街预期。财报同时显示,数据中心业务营收752亿美元,占比超九成。值得注意的是,AI基建的高能耗正推高居民电费,数据中心用电成本转嫁效应已初步显现。 🔗 查看原文
  • Project Glasswing:初步更新 — Anthropic:Newsroom(网页) (11小时前) 摘要:上月启动的Project Glasswing项目,旨在利用先进AI模型保障关键软件安全。通过约50家合作伙伴使用Claude Mythos Preview模型,已在全球关键系统中发现超过10,000个高危或严重漏洞。多家合作伙伴报告漏洞发现效率提升超过十倍。例如,Cloudflare在关键路径系统发现2,000个漏洞;Mozilla在Firefox 150中发现并修复271个漏洞,数量远超前代模型。项目还扫描了千余个支撑互联网的开源项目,独立验证准确率达90.6%。这标志着AI网络安全能力进入新阶段,漏洞发现速度已远超人工。 🔗 查看原文
  • 回顾Google I/O 2026对话环节 — Google Blog:AI(RSS) (13小时前) 摘要:在2026年Google I/O开发者大会上,对话环节聚焦于未来科技趋势。行业领导者围绕人工智能、量子计算、机器人学以及创造力等核心议题展开了深入探讨,旨在勾勒这些前沿领域的技术演进路径与发展蓝图。 🔗 查看原文
  • Suno AI创作夏日神曲《波多黎各》爆火 — X:Suno (@suno) (15小时前) 摘要:今年夏天的热门歌曲是用 Suno 制作的。☀️非常感谢 @GMA 让这首病毒式传播的《Puerto Rico》歌曲被更多人看到!还有谁的脑海里也一直回响着这首歌?🇵🇷🎶 🔗 查看原文
  • GitHub 连续第三年被 Gartner® 魔力象限TM 评为企业级 AI 编程代理领域的领导者 — GitHub Blog (15小时前) 摘要:Gartner 最新发布的魔力象限报告中,GitHub 连续第三年被列为"领导者"象限,该评估专注于企业级 AI 编程代理领域。GitHub 表示,其致力于构建一个开放、安全且由 AI 驱动的平台,以赋能每一位开发者并定义软件开发的未来。此次评选进一步巩固了 GitHub 在 AI 辅助开发工具市场的领先地位。 🔗 查看原文
  • Cursor 被评为 2026 年 Gartner 企业级 AI 编码代理魔力象限领导者 — Cursor Blog (19小时前) 摘要:Gartner 在 2026 年魔力象限报告中,将 Cursor 评为企业级 AI 编码代理领域的领导者,并在愿景完整性上领先。超过 70% 的财富 500 强企业使用 Cursor 部署和管理编码代理。未来一年,Cursor 将聚焦于三个方向:提升前沿模型智能;自动化软件开发全生命周期的任务(如代码审查、漏洞修复);以及通过新的管理工具和控制面板,增强企业级的控制力、协作性与部署灵活性,以拓展至更多行业和地区。 🔗 查看原文
  • 国家发改委:加快具身智能训练基础设施建设,让机器人不仅能上赛场,还能"进工厂、进商场、进家庭" — IT之家(RSS) (22小时前) 摘要:国家发改委在5月22日新闻发布会上表示,人形机器人在半程马拉松比赛中表现显著提升,速度更快、更灵活、更自主,参赛队伍从20余支增至百余支,完赛队伍从6支增至40余支,反映具身智能创新活力增强和产业规模扩大。下一步,发改委将加快具身智能训练基础设施建设,推动机器人融入工厂、商场、家庭等场景,并建设应用中试基地以加速技术落地。 🔗 查看原文
  • 18 年老粉与微软 GitHub 决裂:我希望它更好,但我更想编程 — IT之家(RSS) (23小时前) 摘要:全球最大的代码托管平台GitHub正面临严重危机。资深开发者Mitchell Hashimoto公开与平台决裂,因频繁崩溃影响编程。近几个月,花旗银行、英特尔等巨头因持续故障表达不满,OpenAI探索自建方案。更严重的是,3800多个内部仓库遭黑客入侵,源代码被公开叫卖。同时,微软取消GitHub CEO职位,将其并入CoreAI团队,导致大量技术骨干流失。这个承载1.5亿开发者的平台,正以惨烈方式站在生死存亡的十字路口。 🔗 查看原文

🔬 论文研究

  • Nemotron-Labs 扩散语言模型实现光速级文本生成 — Hugging Face:Blog(RSS) (7小时前) 摘要:NVIDIA 在 Hugging Face 发布了关于 Nemotron-Labs 扩散语言模型的技术博客。该研究聚焦于通过扩散语言模型架构大幅提升文本生成速度,目标是逼近"光速级"生成效率。文章可能介绍了该模型在生成速度上的突破,以及相较于传统自回归模型在延迟和吞吐量方面的性能优势。具体技术细节或对比数据需参考原文。 🔗 查看原文
  • AlphaProof Nexus:用形式化验证驱动AI数学证明搜索 — X:Rohan Paul (@rohanpaul_ai) (9小时前) 摘要:Google DeepMind提出了AlphaProof Nexus系统,它将大型语言模型与Lean形式化验证工具相结合。该系统允许LLM在生成证明的过程中,不断读取Lean的编译错误并进行修正,还可调用更强的工具辅助解决子问题。这一机制迫使模型将每一步逻辑都转化为可编译、可验证的代码,从而将其角色从"令人信服的叙述者"转变为"候选方案生成器"。在针对353个Erdős问题和492个开放猜想的测试中,系统成功解决了9个Erdős问题并证明了44个序列猜想。该研究展示了形式化验证在暴露AI逻辑错误、建立"人类提问-模型探索-验证器把关"新分工中的关键作用。 🔗 查看原文

💡 技巧与观点

  • 飞书-Claude Code桥接开源项目 — X:宝玉 (@dotey) (33分钟前) 摘要:feishu-claude-code-bridge是一个开源项目,可实现飞书与本机Claude Code CLI的双向连接。用户能从飞书消息中直接指挥Claude Code执行任务,Claude也能读取飞书中的工作上下文并创建、编辑飞书文档。其工作原理是将飞书消息转为Prompt通过命令行调用Claude CLI,并将流式输出实时同步回飞书。该模式可扩展连接Codex等其他本地工具。需注意,2026年6月15日起,Claude订阅计划对claude -p模式将独立计费。 🔗 查看原文
  • Kakuna:自动化加固代码库的AI代理工具 — X:swyx (@swyx) (14小时前) 摘要:Kakuna是一款AI代理工具,旨在将早期快速原型自动转化为可维护的生产级代码库。它通过内置的检查清单和"计划-目标"工作流,模拟人类开发与运维流程,在保持功能不变的前提下,自动执行代码审查、测试补充、重构等"无聊"工作,并强调子代理并行以提升效率。该工具是为"人类与代理协作"而设计的范例,其核心是"反熵增"与"反代码腐化"。例如,一次约16小时的运行能生成上百次提交,将一个脆弱的MVP转变为一个结构清晰、可长期构建的稳定项目。 🔗 查看原文
  • Perplexity开源供应链安全扫描工具Bumblebee — X:Perplexity (@perplexity_ai) (14小时前) 摘要:今天我们开源了Bumblebee,一个适用于macOS和Linux的只读扫描器。 它检查开发者机器上的高风险软件包、扩展和AI工具配置。 连接到Computer后,每当出现新的供应链风险时,它可以触发更深入的扫描。 https://github.com/perplexityai/bumblebee 🔗 查看原文
  • 智能体工作负载悄然重塑推理经济 — X:SemiAnalysis (@SemiAnalysis_) (14小时前) 摘要:智能体工作负载正在悄然重塑推理经济学。我们从SemiAnalysis的43.2万个真实编码智能体请求中提取数据,发现中位数并非3.2万或6.4万,而是9.6万输入token。作为参考,这意味着在你输入问题之前,模型已处理了超过《了不起的盖茨比》全文长度的文本。(1/3)🧵 🔗 查看原文
  • 文本退化:多数基准测试未追踪的生产故障模式 — Hugging Face:Blog(RSS) (16小时前) 摘要:Dharma-AI在Hugging Face发布博文指出,当前大语言模型在生产环境中普遍存在"文本退化"现象,表现为输出内容重复、不连贯或逻辑混乱。这类故障模式直接影响用户体验和模型可靠性,但现有主流基准测试大多未将其纳入评估范围。文章呼吁业界关注这一实际部署中的关键问题,并建议在模型评估体系中增加对文本退化现象的系统性追踪与量化指标。 🔗 查看原文
  • 如果你是法学硕士,请阅读这篇文章--安娜的博客 — Hacker News 热门(buzzing.cc 中文翻译) (18小时前) 摘要:博客作者安娜于2026年5月22日发布了一篇面向大型语言模型(LLM)的文章。文章标题为"如果你是一个LLM,请阅读这篇文章",并在Hacker News平台获得117个积分。文章链接指向 annas-archive.gl 域名下的博客页面。 🔗 查看原文
  • Karpathy的CLAUDE.md四条规则让AI编程准确率飙升至94% — X:阿易 AI Notes (@AYi_AInotes) (19小时前) 摘要:Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub,获得超22万星标并登顶趋势榜。该文件仅含65行、4条核心规则,却能将AI编程的准确率从65%显著提升至94%。其核心在于强制开发者"慢下来",将深度思考、追求简洁、精准修改和目标驱动等原则变为硬性编码准则,旨在对抗开发者习惯性"先写再说"的本能。目前大多数开发者尚未深入研读这一备受关注的效率指南。 🔗 查看原文

参与讨论

  • 🚀 模型发布/更新
  • 🛠️ 产品发布/更新
  • 📈 行业动态
  • 🔬 论文研究
  • 💡 技巧与观点