AI 速递 2026-05-26
生成时间:2026/5/26 10:00:32(UTC: 2026-05-26T02:00:32.408Z)
SkillOpt:自进化 Agent 技能的执行策略
Section titled “SkillOpt:自进化 Agent 技能的执行策略”👍 159 · arXiv
现有 Agent 技能多为手工制作或单次生成,缺乏类似深度学习优化器的可靠反馈改进机制。本文提出将技能作为冻结 Agent 的外部状态进行训练,引入严格的优化策略。这对构建具备自我迭代和进化能力的复杂 Agent 架构具有重要的工程启发。
SciAtlas:面向自动化科学研究的大规模知识图谱
Section titled “SciAtlas:面向自动化科学研究的大规模知识图谱”👍 47 · arXiv
针对当前学术检索工具依赖浅层关键词或向量检索、缺乏拓扑推理能力的问题,本文构建了一个大规模知识图谱。该研究为基于 RAG 的科研 Agent 提供了结构化知识组织的范式,有助于提升复杂跨学科信息的检索与推理准确度。
StepAudio 2.5 技术报告
Section titled “StepAudio 2.5 技术报告”👍 37 · arXiv
统一的音频-语言模型致力于将大语言模型的推理能力引入语音任务,但现有模型在 ASR、TTS 和实时交互方面往往难以媲美专用系统。本报告详细介绍了 StepAudio 2.5 的架构设计,为开发具备高质量实时语音交互能力的多模态 Agent 提供了工程参考。
Lens:重新思考基础文生图模型的训练效率
Section titled “Lens:重新思考基础文生图模型的训练效率”👍 90 · arXiv
本文推出了 3.8B 参数的文生图模型 Lens,其性能媲美甚至超越了 6B 参数的 SOTA 模型,但仅需约 19.3% 的训练算力。这为多模态生成模型的降本增效和高效训练架构设计提供了极具价值的实践经验。
- OpenClaw v2026.5.24-beta.2:新增对 iMessage 表情回复(点赞/踩)的解析支持,分别映射为单次允许或拒绝操作。同时优化了网关性能,复用进程稳定的通道目录读取以避免重复的边界检查。Release 链接
- Cursor Composer 2.5:Composer 2.5 正式上线,进一步提升了 AI 辅助编码的上下文理解与代码生成体验。Release 链接
- Cursor Cloud Agents Dev Environments:为云端 Agent 引入了完整的开发环境支持,包括克隆仓库、安装依赖、内部工具链凭证及访问构建系统,使其能够端到端完成工程任务。Release 链接
- Cursor Automations Improvements:Agent 窗口新增 Cursor Automations 功能,支持配置关联多个代码仓库或无仓库的自动化任务。Release 链接
- Cursor Parallel Agents & PR Review:引入全新的 PR 审查体验,支持通过并行 Agent 更快地执行构建计划,并新增了常见工作流的快捷操作。Release 链接
DeepSeek 旗舰 AI 模型永久降价 75% DeepSeek 宣布对其旗舰模型实施 75% 的永久降价。这一激进的定价策略将大幅降低开发者调用 API 的成本,直接影响企业级 AI 应用的 ROI 评估与多模型路由选型。原文链接
内存成本已占 AI 芯片组件成本的近三分之二 Epoch AI 数据显示,内存在 AI 芯片组件中的成本占比已飙升至近 66%。这揭示了当前大模型推理与训练面临的核心硬件瓶颈,对未来算力集群的架构设计和成本控制具有重要指导意义。原文链接
解锁连续批处理(Continuous Batching)中的异步机制 Hugging Face 深入探讨了在 LLM 推理的连续批处理过程中引入异步机制的技术细节。该方案能有效提升 GPU 利用率和吞吐量,是优化高并发推理服务基础设施的关键参考。原文链接
开放 Agent 排行榜(The Open Agent Leaderboard)发布 Hugging Face 联合 IBM Research 推出了 Open Agent Leaderboard,旨在标准化开源 Agent 的评估体系。这为开发者在选择和对比不同 Agent 框架及底层模型时提供了量化的基准支持。原文链接
厘清 AI Agent 核心术语:Harness 与 Scaffold Hugging Face 博客撰文梳理了 AI Agent 领域的关键工程术语,重点辨析了测试工具(Harness)与脚手架(Scaffold)的概念边界。这有助于统一开发者在构建复杂 Agent 系统时的架构语言。原文链接
Claude 成功发现 Apple macOS 26.5 内核漏洞 安全研究人员利用 Claude 发现了 macOS 内核的高危漏洞 (CVE-2026-28952)。这标志着大模型在复杂系统级代码审计和自动化安全漏洞挖掘场景中的工程化应用达到了新高度。原文链接
观点:Claude 不是你的架构师,停止让它越俎代庖 一篇引发热议的工程博文指出,尽管 LLM 在编码辅助上表现优异,但开发者不应将其视为系统架构师。文章强调了在 AI 时代保持人类工程师在系统设计、边界划分和技术选型上主导权的重要性。原文链接