Skip to content

AI 速递 2026-03-25

生成时间:2026/3/25 09:09:09(UTC: 2026-03-25T01:09:09.405Z)

数据来源:Trendshift · GitHub Trending

⭐ 39,355 · Python

字节跳动开源的超级智能体框架,支持研究、编码和创作,内置沙盒、记忆、工具和子智能体网关。工程视角来看,它提供了一套完整的复杂任务编排机制,非常适合需要长时间运行和多组件协同的企业级 Agent 架构选型。

⭐ 83,544 · Python

让 AI 智能体能够轻松访问和操作网页的自动化工具。这解决了 Agent 落地中极其关键的“网页端动作执行”痛点,为构建基于浏览器的 RPA 或自动化测试 Agent 提供了开箱即用的底层能力。

⭐ 24,427 · TypeScript

专为 Claude 打造的领先智能体编排平台,支持部署多智能体集群和自动化工作流。该项目原生集成了 Claude Code 和 RAG 能力,其企业级分布式集群架构为构建高可用的大规模对话式 AI 系统提供了极佳的参考。

⭐ 39,393 · Python

基于大语言模型的多智能体金融交易框架。虽然是金融垂直领域,但其多智能体在特定场景下的协作模式、信息流转和决策机制,对其他领域的 Multi-Agent 系统设计具有很强的借鉴意义。

推进原生形式化推理:基于智能体工具集成的强化学习

Section titled “推进原生形式化推理:基于智能体工具集成的强化学习”

👍 62 · arXiv

本文介绍了一个 5600 亿参数的 MoE 模型,通过智能体工具集成推理(TIR)提升了 Lean4 中的形式化推理能力。研究将推理任务拆解为自动形式化、草图绘制和证明三个独立能力,为工程上如何通过工具调用和强化学习增强大模型的复杂逻辑推理提供了清晰的架构思路。

OpenResearcher:用于长周期深度研究轨迹合成的完全开源流水线

Section titled “OpenResearcher:用于长周期深度研究轨迹合成的完全开源流水线”

👍 51 · arXiv

训练深度研究智能体需要交织搜索、证据聚合和多步推理的长周期轨迹数据,而现有方法高度依赖闭源 Web API。该研究提供了一个可复现的开源数据合成流水线,对需要微调或评测复杂长周期 Agent 的工程师来说,是极具实用价值的基础设施工具。

关注关键区域:面向高效视觉语言模型的高分辨率裁剪检索

Section titled “关注关键区域:面向高效视觉语言模型的高分辨率裁剪检索”

👍 56 · arXiv

视觉语言模型在处理高分辨率图像时面临精度与计算成本的权衡,低分辨率容易丢失关键细节(如小文本)。该论文提出了一种按需空间检索框架,对于构建多模态 Agent 来说,这种动态分辨率处理机制能大幅降低推理成本,同时保证对关键视觉信息的精准提取。

  • OpenClaw v2026.3.23:新增了阿里云百炼(ModelStudio)Qwen 模型的标准按量付费端点支持,并优化了 UI 组件库的对比度与图标设计。 Release 链接
  • LangChain (Core) v1.2.22:核心库常规更新,主要修复了 prompt.saveload_prompt 方法中的路径验证问题,并废弃了部分旧方法。 Release 链接
  • CrewAI v1.11.1:新增 flow_structure() 序列化器用于 Flow 类的内省,修复了多项安全漏洞(升级 pypdf 等依赖),并解决了非 OpenAI 模型在 HITL(人机协同)恢复时配置丢失的问题。 Release 链接
  • OpenAI Codex CLI rust-v0.117.0-alpha.14:OpenAI 官方基于 Rust 编写的 Codex 命令行工具发布了最新的 alpha 版本,持续优化终端环境下的 AI 编码体验。 Release 链接
  • Cursor Composer 2:Cursor 正式推出 Composer 2,在处理复杂编程任务时提供了前沿级别的代码生成性能,大幅提升了多文件协同修改的准确率。 Release 链接
  • Cursor 插件与 MCP 应用更新 (v2.6):新增了超过 30 个官方合作插件,并引入了 MCP(模型上下文协议)应用支持,允许团队共享私有插件并在 Agent 对话中渲染交互式 UI。 Release 链接

知名大模型网关 LiteLLM 的 1.82.8 版本在 PyPI 上遭遇供应链攻击,被植入了窃取凭证的恶意代码。这为所有依赖开源 AI 基础设施的团队敲响了警钟,建议立即检查并锁定安全的依赖版本。

这是一个专为苹果芯片设计的 LLM 推理调度器,通过感知存储层级来优化内存调度。对于在 Mac 平台上进行本地模型部署和端侧推理优化的工程师来说,这是一个极具参考价值的底层架构项目。

Hugging Face 博客深入解析了 Ulysses 序列并行技术,探讨了如何突破显存瓶颈以训练支持百万级 Token 上下文的大模型。文章对分布式训练架构和长文本处理机制有极高的工程指导意义。

一款创新的 CLI 工具,解决了 AI 编写前端代码时“盲写”的痛点。它允许 Agent 打开浏览器、交互并截图,通过视觉反馈来验证布局和报错,是闭环多模态编码 Agent 的优秀实践。

Anthropic 为其官方编码工具 Claude Code 推出了自动模式,允许 AI 在较少人工干预的情况下执行任务。这标志着官方工具正向更高自主性的 Agent 演进,同时也展示了如何在执行速度与内置安全护栏之间取得平衡。

一篇极具深度的技术博文,通过对现代大语言模型内部表征的“解剖”,探讨了模型破解(Hacking)的新思路以及模型内部可能存在的通用概念表示。适合从事模型可解释性和红队安全测试的研究者阅读。