AI 速递 2026-03-24
生成时间:2026/3/24 09:03:46(UTC: 2026-03-24T01:03:46.615Z)
数据来源:Trendshift · GitHub Trending
⭐ 39,355 · Python
字节跳动开源的 SuperAgent 框架,通过沙盒、记忆、工具、子 Agent 和消息网关来处理耗时数分钟到数小时的复杂任务。该项目提供了一套完整的企业级 Agent 编排与执行脚手架,非常适合需要构建长时间运行、多步骤协作的复杂业务 Agent 场景。
⭐ 83,544 · Python
让 AI Agent 能够轻松访问和操作网页的自动化工具库。这为构建基于 Web 的 RPA Agent 提供了开箱即用的底层交互能力,极大降低了视觉与 DOM 元素解析的工程门槛。
⭐ 5,462 · TypeScript
基于 Claude Code 的技能库,能将任何代码库转化为可交互、可搜索的知识图谱。它为 AI 辅助编程工具提供了一种新的上下文管理思路,非常适合用于大型遗留系统的代码理解和架构重构。
HopChain:用于可泛化视觉-语言推理的多跳数据合成
Section titled “HopChain:用于可泛化视觉-语言推理的多跳数据合成”👍 94 · arXiv
视觉语言模型在细粒度推理中常因长思维链(CoT)导致错误累积,本文提出了一种多跳数据合成方法来强化复杂推理链的训练。对于构建多模态 Agent 的开发者而言,这为如何构造高质量的视觉推理微调数据集提供了有效的方法论。
ProactiveBench:评估多模态大语言模型的主动性
Section titled “ProactiveBench:评估多模态大语言模型的主动性”👍 26 · arXiv
研究了多模态模型是否能在遇到困难(如物体被遮挡)时主动向用户请求帮助或干预,并推出了包含七个数据集的评测基准。这为 Agent 交互设计带来了重要启发:下一代 Agent 架构需要从“被动响应”转向“主动求助”,以提升复杂任务的容错率。
LLM 的 Y 组合子:用 λ 演算解决长上下文衰退问题
Section titled “LLM 的 Y 组合子:用 λ 演算解决长上下文衰退问题”👍 24 · arXiv
针对 LLM 上下文窗口固定的瓶颈,本文提出通过外部化 Prompt 并递归解决子问题的方式(递归语言模型),替代难以验证的开放式 REPL 循环。这为长上下文 Agent 的推理架构提供了一种基于函数式编程思想的确定性控制流方案。
-
OpenClaw v2026.3.23:修复了 Browser/Chrome MCP 的连接就绪判定逻辑,减少了 macOS 下的用户配置超时问题;优化了 CDP 环回浏览器的复用机制。这对依赖浏览器控制的 Agent 稳定性有显著提升。 Release 链接
-
LangChain langchain-openai==1.1.12:提升了核心库的最低版本要求,新增对 phase 参数的支持,并修复了流式 function_call 数据块中 namespace 字段丢失的问题。 Release 链接
-
CrewAI 1.11.1:新增用于 Flow 类内省的
flow_structure()序列化器,修复了非 OpenAI 模型的 HITL(人机协同)恢复配置丢失问题,并修补了 FileWriterTool 的路径穿越安全漏洞。 Release 链接
- OpenAI Codex CLI rust-v0.117.0-alpha.9:OpenAI 官方代码生成命令行工具的 Rust 版本发布了最新的 Alpha 更新,持续优化底层交互性能。 Release 链接
-
iPhone 17 Pro 成功演示运行 400B 参数大模型 有演示表明 iPhone 17 Pro 已经能够在端侧运行高达 4000 亿参数的 LLM。这一突破性进展意味着端侧推理算力和内存优化达到了新高度,将极大拓宽离线端侧 Agent 的应用场景。 原文链接
-
Gimlet Labs 获 8000 万美元 A 轮融资,解决 AI 推理瓶颈 该初创公司开发的技术允许 AI 推理任务在 NVIDIA、AMD、Intel、ARM 等不同架构芯片上同时运行。这种异构计算调度方案为 AI 基础设施工程师降低推理成本、打破单一硬件绑定提供了新思路。 原文链接
-
Holotron-12B:高吞吐量计算机操作 Agent 模型 Hugging Face 博客介绍了 Holotron-12B,这是一个专为“计算机使用(Computer Use)”设计的高吞吐量 Agent 模型。它为需要自动化执行复杂桌面任务的 RPA 开发者提供了一个强大的开源模型基座。 原文链接
-
如何在一天内微调特定领域的 Embedding 模型 Hugging Face 联合 NVIDIA 发布了关于快速构建领域专属 Embedding 模型的工程实践指南。文章详细介绍了数据准备和微调流程,对优化垂直领域 RAG 系统的检索召回率非常有指导价值。 原文链接
-
Cursor 推出 Composer 2 与后台自动化 Agent Cursor 近期密集发布更新,不仅推出了具备前沿编码能力的 Composer 2,还新增了基于触发器运行的自动化 Agent(Automations)以及 MCP 插件市场。这标志着 AI IDE 正在从“代码补全”向“全自动后台研发团队”演进。 原文链接
-
我是如何使用 Claude Code 提升生产力的 一篇深度的开发者经验分享,详细解析了如何将 Claude Code 融入日常工程工作流中。文章探讨了具体的 Prompt 技巧和上下文管理策略,适合一线工程师参考以优化 AI 辅助编程效率。 原文链接
-
教 Claude 为移动端 App 做 QA 测试 作者分享了利用 Claude 自动执行 iOS 和 Android 应用 QA 测试的工程实践。这展示了 LLM 在自动化测试领域的潜力,特别是如何处理 UI 状态和编写测试脚本。 原文链接
-
Rust 核心贡献者对 AI 的多元视角 Rust 项目维护者们分享了他们对 AI 工具在系统级编程中应用的看法与总结。讨论涵盖了 AI 生成代码的安全性、代码审查的挑战以及未来编译器与 AI 结合的可能性,值得底层基建开发者深思。 原文链接