AI 速递 2026-03-15

生成时间：2026/3/15 09:15:00（UTC: 2026-03-15T01:15:00.657Z）

开源热门

数据来源：Trendshift · GitHub Trending

volcengine/OpenViking

⭐ 8,936 · Python

字节跳动开源的专为 AI Agent 设计的上下文数据库。工程视角来看，它通过文件系统范式统一管理 Agent 的记忆、资源和技能，非常适合解决复杂 Agent 架构中的多层级上下文传递与状态持久化问题。

microsoft/BitNet

⭐ 33,521 · Python

微软官方推出的 1-bit 大语言模型推理框架。该项目为极端量化模型的端侧部署和极低显存推理提供了基础设施层面的参考实现，是降低大模型服务成本的重要探索方向。

promptfoo/promptfoo

⭐ 15,905 · TypeScript

用于测试和评估 Prompt、Agent 以及 RAG 系统的开源工具。它支持通过声明式配置和 CI/CD 集成来进行大模型的红蓝对抗与性能对比，是构建生产级 LLM 应用不可或缺的测试基建。

lightpanda-io/browser

⭐ 14,934 · Zig

专为 AI 和自动化设计的无头浏览器。相比传统的 Puppeteer/Playwright，它在底层进行了针对性优化，能显著降低 Web Agent 执行网页交互任务时的资源消耗与延迟，非常适合大规模 RPA 场景。

论文精选

IndexCache：通过跨层索引复用加速稀疏注意力机制

👍 35 · arXiv

针对长上下文 Agent 工作流中的注意力计算瓶颈，本文提出通过复用跨层索引来加速稀疏注意力计算。这为降低生产环境中长文本大模型的推理延迟和显存开销提供了极具工程价值的优化思路。

战略导航还是随机搜索？智能体与人类在文档集合推理中的对比

👍 48 · arXiv

研究引入了基于真实异构 PDF 的 MADQA 基准测试，深入探讨多模态 Agent 在处理复杂文档工作流时，究竟是具备真正的战略推理能力还是仅靠随机试错。这对于评估和改进 RAG 系统的检索与复杂推理架构具有重要指导意义。

面向计算机操作智能体的基于视频的奖励建模

👍 33 · arXiv

针对 Computer-Use Agent 轨迹评估难以扩展的问题，本文提出直接从独立于 Agent 内部状态的执行视频关键帧中进行奖励建模。这种方法为自动化评估 GUI Agent 的任务完成度提供了一种解耦且可扩展的工程方案。

XSkill：多模态智能体基于经验与技能的持续学习

👍 20 · arXiv

论文探讨了在开放环境中，如何让多模态 Agent 通过历史轨迹提取可复用的经验与技能，从而在不更新模型参数的情况下持续提升工具调用能力。这为构建具备自我进化能力的复杂 Agent 编排系统提供了理论支撑。

版本更新

OpenClaw v2026.3.13-1 修复了上下文压缩（compaction）功能中基于全会话 token 计数的后置检查逻辑。这是一个针对 GitHub Release 标签冲突的恢复性版本，对应的 NPM 包版本仍为 2026.3.13。 Release 链接
LangChain (Anthropic) v1.3.5 新增对 eager_input_streaming 的支持，并修复了缓存创建字段的通用使用逻辑。同时更新了模型配置文件，提升了与 Anthropic 最新 API 的兼容性与性能。 Release 链接
Ollama v0.18.0 云端模型不再需要通过 ollama pull 手动下载，设置 :cloud 标签即可自动连接。此外，ollama launch claude 现已支持为 Claude Code 设置上下文压缩窗口，进一步优化了本地与云端模型的协同体验。 Release 链接

开发者工具

Continue v1.3.33-vscode 集成了 AI SDK provider，并更新了对 Claude Sonnet 和 Opus 4.6 的支持。同时优化了内部目录结构，将 .continue/agents 迁移至 .continue/checks 并完善了相关配置文档。 Release 链接

行业动态

GitAgent：将任意 Git 仓库转化为 AI Agent 的开放标准 该项目试图解决 Agent 框架碎片化的问题，通过 agent.yaml 等三个核心文件在 Git 仓库中声明 Agent 的配置与指令。这为跨框架的 Agent 标准化定义和移植提供了一种极具启发性的工程思路。阅读原文

Context Gateway：在 LLM 前端压缩 Agent 上下文的开源网关 这是一个位于编码 Agent（如 Claude Code、OpenClaw）与大模型之间的代理层，专门用于在工具输出进入上下文窗口前进行压缩。该方案有效缓解了 Agent 在读取大文件或执行 grep 时消耗大量上下文和成本的问题。阅读原文

Claude Opus 4.6 与 Sonnet 4.6 全面开放 100万 Token 上下文 Anthropic 正式 GA 了 1M 上下文窗口，且整个窗口范围内的定价保持标准费率。这将极大扩展长文本 RAG、全代码库分析以及超长会话 Agent 的工程边界，降低了长上下文应用的架构复杂度。阅读原文

Cursor 引入 MCP 应用与团队插件市场 Cursor 在近期的更新中不仅支持了基于触发器的常驻自动化 Agent，还在 Agent 对话中引入了交互式 UI，并支持团队共享私有插件。这标志着基于 Model Context Protocol (MCP) 的 IDE 插件生态正在快速走向成熟。阅读原文

超越语义相似度：NVIDIA NeMo Retriever 推出泛化 Agentic 检索流水线 Hugging Face 博客详细解析了 NVIDIA 的最新检索架构，探讨了如何超越传统的向量相似度匹配，利用 Agentic 检索流水线构建更具通用性和推理能力的 RAG 系统。阅读原文

Anthropic 推出 Claude 合作伙伴网络 Anthropic 正式启动了官方合作伙伴计划，旨在联合生态伙伴推动 Claude 的企业级落地。这标志着其 API 生态的进一步成熟，将直接影响 AI 基础设施服务商和系统集成商的技术选型与商业策略。阅读原文