Latent Space AINews：Agent Harness 正成为真正产品核心，LLM 本身已非瓶颈

Latent Space 发布的 3/11-12 AINews 期综述中，出现了一个强烈的信号聚合：模型质量已不是 AI Agent 的真正瓶颈，围绕 Agent 的”脚手架”（Harness）才是。

核心观点

Harrison Chase（LangChain）在访谈中明确指出：

CursorBench 方法论（Cursor 的新编程 Agent 评估体系）也引发大量关注，因为它首次结合在线/离线信号来评估编程系统的能力与效率，填补了业界评估空白。

OpenJarvis（Stanford）的发布也被列为本期最值得关注的开源项目之一。

从这一期 AINews 折射出的趋势：MCP（Model Context Protocol）的争论愈演愈烈，API 统一端点 vs 分散工具调用的路线之争正在形成。下一个真正的竞争护城河，很可能不在模型权重，而在运行时生态。