Latent Space 发布的 3/11-12 AINews 期综述中,出现了一个强烈的信号聚合:模型质量已不是 AI Agent 的真正瓶颈,围绕 Agent 的”脚手架”(Harness)才是。
核心观点
Harrison Chase(LangChain)在访谈中明确指出:
- 真正的产品竞争力在于 沙盒、文件系统访问、技能库、内存管理、可观测性
- UI/UX 仍然极其欠缺,是目前最大的工程空白
- Agent 的「行为栈」视角优于单纯的「模型能力」视角
CursorBench 方法论(Cursor 的新编程 Agent 评估体系)也引发大量关注,因为它首次结合在线/离线信号来评估编程系统的能力与效率,填补了业界评估空白。
OpenJarvis(Stanford)的发布也被列为本期最值得关注的开源项目之一。
更大视角
从这一期 AINews 折射出的趋势:MCP(Model Context Protocol)的争论愈演愈烈,API 统一端点 vs 分散工具调用的路线之争正在形成。下一个真正的竞争护城河,很可能不在模型权重,而在运行时生态。