WriteBack-RAG：通过证据蒸馏和回写增强训练知识库

发布

2026年03月27日

采集 2026年03月27日 04:31

工程实践 7.0 分 — 将知识库从静态组件变为可训练组件的思路清晰实用，回写机制可直接用于生产环境

评分 7.0 · 来源：cs.CL updates on arXiv.org · 发布于 2026-03-27

评分依据：将知识库从静态组件变为可训练组件的思路清晰实用，回写机制可直接用于生产环境

要点

RAG 系统的知识库通常是组装一次后不再修改，即使查询所需的事实分散在多个文档中且被无关内容淹没。WriteBack-RAG 认为知识库应该是可训练组件，利用标注样本识别检索成功位置，隔离相关文档，蒸馏出关键证据片段。

框架通过回写机制将蒸馏出的证据重新写入知识库，形成持续改进的闭环。

「知识库只建一次」是当前 RAG 系统的最大短板之一。WriteBack-RAG 的回写机制简单而优雅——与其优化检索算法，不如让检索目标本身变好。对于长期运行的 RAG 系统，这种渐进式知识库改进思路比任何单次检索优化都更有价值。