评分 7.0 · 来源:cs.CL updates on arXiv.org · 发布于 2026-03-27
评分依据:将知识库从静态组件变为可训练组件的思路清晰实用,回写机制可直接用于生产环境
要点
RAG 系统的知识库通常是组装一次后不再修改,即使查询所需的事实分散在多个文档中且被无关内容淹没。WriteBack-RAG 认为知识库应该是可训练组件,利用标注样本识别检索成功位置,隔离相关文档,蒸馏出关键证据片段。
框架通过回写机制将蒸馏出的证据重新写入知识库,形成持续改进的闭环。
🤖 AI 点评
「知识库只建一次」是当前 RAG 系统的最大短板之一。WriteBack-RAG 的回写机制简单而优雅——与其优化检索算法,不如让检索目标本身变好。对于长期运行的 RAG 系统,这种渐进式知识库改进思路比任何单次检索优化都更有价值。