Skip to content
星际流动

MDKeyChunker:单次 LLM 调用实现高精度 RAG 文档切分

发布
采集
工程实践 7.4 分 — 直击 RAG 管线最被忽视的环节,富化从每 chunk 一次调用压缩到单次调用
原文: cs.LG updates on arXiv.org

评分 7.4 · 来源:cs.LG updates on arXiv.org · 发布于 2026-03-26

评分依据:直击 RAG 管线最被忽视的环节,富化从每 chunk 一次调用压缩到单次调用

要点

三阶段:结构感知切分(标题/代码/表格/列表为原子单元)、单次 LLM 富化(摘要/关键词/实体/假设问题/语义键)、滚动键传播(前序 chunk 键向前传递保持连贯)。

🤖 AI 点评

滚动键解决跨 chunk 上下文断裂,单次富化大幅降低成本。对长文档 RAG 可直接提升检索准确率。


标签: