评分 4.5 · 来源:arXiv cs.CL · 发布于 2026-04-29
评分依据:多源结构化输出质量基准,覆盖发票/医疗记录/PDF 等
LLM 越来越多用于从非结构化/半结构化源提取结构化数据。现有基准要么只关注 schema 合规,要么只在单源领域评估值正确性。SOB 引入多源基准。
评分 4.5 · 来源:arXiv cs.CL · 发布于 2026-04-29
评分依据:多源结构化输出质量基准,覆盖发票/医疗记录/PDF 等
LLM 越来越多用于从非结构化/半结构化源提取结构化数据。现有基准要么只关注 schema 合规,要么只在单源领域评估值正确性。SOB 引入多源基准。