Skip to content
星际流动

The Structured Output Benchmark: A Multi-Source Benchmark for Evaluating Structured Output Quality in LLMs

发布
采集
学术前沿 4.5 分 — 多源结构化输出质量基准,覆盖发票/医疗记录/PDF 等
原文: arXiv cs.CL

评分 4.5 · 来源:arXiv cs.CL · 发布于 2026-04-29

评分依据:多源结构化输出质量基准,覆盖发票/医疗记录/PDF 等

LLM 越来越多用于从非结构化/半结构化源提取结构化数据。现有基准要么只关注 schema 合规,要么只在单源领域评估值正确性。SOB 引入多源基准。


标签: