评分 7.0 · 来源:cs.CL updates on arXiv.org · 发布于 2026-04-20 评分依据:Comprehensive red teaming dataset aggregating 37 benchmarks