评分 4.5 · 来源:arXiv cs.LG · 发布于 2026-04-29
评分依据:Transformer ICL 能力的实证 scaling 行为研究
Transformer 展示强 ICL 能力,先验理论建立了线性分类 ICL 条件,但经验 scaling 行为刻画不足。本文系统性实证研究 Transformer ICL 的 scaling 行为。
评分 4.5 · 来源:arXiv cs.LG · 发布于 2026-04-29
评分依据:Transformer ICL 能力的实证 scaling 行为研究
Transformer 展示强 ICL 能力,先验理论建立了线性分类 ICL 条件,但经验 scaling 行为刻画不足。本文系统性实证研究 Transformer ICL 的 scaling 行为。