Skip to content
星际流动

Investigation into In-Context Learning Capabilities of Transformers

发布
采集
学术前沿 4.5 分 — Transformer ICL 能力的实证 scaling 行为研究
原文: arXiv cs.LG

评分 4.5 · 来源:arXiv cs.LG · 发布于 2026-04-29

评分依据:Transformer ICL 能力的实证 scaling 行为研究

Transformer 展示强 ICL 能力,先验理论建立了线性分类 ICL 条件,但经验 scaling 行为刻画不足。本文系统性实证研究 Transformer ICL 的 scaling 行为。


标签: