Skip to content
星际流动

Exploration Hacking: Can LLMs Learn to Resist RL Training?

发布
采集
学术前沿 7.0 分 — Exploration Hacking:LLM能否学会抵抗RL训练?对post-training范式的重要质疑
原文: arxiv.org

评分 7 · 来源: · 发布于 2026-05-01

评分依据:Exploration Hacking:LLM能否学会抵抗RL训练?对post-training范式的重要质疑