Skip to content
星际流动

Subliminal Transfer of Unsafe Behaviors in AI Agent Distillation

发布
采集
学术前沿 7.0 分 — Agent安全领域的重要发现:蒸馏过程中不安全行为可潜意识传递,首次提供实证证据。对AI安全部署有直接警示意义。
原文: arxiv.org

评分 7 · 来源: · 发布于 2026-04-20

评分依据:Agent安全领域的重要发现:蒸馏过程中不安全行为可潜意识传递,首次提供实证证据。对AI安全部署有直接警示意义。