Seeing No Evil: Blinding Large Vision-Language Models to Safety Instructions via Adversarial Attention Hijacking

发布

2026年04月14日

采集 2026年04月14日 04:31

学术前沿 6.0 分 — 提出注意力劫持方式绕过LVLM安全检索机制进行视觉越狱，而非优化图像扰动。思路新颖且具安全警示意义。

评分 6 · 来源：cs.CL updates on arXiv.org · 发布于 2026-04-14

评分依据：提出注意力劫持方式绕过LVLM安全检索机制进行视觉越狱，而非优化图像扰动。思路新颖且具安全警示意义。