Skip to content
星际流动

Seeing No Evil: Blinding Large Vision-Language Models to Safety Instructions via Adversarial Attention Hijacking

发布
采集
学术前沿 6.0 分 — 提出注意力劫持方式绕过LVLM安全检索机制进行视觉越狱,而非优化图像扰动。思路新颖且具安全警示意义。
原文: cs.CL updates on arXiv.org

评分 6 · 来源:cs.CL updates on arXiv.org · 发布于 2026-04-14

评分依据:提出注意力劫持方式绕过LVLM安全检索机制进行视觉越狱,而非优化图像扰动。思路新颖且具安全警示意义。