评分 6.5 · 来源:arXiv cs.AI · 发布于 2026-04-23
评分依据:视觉注入攻击导致信任边界混淆的安全问题,对视觉语言Agent系统的实际部署安全有重要警示意义。
具备视觉语言能力的Agent系统能够感知和推理真实世界场景。在此背景下,环境信号(如交通灯)是应该影响Agent行为的带内信号。然而,这也引入了信任边界混淆的风险——恶意视觉注入可能伪造这些环境信号。
安全问题:
- VLAS如何区分真实环境信号和注入的虚假信号?
- 当前VLA模型缺乏内在的信任边界机制
- 对自动驾驶、机器人控制等安全关键场景构成直接威胁
缓解方向:
- 识别带内信号的信任边界
- 建立信号认证机制
- 设计抗视觉注入的Agent架构