评分 7 · 来源:cs.LG updates on arXiv.org · 发布于 2026-04-22
评分依据:分析LLM agent集成外部工具后的新型攻击面(尤其是prompt injection升级),对当前agentic安全讨论高度相关
Agentic 安全的新威胁
LLM agent结合外部工具自动化任务(调度会议、管理文档、预订行程),但集成也创造了更新更严重的攻击面:
Prompt Injection 升级
- 恶意指令嵌入连接服务可重定向agent行为
- Agent有更高权限执行多步操作
- 攻击影响范围远超单轮对话
核心观点
Agentic setting下的prompt injection不再是恶作剧级别的安全问题,而是可能导致数据泄露、未授权操作、金融损失的真实威胁。
实际意义
对当前快速发展的agent生态(Claude Code、OpenClaw、各种MCP工具)的安全实践有直接的警示作用。