评分 7 · 来源:arXiv cs.AI · 发布于 2026-04-23
评分依据:移动GUI Agent的自适应视觉模态解决前台透明度与后台多任务的两难困境,对移动Agent用户体验设计有直接参考价值。
移动GUI Agent可以通过直接与应用界面交互来自动化智能手机任务,但它们应如何在执行期间与用户通信仍待探索。现有系统依赖两个极端:
两难困境:
- 前台执行:最大化透明度但阻止多任务
- 后台执行:支持多任务但几乎没有视觉感知
AgentLens方案:
- 自适应视觉模态根据上下文动态调整
- 兼顾透明度和多任务能力
- 为移动Agent UX设计提供新范式
- 对日益增长的移动Agent生态有直接参考价值