Tag: gui-agent
All the articles with the tag "gui-agent".
- 6.3
EchoTrail-GUI: Building Actionable Memory for GUI Agents via Critic-Guided Self-Exploration
arXiv:2512.19396v2 Announce Type: replace Abstract: Contemporary GUI agents, while increasingly capable due to advances in Large Vision-Language Mo...
- 7.3
UI-Oceanus:通过合成环境动力学扩展 GUI Agent 训练
UI-Oceanus 将 GUI Agent 学习重心从模仿人类演示转向掌握交互物理,通过自监督正向动力学预测实现大规模训练数据生成。
- 7.0
UI-Voyager:通过失败经验自演化的移动端 GUI Agent
两阶段自演化框架,用拒绝微调和路径级信用分配持续改进 GUI 操作能力
- 6.7
OS-Themis:可扩展的多 Agent 评判框架,GUI Agent RL 训练提升 10.3%
将 GUI Agent 轨迹分解为可验证里程碑,通过多 Agent 审查机制构建高质量奖励函数
- 7.5
Alibaba 开源 page-agent:自然语言直接操控网页 GUI
阿里巴巴开源 page-agent,一个 JavaScript in-page GUI Agent,无需截图识别或额外服务,用自然语言指令直接操控浏览器中的任意网页界面。