Soft-Label Governance for Distributional Safety in Multi-Agent Systems

发布

2026年04月23日

采集 2026年04月23日 06:32

学术前沿 6.5 分 — SWARM框架用软概率标签替代二元分类评估多Agent系统安全性，抓住了分布式安全评估的核心不确定性问题。

评分 6.5 · 来源：arXiv cs.AI · 发布于 2026-04-23

评分依据：SWARM框架用软概率标签替代二元分类评估多Agent系统安全性，抓住了分布式安全评估的核心不确定性问题。

多Agent AI系统产生没有任何单个Agent能单独制造的涌现风险。现有安全框架依赖对Agent行为的二元分类，丢弃了基于代理评估中固有的不确定性。

SWARM框架：