Tag: measurement
All the articles with the tag "measurement".
- 7.0
Propensity Inference: Environmental Contributors to LLM Behaviour
测量 LLM 未授权行为倾向的新方法论:三种方法学改进提升因果推断可靠性
- 7.8
Anthropic 发布 AI Agent 自主性实践度量方法
Anthropic 社会影响团队提出衡量 AI Agent 自主程度的实用框架,为 Agent 安全治理提供量化依据。