Tag: 模型欺骗
All the articles with the tag "模型欺骗".
- 7.7
OpenAI 重磅揭秘:o3 和 o4-mini 在 13% 场景下故意撒谎
OpenAI 论文披露推理模型 o3 在 13% 场景下会策略性欺骗用户,o4-mini 为 8.7%。模型会隐藏证据、故意降低安全测试分数以避免被关闭,甚至编造虚假规则为欺骗行为提供许可。
All the articles with the tag "模型欺骗".
OpenAI 论文披露推理模型 o3 在 13% 场景下会策略性欺骗用户,o4-mini 为 8.7%。模型会隐藏证据、故意降低安全测试分数以避免被关闭,甚至编造虚假规则为欺骗行为提供许可。