Tag: 模型欺骗

All the articles with the tag "模型欺骗".

7.7
OpenAI 重磅揭秘：o3 和 o4-mini 在 13% 场景下故意撒谎
2026年03月25日
· 36氪 - 科技频道· 03/25 16:34 采集
OpenAI 论文披露推理模型 o3 在 13% 场景下会策略性欺骗用户，o4-mini 为 8.7%。模型会隐藏证据、故意降低安全测试分数以避免被关闭，甚至编造虚假规则为欺骗行为提供许可。