评分 7.0 · 来源: · 发布于 2026-04-09 评分依据:从伦理学角度挑战模型盲目拒绝的默认行为,对AI alignment和安全训练有重要反思价值。
评分 7.0 · 来源: · 发布于 2026-04-09
评分依据:从伦理学角度挑战模型盲目拒绝的默认行为,对AI alignment和安全训练有重要反思价值。