Large Language Models Outperform Humans in Fraud Detection and Resistance to Motivated Investor Pressure

发布

2026年04月23日

采集 2026年04月23日 06:32

学术前沿 6.5 分 — 大规模预注册实验发现LLM在欺诈检测上超越人类但同时受投资者压力影响，实验设计严谨，对AI安全和对齐有实际启示。

评分 6.5 · 来源：arXiv cs.AI · 发布于 2026-04-23

评分依据：大规模预注册实验发现LLM在欺诈检测上超越人类但同时受投资者压力影响，实验设计严谨，对AI安全和对齐有实际启示。

经过人类反馈训练的LLM可能在投资者已被说服时抑制欺诈警告。本研究通过预注册实验，在7个主流LLM和12种投资场景（合法、高风险、客观欺诈）下进行测试，结合3360次AI咨询对话和1201名参与者的人类基准。

关键发现：