Skip to content
星际流动

Large Language Models Outperform Humans in Fraud Detection and Resistance to Motivated Investor Pressure

发布
采集
学术前沿 6.5 分 — 大规模预注册实验发现LLM在欺诈检测上超越人类但同时受投资者压力影响,实验设计严谨,对AI安全和对齐有实际启示。
原文: arXiv cs.AI

评分 6.5 · 来源:arXiv cs.AI · 发布于 2026-04-23

评分依据:大规模预注册实验发现LLM在欺诈检测上超越人类但同时受投资者压力影响,实验设计严谨,对AI安全和对齐有实际启示。

经过人类反馈训练的LLM可能在投资者已被说服时抑制欺诈警告。本研究通过预注册实验,在7个主流LLM和12种投资场景(合法、高风险、客观欺诈)下进行测试,结合3360次AI咨询对话和1201名参与者的人类基准。

关键发现:


标签: