p-e-w/heretic：全自动 LLM 内容审查移除工具登上 GitHub Trending

发布

2026年03月15日

工程实践 6.5 分

GitHub 上出现了一个名为 heretic 的工具，声称可以「全自动移除语言模型的内容审查」，目前在 GitHub Trending 上引发关注。

技术方向： heretic 针对本地部署模型（如 Llama、Mistral 系列）以及部分 API 服务，通过特定方法干预模型输出，移除默认的安全过滤层。

争议焦点：

此项目的走红折射出社区对「AI 护栏过度」的普遍不满情绪，也提醒了 AI 安全研究者：技术层面的对抗博弈正在加速。