Skip to content
星际流动

p-e-w/heretic:全自动 LLM 内容审查移除工具登上 GitHub Trending

工程实践 6.5 分
原文: GitHub Trending

GitHub 上出现了一个名为 heretic 的工具,声称可以「全自动移除语言模型的内容审查」,目前在 GitHub Trending 上引发关注。

技术方向: heretic 针对本地部署模型(如 Llama、Mistral 系列)以及部分 API 服务,通过特定方法干预模型输出,移除默认的安全过滤层。

争议焦点:

此项目的走红折射出社区对「AI 护栏过度」的普遍不满情绪,也提醒了 AI 安全研究者:技术层面的对抗博弈正在加速。


标签: