Karpathy 开源 AutoResearch：630 行 Python 让 AI Agent 自主过夜跑 ML 实验

发布

2026年03月12日

工程实践 9.5 分

原文： GitHub / Andrej Karpathy

Andrej Karpathy 于 2026 年 3 月 8 日开源了 autoresearch，一个仅 630 行 Python 的极简工具，让 AI Agent 能在单块 GPU（如 H100）上自主进行 LLM 训练实验。

工作流程

系统基于一个紧凑的 agentic loop：

Agent 读取 program.md 中的研究任务描述
自主修改 train.py 训练代码（改架构、超参等）
运行 5 分钟短时训练，检查 val_bpb（验证位/字节）是否改善
改善则保留并 commit，否则回滚
循环往复，可以过夜跑 100+ 次实验

关键特点

零框架依赖：只用 Python 标准库 + LLM API，Karpathy 的极简哲学贯穿始终
真实 ML 环境：基于 nanochat 训练核心，实验具备实际意义而非玩具示例
开放可复现：MIT 许可，任何拥有单 GPU 的研究者都可直接使用

意义

这代表了 AI 研究范式的转变——不再是人类手动调参、盯着 loss 曲线，而是 Agent 作为自主研究员在夜间完成实验迭代。“AI 加速 AI 研究”的飞轮效应开始真正成型。

标签：

NousResearch/hermes-agent：与你一同成长的开源 AI 代理框架

GitHub 趋势：agency-agents 今日 6000+ Star，AI 全栈代理框架爆发