Karpathy 的自主研究突破：700 次实验带来 11% 提升

1. Karpathy 的自主研究突破：700 次实验带来 11% 提升

Andrej Karpathy 本周展示了 AI 开发的未来：由 AI Agent 亲自运行研究闭环。他的“自主研究 Agent”（autoresearch agent）在 nanochat（一个高效 LLM 推理项目）上自主运行了 700 多次实验，最终发现了能带来 11% 性能提升的优化方案。整个过程在实验设计或执行上均无需人类干预。

Karpathy 预测，所有主要的 AI 实验室很快都将转向这种模式。人类不再亲自调整超参数和架构，而是管理运行数千个并行实验的 Agent。瓶颈正从“研究员的大脑时长”转向“专门用于元优化的算力时长”。

Why it matters:

AI 能力提升的速度正在与人类研究员的人数脱钩
“元研究”——即设计运行实验的系统——正成为 AI 工程中价值最高的技能
规模较小、效率较高的实验室可以通过构建更好的自动化研究管线，在创新上超越大型实验室