1. Karpathy 的自主研究突破:700 次实验带来 11% 提升
Andrej Karpathy 本周展示了 AI 开发的未来:由 AI Agent 亲自运行研究闭环。他的“自主研究 Agent”(autoresearch agent)在 nanochat(一个高效 LLM 推理项目)上自主运行了 700 多次实验,最终发现了能带来 11% 性能提升的优化方案。整个过程在实验设计或执行上均无需人类干预。
Karpathy 预测,所有主要的 AI 实验室很快都将转向这种模式。人类不再亲自调整超参数和架构,而是管理运行数千个并行实验的 Agent。瓶颈正从“研究员的大脑时长”转向“专门用于元优化的算力时长”。
Why it matters:
- AI 能力提升的速度正在与人类研究员的人数脱钩
- “元研究”——即设计运行实验的系统——正成为 AI 工程中价值最高的技能
- 规模较小、效率较高的实验室可以通过构建更好的自动化研究管线,在创新上超越大型实验室