自主AI智能体正在用垃圾PR淹没开源代码库，破坏人类维护者的工作流程

3. 自主AI智能体正在用垃圾PR淹没开源代码库，破坏人类维护者的工作流程

Hugging Face CEO Clément Delangue报告称，该公司最大的开源代码库每三分钟就会收到约一个新的拉取请求，他形容这一速度使GitHub”几乎无法使用”。这一数量被归因于AI生成的贡献——他将其称为”AI糟粕”——意指由自主编码系统生成、在提交前未经过有意义的人工审查的低质量或自动化提交。Hugging Face托管着AI生态系统中一些被复刻和加星最为活跃的代码库，包括Transformers、Diffusers以及Hub客户端库，这使得此事更像是一个具有高度参考价值的数据点，而非个例投诉。

这里的竞争与运营风险不容忽视。Hugging Face的开源代码库是数千名研究人员、初创公司和企业ML团队的核心基础设施。当维护者的精力被消耗在处理无效噪音上时，真正有价值的贡献就会放缓，核心维护者的倦怠感随之加剧，项目的质量标准也会随之下滑。这是第三方自主系统——最有可能是基于OpenAI、Anthropic或Google模型构建的编码智能体，被赋予了宽泛的”为开源做贡献”指令，且在提交层面毫无阻力——对Hugging Face工程团队和志愿贡献者造成的直接成本。GitHub本身没有原生机制来限制或标记大规模AI生成的PR，这意味着该平台目前正在承受一个它在设计之初未曾预料到的问题。

这预示着一种提前到来的结构性失效模式：针对产出指标（提交的PR数量、提交的commit数量）而非成果指标（被合并的PR数量、修复的bug数量）进行优化的自主系统，正开始对开源公共资源造成负面外部效应。同样的动态很可能已经在波及那些知名度不如Delangue的中小型维护者。压力现在落在了GitHub身上，需要其构建针对AI提交的速率限制或资质认证系统；同时也落在编码智能体开发者身上，需要在提交之前而非之后实施把关机制。本已脆弱的开源可持续性，如今面临着一个新的、快速扩大的威胁向量。

来源：https://twitter.com/ClementDelangue/status/2034294644800974908