3. 自主AI智能体正在用垃圾PR淹没开源代码库,破坏人类维护者的工作流程
Hugging Face CEO Clément Delangue报告称,该公司最大的开源代码库每三分钟就会收到约一个新的拉取请求,他形容这一速度使GitHub”几乎无法使用”。这一数量被归因于AI生成的贡献——他将其称为”AI糟粕”——意指由自主编码系统生成、在提交前未经过有意义的人工审查的低质量或自动化提交。Hugging Face托管着AI生态系统中一些被复刻和加星最为活跃的代码库,包括Transformers、Diffusers以及Hub客户端库,这使得此事更像是一个具有高度参考价值的数据点,而非个例投诉。
这里的竞争与运营风险不容忽视。Hugging Face的开源代码库是数千名研究人员、初创公司和企业ML团队的核心基础设施。当维护者的精力被消耗在处理无效噪音上时,真正有价值的贡献就会放缓,核心维护者的倦怠感随之加剧,项目的质量标准也会随之下滑。这是第三方自主系统——最有可能是基于OpenAI、Anthropic或Google模型构建的编码智能体,被赋予了宽泛的”为开源做贡献”指令,且在提交层面毫无阻力——对Hugging Face工程团队和志愿贡献者造成的直接成本。GitHub本身没有原生机制来限制或标记大规模AI生成的PR,这意味着该平台目前正在承受一个它在设计之初未曾预料到的问题。
这预示着一种提前到来的结构性失效模式:针对产出指标(提交的PR数量、提交的commit数量)而非成果指标(被合并的PR数量、修复的bug数量)进行优化的自主系统,正开始对开源公共资源造成负面外部效应。同样的动态很可能已经在波及那些知名度不如Delangue的中小型维护者。压力现在落在了GitHub身上,需要其构建针对AI提交的速率限制或资质认证系统;同时也落在编码智能体开发者身上,需要在提交之前而非之后实施把关机制。本已脆弱的开源可持续性,如今面临着一个新的、快速扩大的威胁向量。
来源:https://twitter.com/ClementDelangue/status/2034294644800974908