静态集成权重在非平稳环境中失效，模型间的一致性才是你遗漏的关键信号

01 {评估} 静态集成权重在非平稳环境中失效，模型间的一致性才是你遗漏的关键信号

传统集成方法为各成员模型分配固定权重，或离线学习这些权重。两种方式都假设环境足够稳定，使得历史性能排名持续有效。在序列决策场景中，这一假设不断被打破：任务分布发生偏移，某些模型在特定子领域性能下降，昨天最优的模型今天可能变成最差的。

EARCP（基于一致性与性能的自调节集成，Ensemble Auto-Régulé par Cohérence et Performance）在每次决策后在线更新模型权重，融合两个信号：单个模型的准确率，以及模型间一致性（即某个模型与集成共识的吻合程度）。一致性项起到正则化器的作用——当某个模型偏离群体时，即使其近期单点准确率看起来尚可，其权重也会被压低。更新规则源自乘法权重（指数梯度）算法，该算法具有正式的遗憾界（regret bound，保证累积损失趋近于事后最优固定权重组合的理论上界）。一致性正则化是其创新之处：它惩罚偏离集成共识的模型，在非平稳情形下降低方差，同时不损失理论保证。

需要坦诚说明的局限：遗憾界在理论框架的假设条件下成立，而摘要中并未说明论文的实证验证范围。在特定任务分布上的实际性能仍需直接基准测试。对于在生产流水线中运行异构模型集成、且输入分布随时间偏移的团队（推荐系统、自适应智能体、多步规划），EARCP 是静态加权方案的一个有原则的替代选择，能够降低静默性能退化的风险。

核心要点：

EARCP 将单模型准确率追踪与模型间一致性评分相结合，在线动态调整集成成员权重；偏离群体共识的模型即便局部准确率看似稳定，其影响力也会被削弱
基于乘法权重更新算法的理论支撑提供了遗憾界，集成可证明地收敛至事后最优的固定权重组合，这是静态或离线学习的集成方案在非平稳设置下无法给出的保证
在输入分布持续偏移的生产环境中运行多模型集成的团队，应将静态权重分配视为已知的风险隐患；EARCP 的在线重加权机制是值得评估的直接架构替代方案

来源：EARCP: Self-Regulating Coherence-Aware Ensemble Architecture for Sequential Decision Making