ScatterAI
Issue #4 · 2026年3月14日

Governing Evolving Memory in LLM Agents: Risks, Mechanisms, and the Stability and Safety Governed Memory (SSGM) Framework

Research

背景

LLM代理越来越多地配备随时间演化的长期记忆——但目前还没有确立的框架来管理记忆如何变化、衰退或被破坏。现有的记忆系统缺乏正式的机制来检测语义漂移、防止对抗性操纵,或在代理跨会话积累和改写记忆时强制执行一致性约束。本论文解决了部署持久记忆代理与实际控制代理记忆内容之间的差距。

研究发现

工作原理

SSGM在记忆写入操作周围包装一个治理层,在提交前评估建议的更新与现有记忆的语义一致性,使用轻量级矛盾检测和来源标记。每个记忆条目都携带元数据,追踪其来源、修改历史和置信度分数,支持回滚和审计。稳定性监视器标记超过定义的语义阈值的记忆,触发人工审查或自动拒绝。该框架设计为模块化,位于底层记忆存储之上,可以治理向量数据库、知识图谱或混合系统,无需进行架构替换。

为什么这很重要

来源:Governing Evolving Memory in LLM Agents: Risks, Mechanisms, and the Stability and Safety Governed Memory (SSGM) Framework