015RAG系统会话中的长短期记忆
本文详细介绍了短期和长期会话记忆的概念及其在对话系统中的应用。**短期会话记忆**指的是仅在当前对话会话内有效、会话结束后即可丢弃的信息,如用户提出的问题、当前任务的进行步骤等。其核心特征是会话结束即清空,不跨会话保留。**长期会话记忆**则是跨会话持久化存储、在未来对话中仍可复用的信息,包括用户的身份属性、偏好等。其核心特征是会话结束后仍然保留,可在后续对话中被检索和注入。
文章还讨论了长短期会话记忆的定义和判断者,指出这些是由产品需求决定的,而不是模型自行决定的。对于信息分类,可以采用规则引擎、小型语言模型(LLM)或主LLM+记忆模块三种模式,各有优劣。实际生产中最常用的是规则引擎与小型LLM的混合模式。
此外,文章提供了详细的决策框架,帮助开发者判断何时使用短期或长期记忆,并给出了一个简单的经验法则:大多数对话系统的问题是“存了太多不该存的信息到长期记忆”,而不是记性不好。最后,通过一个智能客服记忆系统的完整Demo,展示了如何实现这些概念和技术。