202412论文研读-MemoCRS: Memory-enhanced Sequential Conversational Recommender Systems with Large Language Models

来源:arXiv
作者:Yunjia Xi、 Weiwen Liu等
单位:上海交通大学、华为
发表时间:2024 年 7 月

一、背景

  1. 现有CRS的局限性:
    大多数模型仅关注当前对话会话,忽视了历史会话中的偏好连续性。(更隐含、更细微)

2. 大语言模型的潜力:
现有研究多集中在零样本推荐和当前会话评估,未深入挖掘历史会话的价值。
LLM结合可更新的文本记忆机制可以处理长范围上下文,更有效地建模用户个性化偏好。

提出MemoCRS框架:包含用户特定记忆和通用记忆两种记忆机制

二、MemoCRS实现

MemoCRS的核心功能:用户特定记忆精确匹配用户当前需求,通用记忆轻量化且可直接使用,适用于所有用户。

  1. MemoCRS框架———UM功能实现:
  • 记忆存储:以实体为键,记录其对应的态度和时间戳,形成一个结构化的记忆库。
  • 记忆更新:当用户新对话产生后,自动更新记忆库,通过添加新实体或合并已有实体的态度。
  • 记忆检索:结合向量相似度和LLM的语义判断,从记忆库中提取当前对话相关的实体和态度,避免引入噪声和冗余信息。

2. MemoCRS框架———GM核心知识:

  • 推理指导:由LLM在推理过程中总结的成功经验与失败反思,以自然语言形式为后续任务提供指导
  • 协作知识:通过专家模型提取,包含用户群体的共享偏好模式,用于发现相似用户之间的偏好共性

3. MemoCRS框架———与对话推荐任务的集成:

  • 从用户特定记忆库中检索相关的实体及态度信息。
  • 调用专家模型,获取协作知识,生成候选推荐列表。
  • 将用户特定记忆、通用记忆和当前对话上下文整合到提示中,输入给LLM。
  • LLM基于上述信息生成个性化推荐和自然语言响应。

在第 k 轮对话中,综合用户的当前对话上下文、用户记忆信息、候选推荐列表和推理指导,通过 LLM 生成最终推荐列表 。

三、MemoCRS实验

  1. 基线方法
  • ReDial:基于自动编码器和分层RNN的对话推荐系统。
  • KBRD:利用知识图谱(KG)增强推荐性能。
  • KGSF:结合 ConceptNet 和 DBPedia 两个知识图谱,并通过互信息优化。
  • TGReDial:在 TGReDial 数据集上的方法,结合主题预测任务。
  • UniCRS:基于预训练语言模型的统一推荐对话方法。
  • UCCR:结合历史对话会话和相似用户信息的模型。
  • ZSCRS:基于 LLM(GPT-4)的零样本对话推荐系统。

2. 数据集

四、实验结果

  1. 推荐任务性能

在 TGReDial 数据集上:
HR@20、NDCG@20 和 MRR 分别比最佳基线提高了 13.04%、23.73% 和 20.41%。
在 ReDial 数据集上:
HR@20、NDCG@20 和 MRR 分别比最佳基线提高了 6.93%、24.96% 和 38.49%。

2. 对话生成任务

在 Fluency 和 Informativeness 上,MemoCRS 的生成对话质量远高于传统基线。
原因:LLM(GPT-4)的强大自然语言生成能力,使对话更加自然流畅,同时结合记忆模块提升了推荐的针对性和信息量。

3. 消融实验

用户特定记忆(UM):
移除 UM 后,推荐性能显著下降,表明个性化记忆对捕捉用户历史偏好至关重要。
通用记忆(GM):
移除 GM 后,冷启动用户的推荐性能显著下降,说明通用知识对解决冷启动问题的有效性。
推理指导(RG):
用人工规则替代 LLM 自总结的推理指导,性能有所下降,说明 LLM 的动态推理规则更适合实际任务

五、总结与综合对其思考

(一)论文核心内容
这篇论文提出了一种记忆增强型的对话推荐系统框架——MemoCRS,核心目的是通过结合用户历史偏好和通用知识,在多轮对话中提供更精准、更个性化的推荐。

  1. 双记忆机制的引入

用户特定记忆:通过两阶段检索策略(向量相似性筛选 + LLM 判断),从历史偏好中提取与当前对话相关的核心信息。

通用记忆:从用户群体行为中提取共享模式,用于提供广覆盖的推荐候选。特别适用于冷启动用户,弥补了个性化记忆不足的问题。

2. 双层推荐架构

  • 候选推荐生成:利用专家模型提供广覆盖的候选推荐集合,确保多样性。
  • 个性化优化:通过用户特定记忆对候选推荐进行筛选和排序,生成高度个性化的推荐结果。

(二)综合对其思考

  1. 收获
  • 首次将记忆增强机制引入到对话推荐系统中,解决了传统模型在历史偏好建模和冷启动用户方面的关键问题。
  • 通过结合用户特定记忆、通用记忆和大语言模型的强大能力,MemoCRS实现了更精准、更高效的个性化推荐,开创了对话推荐系统的新方向。

2. 改进

  • 冗余信息处理:引入更精细的知识提取模型,如结合知识图谱或增强的语义模型,提取更丰富的用户偏好信息,不局限于显性表达的实体。
  • 评分偏差:该实验只有 3 名评分人员可能导致评分的主观性较强,可以使用已有的自然语言生成评价工具,如 BLEU、ROUGE、Perplexity 等,结合人工评分,提高评估结果的客观性。