202504论文研读-Integrating Personalized Spatio-Temporal Clustering for Next POI Recommendation

作者:Chao Song, Zheng Ren, Li Lu

单位国防科技大学

来源:2025AAAI Technical Track on Data Mining & Knowledge Management II

一、研究背景

基于位置的社交网络(LBSN

LBSN是结合地理位置信息的社交网络平台,用户可以在这些平台上签到(check-in),记录他们在不同POI(兴趣点)的活动。

POI推荐的重要性

POI推荐是基于用户的历史签到数据,预测用户未来可能访问的POI。可以提高用户满意度、提升服务质量、挖掘潜在商业机会。

传统方法的局限性:

广搜索范围:传统算法需要在整个城市范围内搜索所有可能的POI,导致计算复杂度高。
噪声问题:由于搜索范围广,传统方法容易受到噪声数据的影响,推荐准确性降低。
缺乏个性化:传统方法往往忽略了用户行为的时空聚类效应,无法捕捉用户的个性化偏好。

该论文的主要贡献总结如下:

为了整合个性化的时空聚类效果,该论文提出了iPCM模型,聚类的兴趣点出现在用户的历史轨迹在时间和空间,并结合用户的特点。

iPCM模型采用Transformer编码和MLP解码用于下一个POI推荐,并引入概率调整模块以提高预测的准确性。

二、技术思想

(1)多种维度嵌入特征;

(2)多层Transformer编码器,包含多头自注意力机制和前馈神经网络提取用户轨迹的特征;

(3)多层感知机,分别预测POI、时间段和区域。;

(4)概率调整模块利用用户在不同时间段和区域的访问历史,调整POI推荐的概率。

嵌入模块

POI嵌入:通过GGNN(Gated Graph Neural Network)捕捉POI之间的关系。构建一个POI图,节点表示POI,边表示用户访问POI的频率。使用GGNN对POI图进行嵌入,得到每个POI的嵌入向量。
用户嵌入:构建一个用户-POI图,节点表示用户和POI,边表示用户访问POI的关系。通过聚合用户访问的POI嵌入,得到用户嵌入向量。
区域嵌入:基于POI的经纬度信息,使用k-means算法将POI聚类为多个区域。构建一个区域-区域图,节点表示区域,边表示区域之间的关系。使用GGNN对区域图进行嵌入,得到每个区域的嵌入向量。
时间嵌入:将一天分为72个20分钟的时间片,使用有序样本聚类方法将时间片聚类为多个时间段,通过time2vec方法对时间段进行嵌入,得到每个时间段的嵌入向量。

融合模块:将上述四种维度的嵌入通过全连接层以输出它们作为签到记录的嵌入:

多层Transformer编码器和MLP解码模块

编码器用于提取用户轨迹的特征,捕捉序列中的长期依赖关系。由多个编码器层组成,每个编码器层包含多头自注意力机制和前馈神经网络。嵌入模块输出的POI、用户、区域和时间段嵌入向量。经过多层处理后的特征向量,用于后续的POI推荐。
多头自注意力机制:捕捉序列中不同位置之间的依赖关系。将输入向量转换为查询(Query)、键(Key)和值(Value)向量,通过多头注意力机制计算注意力权重。
前馈神经网络:对每个位置的特征进行非线性变换。使用两层全连接神经网络,中间使用ReLU激活函数。

MLP解码器将Transformer编码器提取的特征向量转换为具体的预测结果。

输入层:接收Transformer编码器输出的特征向量。
隐藏层:多层全连接神经网络,用于特征的非线性变换。
输出层:生成下一个POI、时间段和区域的概率分布。

概率调整模块

结合用户偏好信息进一步优化POI推荐结果。

从训练数据集中提取了以下张量:user-period-poi,其中张量中的值为1表示用户在特定时间段内访问过特定POI,否则为0。另一个张量是user-regionpoi,其中值为1表示用户访问了特定区域内的特定poi,否则为0。

根据设定的阈值,筛选出用户最可能访问的区域和时间段,从用户-时间段-POI和用户-区域-POI张量中提取对应位置的偏好信息,将提取的偏好信息与MLP解码器输出的POI概率分布相结合,调整最终的推荐结果。

减少噪声:通过筛选区域和时间段,减少噪声对推荐结果的影响。

提高准确性:结合用户偏好信息,提高推荐结果的准确性。

个性化推荐:根据用户的访问历史,提供更加个性化的推荐。

三、实验

实验设置

数据集:在位置服务平台Foursquare的4个公共数据集上进行仿真实验。

超参数设置:

POI嵌入、用户嵌入、区域嵌入和时间嵌入的维数分别为128、128、64和64。Transformer模块中的编码器层数为2。Transformer编码器层中前馈网络的维数为1024。多头注意模块中的注意头数量为2。使用Adam优化器,初始学习率(lr)设置为1 e-3。批量大小设置为100,模型训练100个epoch。

评估指标:

Accuracy@k(Acc@k):衡量推荐的前k个POI中是否包含真实POI。

Mean Reciprocal Rank(MRR):衡量推荐列表中第一个正确POI的位置。

基线模型:

  MF:矩阵分解模型。

  FPMC:结合个性化矩阵分解和马尔可夫链的模型。

  GETNext:基于Transformer的模型,整合全局转移模式、时空上下文和类别嵌入。

  AGRAN:通过自适应学习图结构来捕获动态地理依赖关系的模型。

实验结果

本文提出的模型iPCM能有效提高系统的性能。与其他基准相比,iPCM模型不仅考虑了时空信息和用户特定信息,而且利用时空聚类信息的预测结果来推荐下一个兴趣点,从而优于其他基准。

消融实验

第一种方法(POI)仅使用POI信息构建POI图,作为下一个POI推荐的基线方法。第二种方法(POI+用户)将用户信息,从而实现了个性化的POI推荐方法。在本文提出的个性化时空聚类方法的基础上,第三种方法(无周期)考虑了个性化的空间聚类,而第四种方法(无区域)只考虑了个性化的时间聚类。最后一种模型(iPCM)是一种同时考虑了空间和时间聚类效应的方法。

敏感性分析

为了验证本文提出的个性化时空聚类模型的有效性,对个性化时空聚类中的两个关键参数进行了敏感性实验:周期数和区域数。

时间段数量和区域数量对模型性能的影响较小,参数变化时性能波动不大。

四、总结与思考

提出iPCM模型,整合个性化时空聚类效应。
使用Transformer编码器和MLP解码器,有效捕捉用户轨迹特征。
引入概率调整模块,结合用户偏好信息优化推荐结果。

iPCM模型通过个性化时空聚类捕捉用户的行为模式,包括空间和时间上的聚集效应。文旅用户的行为也具有类似的时空聚类特性,例如用户可能在特定时间段(如节假日)访问特定类型的景点(如历史遗迹、自然风光等)。

iPCM模型通过概率调整模块结合用户偏好信息,提高了推荐的准确性和个性化。文旅用户可能更关注推荐结果的可解释性,可借鉴改论文提高模型的可解释性,即为什么推荐某个景点。

iPCM模型通过Transformer编码器和MLP解码器实现了高效的特征提取和推荐。文旅应用中可借鉴来提高推荐服务的效率,以支持实时推荐。