作者:Zeyun Zhao, Changjian Wang, Kele Xu, Zhen Huang, Gaojin He, Xu Liu
单位:国防科技大学
来源:ICASSP 2025 – 2025 IEEE International Conference on Acoustics, Speech and Signal Processing
一、研究背景
POI(兴趣点)推荐:
在轨迹预测领域,POI推荐的作用愈发关键,它能够为用户提供个性化的地点建议,帮助用户发现潜在的感兴趣地点。
现有方法的局限性:
单一尺度聚焦:很多方法只关注某一特定尺度下的数据特征,例如仅考虑用户在短时间内访问的POI序列,或者仅分析POI之间的长期空间关系。这种单一尺度的分析无法全面捕捉用户行为的复杂性。
空间或时间维度的过度强调:部分方法在处理空间和时间因素时,往往倾向于过度强调其中一个维度,而忽视另一个维度的重要性。这种不平衡的处理方式导致无法充分挖掘空间与时间相关性之间的相互作用,进而影响推荐的准确性。
该论文的主要贡献总结如下:
1、提出了一种多尺度动态静态轨迹编码模块,该模块集成了地理、历史和动态POI交互,同时考虑了时空约束。
2、引入了一种多尺度时空相关机制,该机制平衡了时间和空间特征,减少了预测误差,提高了准确性。
二、技术思想

(1)使用交叉共享GCN集成地理和轨迹数据的增强空间影响学习;
(2)基于HGAT的多尺度时间影响学习通过超图捕捉动态模式;
(3)动态内存增强查找将数据映射到嵌入空间;
(4)使用相关注意力进行下一个POI预测的多尺度时空融合和预测。
增强空间影响学习
捕捉POI之间的全局静态依赖关系,整合地理和历史信息,为后续的动态时空建模提供基础。通过图卷积网络(GCN)对地理邻接图和历史轨迹图进行编码,实现不同图结构信息的融合。
利用图卷积网络(GCN)传播规则,对地理邻接图(GF)和历史轨迹图(GC)进行编码。图卷积网络(GCN)传播规则定义为:

为了对齐不同图结构的异构属性表示,使用两个GCN层进行编码。

然后应用平均池来获得最终的POI静态属性表示:

基于HGAT的多尺度时间影响学习
捕捉不同时间尺度下POI的动态相关性,以更全面地理解用户行为的时间模式。利用超图注意力网络(HGAT)对多尺度超图进行编码,提取POI和超边的表示,并通过门控融合策略维持时间信息的传递。
多尺度超图构建:使用基于重叠滑动窗口的构建方法,在K个不同的时间尺度上,使用重叠滑动窗口形成子图和超图。通过在相邻子图之间保持连续性,增强不同时间尺度下的动态交互。
超图注意力网络(HGAT):对于每个超图中的超边,通过聚合连接节点的嵌入向量来计算超边表示。并通过聚合所有关联超边的信息来更新POI的表示。

门控融合策略:在相邻的HGAT层之间应用门控融合,以维持不同时间间隔之间的时间信息传递。
动态记忆增强查找
在应用HGAT到多尺度超图后,将POI和超边的表示以键值格式存储在记忆模块中,以便高效查找和融合,增强模型对历史轨迹的利用能力。通过动态记忆增强查找,能够快速获取与当前查询轨迹相关的多尺度POI和超边表示,并将其融合以生成包含动态信息的嵌入。
记忆模块被定义为存储多尺度POI和超边表示的集合。

动态表示的生成与融合:比较签到点的时间戳与记忆模块中的键,找到相邻的时间戳对应的POI和超边表示,并通过门控融合将它们整合成一个包含动态信息的空间轨迹嵌入。
多尺度时空融合与预测
将查询轨迹的所有受影响轨迹点的嵌入进行融合,利用多尺度时空一致性机制进行POI预测。通过融合多尺度的时空特征,提高模型对复杂时空模式的处理能力,从而提升POI推荐的准确性。
查找过程:对于目标轨迹中的每个签到点,根据其时间戳在记忆模块中查询相应的多尺度POI和超边表示。
融合过程:将查询到的相邻时间戳的POI和超边表示通过门控融合生成包含动态信息的空间轨迹嵌入。
多尺度时空融合:设计多尺度导向的时空融合机制,将不同尺度的时空特征进行融合。

多尺度角度得到轨迹表示,同时从静态属性表示中读取POI嵌入,然后使用多头交叉注意力机制融合。通过门控融合模块得到最终的轨迹表示,并使用交叉熵损失计算预测概率。
三、实验
数据集:使用Foursquare Tokyo(TKY)和New York(NYC)两个工业POI推荐数据集,这些数据集来自用户在Foursquare上的签到历史。
基线模型:
序列模型:包括DIN、DIEN、LSTPM等,主要捕捉用户兴趣和POI相似性。
图基方法:包括SR-GNN、NGCF、LightGCN等,利用用户-项目交互和图上的传播。
地理影响模型:包括GeoIE、GSTN、DisenPOI等,主要利用地理影响进行POI推荐。
超参数设置
数据划分:将每个数据集划分为训练集、验证集和测试集,比例为8:1:1。
训练参数:批量大小设为64,嵌入维度为64,注意力头数为8,初始学习率为0.001。
多尺度滑动窗口:设置窗口大小为[4,6,8],以捕捉不同时间尺度下的动态交互。

HyperMST模型通过多尺度超图注意力机制和时空一致性机制,能够同时捕捉不同时间尺度下的POI动态相关性和全局静态依赖关系。这种综合考虑多尺度特征以及空间和时间维度相互作用的方法,使得HyperMST在预测用户下一个POI时具有更高的准确性和鲁棒性。
消融实验

构建两种变体模型,分别是去除多尺度机制的模型(w/o Multi-Scale)和去除时空一致性机制的模型(w/o ST Co-Attention)。
•多尺度机制能够捕捉不同时间尺度下的POI动态相关性,这对于准确预测下一个POI至关重要。去除该机制后,模型无法充分利用不同时间尺度的信息,导致性能大幅下降。
•时空一致性机制通过融合时间和空间特征,提高了模型对复杂时空模式的处理能力。虽然其对性能的影响相对多尺度机制较小,但仍然是提升模型准确性的重要因素。
四、总结与思考
针对现有POI推荐方法在单一尺度聚焦以及空间或时间维度过度强调等问题,提出一种多尺度时空超相关网络(HyperMST)。通过增强的空间影响学习整合地理和历史信息,利用基于HGAT的多尺度时间影响学习捕捉动态POI相关性,并通过动态记忆增强查找和多尺度时空融合与预测机制提高推荐准确性。
多尺度动态静态轨迹编码模块:创新性地设计了多尺度动态静态轨迹编码模块,能够同时整合地理、历史和动态POI交互信息,并考虑时空约束,为POI推荐提供了更全面的特征表示。
多尺度时空一致性机制:引入多尺度时空一致性机制,有效平衡了时间和空间特征,减少了预测误差,提高了模型对复杂时空模式的适应性和预测准确性。