作者:Sajal Halder,Kwan Hui Lim,Jeffrey Chan,XiuZhen Zhang
单位:皇家墨尔本理工大学、新加坡科技设计大学
来源:2025年4月ACM Transactions on Recommender Systems
一、研究背景
1. 现实痛点:传统行程推荐的缺陷
用户兴趣静态化:传统模型假设兴趣恒定,忽略时间因素。
空间关系线性化:仅用欧氏距离建模,忽略“远距离热门景点优先”等非线性偏好。
推荐与优化割裂:先选POI再排行程,导致局部最优。
2. 核心问题定义
如何联合优化“动态兴趣+非线性空间关系+排队时间”以生成个性化行程?
输入:用户历史轨迹、POI属性、实时排队数据、时间预算等。
输出:满足预算且最大化满意度的POI访问序列。

解决问题:
1、提出的深度学习模型如何选择top-k POI进行推荐,以及从这种选择中可以获得对决策过程的哪些见解?
2、拟议的深度学习模型在生成综合行程建议方面的有效性如何?
3、如何消融研究的时间用户的兴趣,共同访问模式,和个性化特征影响的性能建议的推荐模型?
4、与基于蒙特卡罗树搜索(MCTS)的行程构造相比,基于贪婪策略的行程构造的上级性能是由哪些因素促成的?
主要贡献:
1、提出了一种基于深度学习的行程推荐(DLIR),通过学习用户的时间偏好并安排这些偏好来推荐行程。候选生成器利用用户的动态偏好因素,并产生基于时间的最佳候选POI集合,而调度部分解决调度问题,考虑排队时间的影响和预算时间。
2、为了捕捉用户的动态偏好,利用用户的周期性和趋势模式,引入了一个自适应的基于GCN的POI之间的用户移动关系,适当地解决了非线性空间关系。
3、构建了完整的行程应用贪婪的政策,POIs选择在一个动态的方式,旨在最大限度地提高用户的兴趣和排队时间最小化。
二、技术思想
1、候选生成器
输入:用户历史轨迹 + 上下文
输出: Top-K动态POI候选集
关键技术:Transformer+GCN

Step 1 三通道输入编码:

Step 2 多头注意力融合
让三种特征互相“投票”决定权重,Query/Key/Value均由拼接后的X_t线性投影得到

其中LN,FF和MulHead分别表示层归一化、全连接前馈网络和多头注意机制。多头注意机制从输入矩阵中获取查询(Q)、键(K)和值(V)矩阵。Transformer解码器将编码器输出作为其键和值,并再次应用多头注意机制,将其传递到完整的前向层,并产生Transformer解码器的输出:

其中dec(Xt)是解码器输入。
Step 3 利用Softmax解码为POI概率
Step 4 实时动态更新
重新编码触发条件:用户移动到新POI;排队时间变化。
2、行程构建器
输入:Top-K候选+ 实时排队数据
输出: 完整行程序列
关键技术:贪心策略+预算约束

Step 1 候选生成

每个时间步,候选生成器模型推荐其数量取决于前k值的候选集合。
Step 2 排队修正

其中,Queuet是在当前时间t的POI的候选集合的排队时间,并且POI得分是候选生成器模型的输出。
Step 3 预算检查
行程构建部分的目标是最大化奖励函数并满足预算时间约束:

Step 4 迭代终止
预算耗尽或所有POI遍历完
三、实验
数据集:

基线模型:

实验结果(Top-K POI推荐)

实验结果(完整行程推荐)

消融实验

四、总结
研究结论:
本研究首次将用户的近期、周期性和长期趋势三种时间模式同时编码进 Transformer,实验表明,移除周期性兴趣后 F1-score 平均下降 31%。
通过 GCN 将 POI 共访问频次与热度联合构图,DLIR 放弃了传统“距离越近越优先”的假设。消融结果显示,用距离权重替换共访问权重后,所有数据集的 F1-score 均下降 7% 以上,验证了“用户愿意为网红景点绕远路”这一非线性现象。
现有工作分两阶段:先选 Top-K POI,再排程。DLIR 把二者整合为一个端到端框架:候选生成器输出动态 Top-K,贪心构建器实时结合排队时间与预算做下一步决策。在 8 个数据集上,完整行程的 F1-score 比最强基线高 7.79%–26.28%,证明“边选边排”优于“先选后排”
从“单点预测”升级到“行程级决策”:DLIR把“下一个POI”预测扩展为“剩余时间内的最优序列”,可将轨迹预测与行程规划合二为一:先预测未来多步时空分布,再联合优化整条线路,而非逐点独立推荐。
引入多维时间上下文:DLIR的“近期+周期+趋势”三通道经验表明,文旅场景中的“节假日/淡旺季/周末效应”是强信号。可以把法定假日、天气、大型活动作为显式输入,提升长期轨迹预测精度。
用“图”代替“距离”刻画空间偏好:共访问GCN 验证了“游客绕远路打卡”行为。对你而言,可把景区内部路网、跨城市高铁/航班网络、甚至社交媒体共现关系都建成异构图,学习非欧氏空间依赖。