来源:ICIS 2025
作者:Kejun Chen等
单位:TsinghuaUniversity, KuaishouTechnology,
发表时间:2025 年 10月
一、研究背景
- 短视频平台与推荐系统的现状
平台高度依赖推荐系统帮助用户从海量内容中筛选感兴趣视频。
当前主流推荐系统主要基于行为信号,例如点击、观看时长、点赞、转发等,目标是最大化短期用户参与度。
2. 人类价值观在决策中的核心作用
跨学科研究(心理学、消费者行为学、决策科学等)一致表明:人类行为深受个人价值观影响。
论文采用 Schwartz 价值观理论作为理论基础,该理论将人类价值观归纳为19个维度(如自我导向、享乐主义、仁爱、普世主义等),代表个体或群体认为“生活中什么是重要的”
这篇文章是从“行为驱动”转向“价值驱动”的推荐范式,利用LLM挖掘短视频中隐含的价值信号,并将其融入推荐算法,以实现更深层、更持久、更人性化的用户体验。
二、主要框架
- 基于角色的价值提取
(1)输入准备
视频表示:使用平台自研的多模态大模型(fine-tuned multimodal LLM)为每个短视频生成文本描述(video caption),作为后续分析的基础。
用户角色(Persona):利用同一多模态模型,对每个视频生成8–10个“可能喜欢该视频的用户类型”标签(如“年轻职场女性”“环保主义者”“传统文化爱好者”等),构成用户角色库。
2. LLM提示工程
设计结构化提示(prompt),引导 LLM(使用 Qwen2.5-7B)模拟特定用户角色,并基于 Schwartz 理论判断该角色会从视频中感知到哪些价值。
提示包含五个关键组件:
Persona:指定模拟的用户类型;
Objective:明确任务目标(“请判断该视频体现了哪些价值观”);
Schwartz 价值理论介绍:列出全部19个价值及其动机性定义;
Chain-of-Thought 指令:要求模型逐步推理(如“先理解视频内容 → 联系用户身份 → 匹配价值维度”);
Video Description:输入由多模态模型生成的视频文本描述。

示例输出:对于一个展示乡村教师坚守岗位的视频,模拟“教育工作者”角色的 LLM 可能输出:Benevolence-caring, Tradition, Universalism-concern。
3. 价值向量化
对每个视频,汇总其在所有关联用户角色下的 LLM 输出;
构建一个 19维二值向量:若任一角色在多次采样中提及某价值,则对应维度设为1,否则为0

三、实验
- 将价值特征融入推荐模型
| 模型 | 特点 | 增强方式 |
| SASRec | 基于 Transformer 的序列推荐模型,通过自注意力机制捕捉用户行为序列中的依赖关系 | 将19维价值向量作为视频的额外特征,与原始 item embedding 拼接后输入模型 |
| FDSA | 在 item-level 和 feature-level 分别建模的深度自注意力模型,支持异构特征融合 | 将价值特征视为一类新的“语义特征”,通过独立的特征级注意力模块处理 |
- 评估方法
(1)人工评估 LLM 的价值提取能力
招募3名社会科学/管理学背景的研究生作为标注员;
先对10个视频进行共识标注训练,再独立标注100个视频,采用多数投票确定“人类标准答案”;
LLM 被设定为相同背景的“研究生”角色,并对每个视频-角色对运行10次(采样多样性);
计算 LLM 输出与人工标注在 Top-K 下的 Recall、Precision、F1、Hit Ratio。

结果:F1-score 达 0.762(K=1),表明 LLM 能较准确模拟人类的价值感知。
- 核心实验结果
(2)计算实验验证推荐性能提升
数据集:来自中国某头部短视频平台(日活7.36亿);
时间窗口:2025年4月1–14日;
用户:31,444人(每人≥30次长观看行为);
视频:27,952个(每个≥10次交互);
总交互:278,176条“长观看”行为(视为正样本);
划分:训练/验证/测试 = 8:1:1;
指标:GAUC(Group-wise AUC)、Recall@20、Precision@20;
对比模型:SASRec vs. SASRec+value;FDSA vs. FDSA+value。

结果:加入价值特征后,所有指标均显著提升(如 SASRec GAUC 从 0.7719 → 0.7833)。
四、总结与综合对齐思考
(一)论文核心内容
这篇论文提出一种基于LLM的短视频推荐方法,通过识别视频中隐含的用户感知价值观(依据 Schwartz 的19个价值维度),将这些价值特征融入现有推荐模型(如 SASRec、FDSA),实现“价值对齐”的个性化推荐,为下一代“以人为本”的推荐系统提供了新范式。其核心贡献包括:
首次用 LLM 自动提取短视频中的价值观:不依赖人工标注,而是让 LLM 模拟不同用户角色(persona),结合 Schwartz 价值理论,从视频文本描述中推理出用户可能感知到的价值。
构建可扩展的价值对齐推荐框架:将提取出的19维价值向量作为新特征,无缝集成进主流序列推荐模型,显著提升 GAUC、Recall@20 等指标。
五、三维度对齐思考
1.0 技术创新-逻辑思维推理框架
这篇论文证实了利用 LLM 模拟特定用户角色来推断内容隐性特征”是科学且有效的
。可以借鉴其思路,在比选推理中的健康维度:单纯靠营养数据的向量匹配是不够的,可以像该论文利用 LLM 提取视频中抽象的“价值观”那样 ,利用 LLM 结合用户画像去深度推理食谱中难以量化的“执行可行性”和“深度健康语义” 。
2.1 技术目标-专业手册公众服务
构建出高对比比较对:通过框架的检索-排序-LLM推理的pipeline,将高质量的健康候选产品送入比较对推理部分,构建(锚点食谱、候选产品1,候选产品2)的迭代逻辑比选,最终选择出最优食品。
3.1 场景功能-食养通
在pk比选这个部分进行应用,针对用户选中的食品,在系统中自动推出结合用户个性化的更健康产品,并展示出对比性解释说明提升推荐效果。