用户行为逻辑建模
搜索文档
当推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新成果TagCF
机器之心· 2025-11-27 04:09
文章核心观点 - 快手团队提出TagCF框架,旨在让推荐系统从仅理解用户兴趣内容,升级到理解用户社会角色和特性,实现从“会猜”到“懂你”的跨越 [2] - 该方法通过引入用户角色建模,为推荐系统带来更强的可解释性和逻辑推理能力,并能显式地建模和突破用户信息茧房 [6][28] - 该研究成果已被NeurIPS 2025接收,相关代码与实验框架已全面开源 [3] 研究背景与动机 - 当前推荐系统算法主要聚焦于“内容层”理解,擅长识别用户喜欢哪类视频,但缺乏对“用户是谁”的深度理解 [2] - 用户角色是隐藏在内容关联背后的“混杂因素”,例如“耳机-交响乐手-小提琴”的关联实则源于“交响乐手”这一用户角色 [6] - 引入用户角色视角使推荐系统能更清晰地理解用户,迈向显式的可解释推荐,并在逻辑上具备更强的通用性与表达能力 [6][7] 提出的新任务 - 用户角色识别:建模用户的特征、个性、社会角色和需求,其中特征包含但不限于用户直接提供的特征值(如性别和年龄) [9] - 用户行为逻辑建模:建模用户角色和物品主题之间的逻辑关联图,可细分为I2U(物料适合分发给什么用户)和U2I(用户希望看到什么物料)两个子任务 [10][13] TagCF框架模块设计 - 基于MLLM的视频内容理解中台:利用MLLM模型对每日新增视频提取多模态内容,通过预设提示词自动生成物品标签与用户标签,并实时更新标签库 [16] - 基于LLM的行为逻辑图探索中台:在得到标签集合后,构建标签间逻辑图,使用LLM根据起始标签生成对侧的目标标签,形成U2I和I2U逻辑图 [18] - 赋能下游推荐系统:下游推荐系统可使用中台信息进行模型增强,提出了针对物品标签空间或用户标签空间增强的方案TagCF-it和TagCF-ut [22] 工程挑战与解决方案 - 面临无限制生成导致标签集合无序扩张、视频覆盖率长尾分布等挑战 [23] - 构建弱重叠高频标签子集作为覆盖集,经验上覆盖集规模为7k-20k,能在30天内收敛,在工业场景下具有足够稳定性和通用性 [24][25] - 用户标签全集规模为2,976,845,覆盖集大小为7,633且已收敛;物品标签全集规模为50,208,782,覆盖集大小为20,956且每日仍有数百扩张 [41] 实验效果与性能提升 - 在快手工业离线数据集上,TagCF-ut在NDCG@10指标上达到0.0201,相比基线最佳模型提升8.06%;TagCF-it在Cover@20指标上达到0.5440,提升14.21% [34] - 在Books数据集上,TagCF-ut在NDCG@10指标上达到0.1881,提升10.3%;在MRR@10指标上达到0.1560,提升13.60% [34] - 线上实验表明,TagCF-util策略相比基线提升交互次数0.946%,TagCF-expl策略提升多样性0.102%,并能有效提升用户长期留存指标0.037% [39][40] 技术优势与行业意义 - 用户角色相比兴趣点是更加稳定的特征,用户标签集合比物品标签集合具有更强的稳定性和表达能力,体现为更小的集合大小和更快的收敛速度 [40][41] - TagCF框架在符号与统计两种范式之间搭起桥梁,其tag-logic内容理解中台具备可迁移能力,未来可扩展至召回、电商、搜索等多业务场景 [44][45] - 该方法标志着推荐系统从“懂内容”到“懂人”的技术跃迁,使系统有能力从用户信息茧房出发进行有逻辑的语义探索,平衡准确性与多样性 [45]