文章核心观点 - 快手提出业界首个工业级部署的电商搜索端到端生成式框架OneSearch 通过融合大语言模型能力解决传统级联搜索架构在语义理解、个性化排序和冷启动场景的局限性 显著提升搜索准确性和用户体验 [4][5][36] 技术架构创新 - 提出关键词增强层次量化编码(KHQE)模块 采用RQ-OPQ混合编码方案生成5层商品语义标识(SID) 前3层通过RQ-Kmeans捕捉层次化语义特征 后2层通过OPQ量化残差向量保留商品差异化属性 [12][16][19] - 设计多视角用户行为序列注入策略 显式引入短期行为序列直接编码至模型输入 隐式通过QFormer压缩长期行为序列至(n, 768)维向量 解决传统用户ID缺乏语义信息的问题 [12][18][21] - 构建偏好感知奖励系统(PARS) 结合三阶段监督微调(语义对齐/协同对齐/个性化建模)与自适应强化学习机制 通过六等级用户行为划分和动态权重调节提升排序精度 [12][23][30] 性能提升表现 - 离线实验显示最终版本在HR@350指标上订单数据提升至66.46%(较基线51.74%提升14.72个百分点) 点击数据提升至71.06%(较基线64.40%提升6.66个百分点) [35] - 在线部署后订单量提升3.22% 买家数提升2.4% 商品点击率(Item CTR)提升1.67% 页面浏览量点击率(PV CTR)提升3.14% [36][37] - 机器计算效率(MFU)从3.26%提升至24.06% 相对提升8倍 线上推理成本(OPEX)降低75.40% [38] - 在中长尾查询场景表现突出 中频查询点击率提升2.27% 冷启动商品点击率提升3.31%(显著高于常规商品2.34%) [42] 技术实现细节 - 商品语义建模采用四任务对齐机制:Q2Q/I2I对比损失对齐协同相似对 Q2I对比损失增强语义相关性 Q2I边际损失学习行为级别偏差 LLM难样本纠偏保障相关性水位 [14] - 用户行为序列加权计算采用指数平方根加权公式 短期序列权重λ_i=exp(√i)/∑exp(√i) 长期序列权重μ_j=exp(√j)/∑exp(√j) [18] - 奖励模型设计保持与原精排模型结构一致性 采用Listwise DPO对齐用户偏好 通过近7天CTR/CVR动态调节样本权重 [30][32] 应用与拓展 - 系统目前已部署于快手多个电商搜索场景 每日服务数百万用户 处理数千万PV量级 [36] - 未来将探索在线实时编码方案 结合多模态特征强化推理能力 并优化强化学习机制以精准匹配用户偏好 [46]
OneSearch,揭开快手电商搜索「一步到位」的秘技
机器之心·2025-09-18 04:32