(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211001487.6 (22)申请日 2022.08.19 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 杨杨 张初兵 祝恒书 宋欣  秦川  (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 专利代理师 阎敏 王姗姗 (51)Int.Cl. G06Q 30/06(2012.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 16/9535(2019.01) (54)发明名称 推荐模型的训练方法、 装置、 电子设备和存 储介质 (57)摘要 本公开提供了推荐模型的训练方法、 装置、 电子设备和存储介质, 涉及人工智能技术领域, 尤其涉及深度学习技术领域。 具体实现方案为: 将第一样 本序列输入推荐模型, 该第一样本序列 包括多个实体; 获取该推荐模型得到的各个实体 的第一特征表示; 其中, 该第一特征表示根据该 第一样本序列的注意力信息确定, 该注意力信息 与该第一样本序列中每对实体之间的距离信息 和关系信息中的至少一项相关; 根据各个实体的 第一特征表示, 确定损失函数的值; 以及, 根据该 损失函数的值调整该推荐模型的参数, 以对该推 荐模型进行训练。 本公开能够提高推荐模型的性 能。 权利要求书4页 说明书14页 附图7页 CN 115456708 A 2022.12.09 CN 115456708 A 1.一种推荐模型的训练方法, 包括: 将第一样本序列输入推荐模型, 所述第一样本序列包括多个实体; 获取所述推荐模型得到的各个所述实体的第一特征表示; 其中, 所述第一特征表示根 据所述第一样本序列的注意力信息确定, 所述注 意力信息与所述第一样本序列中每对实体 之间的距离信息和关系信息中的至少一项相关; 根据所述各个实体的第一特 征表示, 确定损失函数的值; 以及, 根据所述损失函数的值调整所述推荐模型的参数, 以对所述推荐模型进行训练。 2.根据权利要求1所述的方法, 其中, 所述第 一样本序列中每对实体之间的距离信 息采 用对应的距离值表示, 所述距离值与该对实体之间的最短路径正相关。 3.根据权利要求1或2所述的方法, 其中, 所述第一样本序列中每对实体之间的关系信息由第一关系的特征表示和所述第一关 系的权重中的至少之一确定; 所述第一关系包括该对实体之间的关系; 所述第一关系的特 征表示或所述第一关系的权 重由所述推荐模型确定 。 4.根据权利要求1至 3中任一所述的方法, 还 包括: 利用数据集合构建元图信息, 所述数据集合包括用户与商品的交互集合、 以及用户与 商品的知识图谱集 合中的至少之一; 所述元图信息中包括多个所述第一样本序列, 每个所述第一样本序列对应一个用户 ‑ 商品对, 所述用户 ‑商品对中包括第一用户和第一商品; 所述第一样本序列中包括所述第一用户的用户实体、 所述第一用户的近邻实体、 所述 第一用户到所述第一商品的路径中所包含的路径实体、 所述第一商品的近邻实体、 以及所 述第一商品的商品实体中的至少之一。 5.根据权利要求 4所述的方法, 其中, 所述 根据数据集 合构建元图信息, 包括: 从所述数据集 合中选择一个用户, 将所述用户的实体作为当前实体; 针对所述当前实体的各个近邻实体, 根据与所述近邻实体有关系的实体的个数、 以及 所述当前实体与所述近邻实体的关系在所述数据集合中出现的次数中的至少之一, 确定所 述近邻实体作为所述当前实体的下一个实体的第一 概率; 根据所述第一 概率, 从所述当前实体的各个近邻实体中确定下一个实体; 将所述下一个实体作为当前实体, 重复执行针对当前实体的各个近邻实体确定所述第 一概率的过程, 直至确定出的下一个实体为商品实体的情况 下, 结束构建过程。 6.根据权利要求4或5所述的方法, 其中, 所述第一特征表示根据所述第一样本序列的 注意力信息确定, 包括: 所述第一特征表示根据 所述第一样本序列的注意力信 息、 所述第 一样本序列中各个实 体的初始特 征表示、 以及所述第一样本序列中各个实体的第二特 征表示确定; 其中, 所述第二特 征表示用于表征对应实体的类型, 所述类型包括以下至少一种: 第一类型, 包括所述第一用户的用户实体或所述第一商品的商品实体; 第二类型, 包括所述第一用户的近邻实体或所述第一商品的近邻实体; 第三类型, 包括所述路径实体。 7.根据权利要求6所述的方法, 其中, 所述初始特征表示或所述第 二特征表示由所述推权 利 要 求 书 1/4 页 2 CN 115456708 A 2荐模型根据所述第一样本序列得到 。 8.根据权利要求4 ‑7中任一所述的方法, 其中, 所述将第一样本序列输入推荐模型, 包 括: 针对所述第一样本序列中的各个路径, 将所述路径中的第一商品、 以及所述路径以外 的其他路径中的实体进行掩码, 将掩码后的第一样本序列输入所述推荐模型。 9.根据权利要求8所述的方法, 其中, 所述根据所述各个实体的第一特征表示, 确定损 失函数的值, 包括: 根据所述各个实体的第 一特征表示中, 所述第 一用户的用户实体的第 一特征表示和所 述第一商品的商品实体的第一特 征表示, 确定第一损失函数; 根据所述各个实体的第一特征表示中, 所述第一商品的商品实体的第一特征表示, 确 定为所述第一用户推荐 各个第二商品的第二概率; 根据所述第二概率, 确定第二损失函数; 所述第二商品为所述数据集 合中的任意商品; 利用所述第一损失函数和所述第二损失函数, 确定所述损失函数的值。 10.根据权利要求9所述的方法, 还 包括: 针对所述第一样本序列中的各个路径, 根据所述第二损失函数确定所述路径的权 重。 11.一种商品推荐方法, 包括: 利用第二用户构建第二序列, 所述第二序列包括多个实体, 所述多个实体中的第一个 实体为所述第二用户对应的实体; 将所述第二序列输入推荐模型; 以及, 根据所述推荐模型的预测结果, 确定为所述第 二用户推荐的商品; 其中, 所述推荐模型 采用权利要求1至10中任一所述的方法训练得到 。 12.根据权利要求11所述的方法, 其中, 所述推荐模型的预测结果包括: 所述第二序列 中的各个实体对应的特 征表示; 所述根据所述推荐模型的预测结果, 确定为所述第二用户推荐的商品, 包括: 根据所述第二序列中最后一个实体对应的特征表示, 确定为所述第二用户推荐的商 品。 13.一种推荐模型的训练装置, 包括: 第一输入 模块, 用于将第一样本序列输入推荐模型, 所述第一样本序列包括多个实体; 获取模块, 用于获取所述推荐模型得到的各个所述实体的第 一特征表示; 其中, 所述第 一特征表示根据所述第一样本序列的注意力信息确定, 所述注意力信息与所述第一样本序 列中每对实体之间的距离信息和关系信息中的至少一项相关; 损失函数确定模块, 用于根据所述各个实体的第一特征表示, 确定损失函数的值; 以 及, 调整模块, 用于根据所述损 失函数的值调整所述推荐模型的参数, 以对所述推荐模型 进行训练。 14.根据权利要求13所述的装置, 其中, 所述第 一样本序列中每对实体之间的距离信 息 采用对应的距离值表示, 所述距离值与该对实体之间的最短路径正相关。 15.根据权利要求13或14所述的装置, 其中, 所述第一样本序列中每对实体之间的关系信息由第一关系的特征表示和所述第一关权 利 要 求 书 2/4 页 3 CN 115456708 A 3

.PDF文档 专利 推荐模型的训练方法、装置、电子设备和存储介质

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 推荐模型的训练方法、装置、电子设备和存储介质 第 1 页 专利 推荐模型的训练方法、装置、电子设备和存储介质 第 2 页 专利 推荐模型的训练方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:36:24上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。