(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211015938.1 (22)申请日 2022.08.24 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 王震 张文慧 吴志华 于佃海  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) G06F 16/9535(2019.01) (54)发明名称 多任务模型的训练方法、 信息推荐方法、 装 置和设备 (57)摘要 本公开提供了一种多任务模 型的训练方法, 涉及人工智 能技术领域, 尤其涉及深度学习、 云 计算、 多任务并行处理和数据搜索技术领域。 具 体实现方案为: 将样本对象 的样本行为数据输入 共享子模型, 得到样本对象的行为特征信息, 其 中, 行为特征信息包括多个行为特征子信息; 根 据与任务处理子模型相关的行为特征子信息, 得 到任务处理子模 型的子损失值; 根据任务处理子 模型的子损失值, 确定与子损失值对应的目标梯 度值; 根据多个目标梯度值, 确定与子损失值对 应的权重值; 以及根据多个子损失值以及分别与 多个子损失值对应的多个权重值, 训练多任务模 型。 本公开还提供了一种信息推荐方法、 装置、 电 子设备和存 储介质。 权利要求书3页 说明书11页 附图6页 CN 115081630 A 2022.09.20 CN 115081630 A 1.一种多任务模型的训练方法, 所述多任务模型包括多个任务处理子模型和共享子模 型, 所述方法包括: 将样本对象的样本行为数据输入所述共享子模型, 得到所述样本对象的行为特征信 息, 其中, 所述行为特 征信息包括多个行为特 征子信息; 根据与所述任务处理子模型相关的所述行为特征子信 息, 得到所述任务处理子模型的 子损失值; 根据所述任务处 理子模型的子损失值, 确定与所述子损失值对应的目标梯度值; 根据多个所述目标梯度值, 确定与所述子损失值对应的权 重值; 以及 根据多个所述子损失值以及分别与多个所述子损失值对应的多个所述权重值, 训练所 述多任务模型。 2.根据权利要求1所述的方法, 其中, 所述根据多个所述目标梯度值, 确定与所述子损 失值对应的权 重值包括: 根据多个所述目标梯度值, 确定处 理参数值; 以及 根据所述处理参数值和与 所述子损失值对应的所述目标梯度值, 确定与所述子损失值 对应的所述权 重值。 3.根据权利要求2所述的方法, 其中, 所述根据所述处理参数值和与 所述子损失值对应 的目标梯度值, 确定与所述子损失值对应的所述权 重值包括: 对与所述子损失值对应的目标梯度值进行处 理, 得到处 理后目标梯度值; 根据所述处理参数值, 对所述处理后目标梯度值进行归一化处理, 得到归一化梯度值; 以及 根据所述归一 化梯度值的倒数, 确定与所述子损失值对应的所述权 重值。 4.根据权利要求1所述的方法, 其中, 所述根据与 所述任务处理子模型相关的所述行为 特征子信息, 得到所述任务处 理子模型的子损失值包括: 将与所述任务处理子模型相关的所述行为特征子信 息输入所述任务处理子模型, 得到 所述任务处 理子模型的输出 结果; 以及 根据所述输出 结果, 得到所述任务处 理子模型的所述子损失值。 5.根据权利要求1所述的方法, 其中, 所述根据多个所述子损失值以及分别与多个所述 子损失值对应的多个所述权 重值, 训练所述多任务模型包括: 根据多个所述子损失值以及分别与多个所述子损失值对应的多个所述权重值, 得到损 失值; 以及 根据所述损失值, 训练所述多任务模型。 6.根据权利要求5所述的方法, 其中, 所述根据多个所述子损失值以及分别与多个所述 子损失值对应的多个所述权 重值, 得到损失值包括: 根据多个所述子损失值以及分别与多个所述子损失值对应的多个所述权重值, 进行加 权求和, 得到所述损失值。 7.根据权利要求5所述的方法, 其中, 所述 根据所述损失值, 训练所述多任务模型包括: 根据所述损 失值, 分别调整多个所述任务处理子模型以及所述共享子模型的参数, 以 训练所述多任务模型。 8.一种信息推荐方法, 包括:权 利 要 求 书 1/3 页 2 CN 115081630 A 2将目标对象的目标 行为数据输入多任务模型, 得到多个输出 结果; 根据所述多个输出 结果, 向所述目标对象推荐目标信息, 其中, 所述多任务模型 是根据权利要求1至7任一项所述的方法训练得到的。 9.一种多任务模型的训练装置, 所述多任务模型包括多个任务处理子模型和共享子模 型, 所述装置包括: 第一获得模块, 用于将样本对象的样本行为数据输入所述共享子模型, 得到所述样本 对象的行为特 征信息, 其中, 所述行为特 征信息包括多个行为特 征子信息; 第二获得模块, 用于根据与所述任务处理子模型相关的所述行为特征子信息, 得到所 述任务处 理子模型的子损失值; 第一确定模块, 用于根据所述任务处理子模型的子损 失值, 确定与所述子损 失值对应 的目标梯度值; 第二确定模块, 用于根据多个所述目标梯度值, 确定与所述子损失值对应的权重值; 以 及 训练模块, 用于根据多个所述子损失值以及 分别与多个所述子损失值对应的多个所述 权重值, 训练所述多任务模型。 10.根据权利要求9所述的装置, 其中, 所述第二确定模块包括: 第一确定 子模块, 用于根据多个所述目标梯度值, 确定处 理参数值; 以及 第二确定子模块, 用于根据所述处理参数值和与所述子损失值对应的所述目标梯度 值, 确定与所述子损失值对应的所述权 重值。 11.根据权利要求10所述的装置, 其中, 所述第二确定 子模块包括: 处理单元, 用于对与所述子损 失值对应的目标梯度值进行处理, 得到处理后目标梯度 值; 归一化处理单元, 用于根据所述处理参数值, 对所述处理后目标梯度值进行归一化处 理, 得到归一 化梯度值; 以及 确定单元, 用于根据所述归一化梯度值的倒数, 确定与所述子损 失值对应的所述权重 值。 12.根据权利要求9所述的装置, 其中, 所述第二获得模块包括: 第一获得子模块, 用于将与 所述任务处理子模型相关的所述行为特征子信 息输入所述 任务处理子模型, 得到所述任务处 理子模型的输出 结果; 以及 第二获得子模块, 用于根据所述输出 结果, 得到所述任务处 理子模型的所述子损失值。 13.根据权利要求9所述的装置, 其中, 所述训练模块包括: 第三获得子模块, 用于根据多个所述子损失值以及 分别与多个所述子损失值对应的多 个所述权 重值, 得到损失值; 以及 训练子模块, 用于根据所述损失值, 训练所述多任务模型。 14.根据权利要求13所述的装置, 其中, 所述第三获得子模块包括: 加权求和单元, 用于根据多个所述子损失值以及分别与多个所述子损失值对应的多个 所述权重值, 进行加权求和, 得到所述损失值。 15.根据权利要求13所述的装置, 其中, 所述训练子模块包括: 调整单元, 用于根据所述损 失值, 分别调整多个所述任务处理子模型以及所述共享子权 利 要 求 书 2/3 页 3 CN 115081630 A 3

.PDF文档 专利 多任务模型的训练方法、信息推荐方法、装置和设备

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 多任务模型的训练方法、信息推荐方法、装置和设备 第 1 页 专利 多任务模型的训练方法、信息推荐方法、装置和设备 第 2 页 专利 多任务模型的训练方法、信息推荐方法、装置和设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:36:08上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。