(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211132002.7 (22)申请日 2022.09.16 (71)申请人 百度时代网络技 术 (北京) 有限公司 地址 100193 北京市海淀区东北旺西路8号 中关村软件园17号楼二层A 2 (72)发明人 吴学超 周杨 白云龙 刘洁  郝昌臻  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 王瑞云 (51)Int.Cl. G06K 9/62(2022.01) G06F 16/9535(2019.01) G06F 16/958(2019.01) (54)发明名称 模型训练方法、 资源预估 方法、 装置、 电子设 备和介质 (57)摘要 本公开提供了一种模 型训练方法、 资源预估 装置、 电子设备和存储介质, 涉及人工智能领域, 尤其涉及深度学习技术。 具体实现方案包括: 获 取指定业务场景下的训练样本; 其中, 所述指定 业务场中存在多个业务目标; 针对任一训练样 本, 从所述训练样本中提取通用特征和与业务目 标相关的业务特征; 根据所述通用特征和与业务 目标相关的业务特征, 训练所述多目标预估模 型。 本公开方案实现了在特征体系不统一的情况 下, 使用通用特征+业务特征的特征体系完成多 目标预估模 型训练的目的, 且保证了多目标预估 模型的预估效果。 权利要求书3页 说明书10页 附图5页 CN 115456085 A 2022.12.09 CN 115456085 A 1.一种多目标 预估模型训练方法, 包括: 获取指定业 务场景下的训练样本; 其中, 所述指定业 务场中存在多个业 务目标; 针对任一训练样本, 从所述训练样本中提取通用特 征和与业 务目标相关的业 务特征; 根据所述 通用特征和与业 务目标相关的业 务特征, 训练所述多目标 预估模型。 2.根据权利要求1所述的方法, 其中, 所述多目标预估模型的底层网络包括用于接收通 用特征的通用塔网络和用于接收业务特征的业务塔网络; 所述多目标预估模型的上层网络 包括每个业务目标各自对应的用于预估资源的预估子网络 。 3.根据权利要求2所述的方法, 其中, 根据所述通用特征和与业务目标相关的业务特 征, 训练所述多目标 预估模型, 包括: 将所述通用特征输入到所述 通用塔网络中; 针对与任一业务目标相关的业务特征, 将所述业务特征输入到所述业务塔网络中, 并 确定该业 务目标对应的第一预估子网络; 将所述通用塔网络的输出结果和所述业务塔网络的输出结果, 前向传播到所述第 一预 估子网络中; 根据所述第 一预估子网络输出的预估误差, 反 向更新所述第 一预估子网络的网络参数 和所述底层网络的网络参数。 4.根据权利要求3所述的方法, 其中, 所述多目标预估模型的底层网络还包括交叉层网 络; 将所述通用塔网络的输出结果和所述业务塔网络的输出结果, 前向传播到所述第 一预 估子网络中, 包括: 通过所述交叉层网络对所述通用塔网络的输出结果和所述业务塔网络的输出结果进 行交叉处 理, 得到交叉 特征; 将所述交叉 特征前向传播到所述第一预估子网络中。 5.根据权利要求4所述的方法, 其中, 通过所述交叉层网络对所述通用塔网络的输出结 果和所述 业务塔网络的输出 结果进行交叉处 理, 包括: 通过所述交叉层网络, 按照元素相加的方式对所述通用塔网络的输出结果和所述业务 塔网络的输出 结果进行交叉处 理; 或, 通过所述交叉层网络, 按照元素相乘的方式对所述通用塔网络的输出结果和所述业务 塔网络的输出 结果进行交叉处 理; 或, 通过所述交叉层网络, 对所述业务塔网络的输出结果进行非线性变换, 并按照元素相 乘的方式对非线性变换 结果和所述 通用塔网络的输出 结果进行交叉处 理。 6.根据权利要求3所述的方法, 还 包括: 根据不同业 务目标对应的训练样本的规模差异为所述预估误差设置相应的训练权 重。 7.根据权利要求1所述的方法, 其中, 所述通用特征包括用户特征、 文章特征、 用户行为 序列特征、 用户请求特征中的至少一项; 所述业务特征为资源点击率特征、 资源播放时长特 征、 交互特征中的至少一项。 8.一种资源预估方法, 包括: 获取待预估的目标资源; 从所述目标资源中提取通用特 征和与业 务目标相关的业 务特征;权 利 要 求 书 1/3 页 2 CN 115456085 A 2通过多目标预估模型, 对所述通用特征和所述业务特征进行预测预估, 得到所述目标 资源的预估结果; 其中, 所述多目标预估模型是按照权利要求 1‑7中任一所述方法训练后得 到。 9.根据权利要求1所述的方法, 其中, 所述多目标预估模型的底层网络包括用于接收通 用特征的通用塔网络和用于接收业务特征的业务塔网络; 所述多目标预估模型的上层网络 包括每个业务目标各自对应的用于预估资源的预估子网络; 通过多目标 预估模型, 对所述 通用特征和所述 业务特征进行预测预估, 包括: 将所述通用特征输入到所述 通用塔网络, 并将所述 业务特征输入到业 务塔网络; 将所述通用塔网络的输出结果和所述业务塔的输出结果进行交叉处理, 并将交叉结果 输入到业 务目标对应的预估子网络中进行 预估。 10.一种多目标 预估模型训练装置, 包括: 数据获取模块, 用于获取指定业务场景下的训练样本; 其中, 所述指定业务场中存在多 个业务目标; 特征提取模块, 用于针对任一训练样本, 从所述训练样本中提取通用特征和与业务目 标相关的业 务特征; 训练模块, 用于根据所述通用特征和与业务目标相关的业务特征, 训练所述多目标预 估模型。 11.根据权利要求10所述的装置, 其中, 所述多目标预估模型的底层网络包括用于接收 通用特征的通用塔网络和用于接收业务特征的业务塔网络; 所述多目标预估模型的上层网 络包括每 个业务目标各自对应的用于预估资源的预估子网络 。 12.根据权利要求1 1所述的装置, 其中, 所述训练模块包括: 第一输入单 元, 用于将所述 通用特征输入到所述 通用塔网络中; 第二输入单元, 用于针对与任一业务目标相关的业务特征, 将所述业务特征输入到所 述业务塔网络中, 并确定该业 务目标对应的第一预估子网络; 前向传播单元, 用于将所述通用塔网络的输出结果和所述业务塔网络的输出结果, 前 向传播到所述第一预估子网络中; 参数更新单元, 用于根据所述第一预估子网络输出的预估误差, 反向更新所述第一预 估子网络的网络参数和所述底层网络的网络参数。 13.根据权利要求12所述的装置, 其中, 所述多目标预估模型的底层网络还包括交叉层 网络; 所述前向传播单 元包括: 交叉子单元, 用于通过所述交叉层网络对所述通用塔网络的输出结果和所述业务塔网 络的输出 结果进行交叉处 理, 得到交叉 特征; 传输子单元, 用于将所述交叉 特征前向传播到所述第一预估子网络中。 14.根据权利要求13所述的装置, 其中, 所述交叉子单 元还用于: 通过所述交叉层网络, 按照元素相加的方式对所述通用塔网络的输出结果和所述业务 塔网络的输出 结果进行交叉处 理; 或, 通过所述交叉层网络, 按照元素相乘的方式对所述通用塔网络的输出结果和所述业务 塔网络的输出 结果进行交叉处 理; 或,权 利 要 求 书 2/3 页 3 CN 115456085 A 3

.PDF文档 专利 模型训练方法、资源预估方法、装置、电子设备和介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、资源预估方法、装置、电子设备和介质 第 1 页 专利 模型训练方法、资源预估方法、装置、电子设备和介质 第 2 页 专利 模型训练方法、资源预估方法、装置、电子设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:36:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。