(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210986121.2
(22)申请日 2022.08.17
(71)申请人 康键信息技 术 (深圳) 有限公司
地址 518000 广东省深圳市前海深港合作
区前湾一路1号A栋201室 (入驻深圳市
前海商务秘书 有限公司)
(72)发明人 薛忠源
(74)专利代理 机构 北京辰权知识产权代理有限
公司 11619
专利代理师 王卫丽
(51)Int.Cl.
G06F 16/9538(2019.01)
G06F 16/9535(2019.01)
(54)发明名称
搜索结果 排序方法、 装置、 设备及 介质
(57)摘要
本发明涉及智能决策技术领域, 公开了一种
搜索结果排序方法、 装置、 设备及介质, 包括: 接
收用户终端发送的搜索请求, 并确定对应搜索对
象; 获取当前用户的第一初始画像特征、 当前用
户点击搜索对象的行为特征, 以及所有搜索对象
的第二初始画 像特征; 将第一初始画 像特征和第
二初始画像特征中的连续型变量转换为分散型
变量, 分别得到第一目标画 像特征和第二目标画
像特征; 基于第一目标画 像特征、 行为特征、 第二
目标画像特征及当前搜索对象特征, 通过训练好
的搜索预测模 型计算各搜索对象的点击概率; 按
照点击概率由高到低排序, 并选取排序靠前的指
定数目个搜索对象作为搜索结果。 能够对搜索对
象的点击率进行准确计算, 具有良好的搜索结果
预测能力。
权利要求书2页 说明书11页 附图3页
CN 115329222 A
2022.11.11
CN 115329222 A
1.一种搜索结果 排序方法, 其特 征在于, 包括:
接收用户终端发送的搜索请求, 并确定所述搜索请求对应的搜索对象;
获取当前用户的第一初始画像特征、 所述当前用户点击所述搜索对象的行为特征, 以
及所有所述搜索对象的第二初始 画像特征;
将所述第一初始画像特征中和所述第 二初始画像特征中的连续型变量, 均转换为分散
型变量, 分别得到第一目标画像特 征和第二目标画像特 征;
基于所述第一目标画像特征、 所述行为特征、 所述第二目标画像特征及当前搜索对象
特征, 通过训练好的搜索预测模型计算各 所述搜索对象的点击概 率;
按照所述点击概率由高到低 排序, 并选取排序靠前的指定数目个搜索对象作为搜索结
果。
2.如权利要求1所述的搜索结果排序方法, 其特征在于, 所述搜索预测模型为深度兴趣
网络模型, 包括离 散化层和FM层;
将所述第一初始画像特征中和所述第 二初始画像特征中的连续型变量, 均转换为分散
型变量, 分别得到第一目标画像特 征和第二目标画像特 征, 包括:
通过所述离散化层将所述第 一初始画像特征中连续型变量转换为第 一分散型变量, 将
所述第二初始 画像特征中的连续型变量 转换为第二分散型变量;
通过所述FM层 分别对所述第 一分散型变量和所述第 二分散型变量进行交叉, 得到所述
第一目标画像特 征和所述第二目标画像特 征。
3.如权利要求2所述的搜索结果排序方法, 其特征在于, 通过所述离散化层将所述第 一
初始画像特征中连续型变量转换为第一分散型变量, 将所述第二初始画像特征中的连续型
变量转换为第二分散型变量, 包括:
通过所述离散化层对所述第一初始画像特征中连续型变量进行WOE分箱, 并对分箱后
的变量进行嵌入式编码, 生成第一分散型变量;
通过所述离散化层对所述第二初始画像特征中连续型变量进行WOE分箱, 并对分箱后
的变量进行嵌入式编码, 生成第二分散型变量。
4.如权利要求3所述的搜索结果排序方法, 其特征在于, 所述搜索预测模型还包括注意
力层和稠密 层;
所述基于所述第一目标画像特征、 所述行为特征、 所述第二目标画像特征及所述当前
搜索对象特 征, 通过训练好的搜索预测模型计算各 所述搜索对象的点击概 率, 包括:
通过所述注意力层对所述行为特征和所述当前搜索对象特征进行处理, 降低数据维
度, 提取有效特 征数据;
基于所述第一目标画像特征、 所述第二目标画像特征及所述有效特征数据, 通过所述
稠密层计算各 所述搜索对象的点击概 率。
5.如权利要求1所述的搜索结果排序方法, 其特征在于, 所述搜索对象包括医生; 所述
当前搜索对象特 征包括当前医生的ID信息、 所属科室的ID信息、 所属医院的ID信息;
所述获取当前用户的第一初始画像特征、 所述当前用户点击所述搜索对象的行为特
征, 以及所有所述搜索对象的第二初始 画像特征, 包括:
获取所述当前用户的基础信息、 消费信息及偏好信息;
获取各医生的问诊价格、 接通 率、 好评率及医生级别;权 利 要 求 书 1/2 页
2
CN 115329222 A
2获取所述当前用户最近预设数目次点击的医生的ID相关特 征。
6.如权利要求1所述的搜索结果排序方法, 其特征在于, 所述通过训练好的搜索预测模
型计算各 所述搜索对象的点击概 率之前, 还 包括:
基于用户终端记载的每个用户, 将用户进行搜索请求 时曝光的所有搜索对象作为该用
户对应的样本; 其中被点击的为 正样本, 未被点击的为负 样本;
获取每个用户的第一初始画像特征、 每个用户点击所述搜索对象的行为特征, 以及所
有所述搜索对象的第二初始 画像特征, 得到训练数据集;
构建基于 离散型数据变换的预测模型的网络结构;
根据所述训练数据集, 对所述预测模型的网络结构进行训练, 得到用于计算各所述搜
索对象点击概 率的搜索预测模型。
7.如权利要求1 ‑6任一项所述的搜索结果排序 方法, 其特征在于, 所述搜索预测模型包
括解耦部署的离线部分和在线部分, 所述离线部分用于, 将所述第一初始画像特征和所述
第二初始画像特征中的连续型变量, 均转换为分散型变量, 分别得到第一 目标画像特征和
第二目标画像特 征;
所述在线部分用于, 基于所述第 一目标画像特征、 所述行为特征、 所述第 二目标画像特
征及所述当前搜索对象特 征, 计算各 所述搜索对象的点击概 率。
8.一种搜索结果 排序装置, 其特 征在于, 包括:
请求接收模块, 用于接收用户终端发送的搜索请求, 并确定所述搜索请求对应的搜索
对象;
数据获取模块, 用于获取当前用户的第一初始画像特征、 所述当前用户点击所述搜索
对象的行为特 征, 以及所有所述搜索对象的第二初始 画像特征;
变量转化模块, 用于将所述第 一初始画像特征中和所述第 二初始画像特征中的连续型
变量, 均转换为分散型变量, 分别得到第一目标画像特 征和第二目标画像特 征;
点击率计算模块, 用于基于所述第 一目标画像特征、 所述行为特征、 所述第 二目标画像
特征及当前搜索对象特 征, 通过训练好的搜索预测模型计算各 所述搜索对象的点击概 率;
结果确定模块, 用于按照所述点击概率由高到低排序, 并选取排序靠前的指定数目个
搜索对象作为搜索结果。
9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器
上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至
7任一项所述搜索结果 排序方法的步骤。
10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在
于, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述搜索结果排序方法的
步骤。权 利 要 求 书 2/2 页
3
CN 115329222 A
3
专利 搜索结果排序方法、装置、设备及介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:36:28上传分享