(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210954761.5
(22)申请日 2022.08.10
(71)申请人 平安科技 (深圳) 有限公司
地址 518000 广东省深圳市福田区福田街
道福安社区益田路5033号平 安金融中
心23楼
(72)发明人 姚梦秋 毕野 王建明
(74)专利代理 机构 深圳市赛恩倍吉知识产权代
理有限公司 4 4334
专利代理师 陈敬华
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/9537(2019.01)
(54)发明名称
基于多元数据融合的精准推荐方法、 装置、
设备及介质
(57)摘要
本申请提出一种基于多元数据融合的精准
推荐方法、 装置、 电子设备及存储介质, 基于多元
数据融合的精 准推荐方法包括: 采集目标客户在
预设时间段内的客户数据, 客户数据包括结构化
数据和非结构化数据; 基于结构化数据构建目标
客户的第一客户特征; 基于非结构化数据构建目
标客户的第二客户特征; 将第一客户特征和第二
客户特征输入训练完毕的精准匹配模型以获取
目标客户的目标行为匹配率; 对比目标行为匹配
率和预设阈值 以判断目标客户是否为待匹配客
户, 若目标客户为待匹配客户, 则将目标客户推
送给工作人员以获取目标行为结果。 本申请能综
合考虑不同类型的数据, 提高精准推荐的准确
性。
权利要求书3页 说明书18页 附图2页
CN 115238189 A
2022.10.25
CN 115238189 A
1.一种基于多元 数据融合的精准推荐方法, 其特 征在于, 所述方法包括:
采集目标客户在预设时间段内的客户数据, 所述客户数据包括结构化数据和非结构化
数据;
基于所述结构化数据构建所述目标客户的第一 客户特征;
基于所述非结构化数据构建所述目标客户的第二 客户特征;
将所述第一客户特征和所述第二客户特征输入训练完毕的精准匹配模型以获取所述
目标客户的目标 行为匹配率;
对比所述目标行为匹配率和预设阈值以判断所述目标客户是否为待匹配客户, 若所述
目标客户为待匹配客户, 则将所述目标客户推送给工作人员以获取目标 行为结果。
2.如权利要求1所述的基于多元数据融合的精准推荐方法, 其特征在于, 所述采集目标
客户在预设时间段内的客户数据, 包括:
采集预设时间段内目标客户的结构化数据, 所述结构化数据至少包括所述目标客户的
基本信息和预设系统路径上的行为数据, 所述目标客户为所有客户中的任意 一个;
采集预设时间段内所述目标客户的非结构化数据, 所述非结构化数据至少包括工作 人
员与所述目标客户的沟通文本;
储存所述结构化数据和所述非结构化数据以获取 所述目标客户的客户数据。
3.如权利要求1所述的基于多元数据融合的精准推荐方法, 其特征在于, 所述基于所述
结构化数据构建所述目标客户的第一 客户特征包括:
基于所述结构化数据的预设取值范围对每一种结构化数据进行分类得到分类结果, 所
述分类结果包括数值型 数据和类别型 数据;
基于所述分类结果对所有结构化数据进行结构化预处理得到每一种结构化数据的标
准数值;
对所述类别型 数据的标准数值进行 数值编码以获取每一种类别型 数据的特 征值;
对所述数值型 数据的标准数值进行分箱处 理以获取每一种数值型 数据的特 征值;
将所有特 征值按照固定顺序进行排列以构建所述目标客户的第一 客户特征。
4.如权利要求3所述的基于多元数据融合的精准推荐方法, 其特征在于, 所述基于所述
分类结果对所有结构化数据进行 结构化预处 理得到每一种结构化数据的标准数值, 包括:
随机选取一种结构化数据作为目标 结构化数据;
若所述目标结构化数据的分类结果为数值型数据, 则依据 所述目标结构化数据的实际
取值计算标准分数; 若所述标准分数不大于预设分数, 则将所述实际取值作为所述 目标结
构化数据的标准数值, 若所述标准分数大于所述预设分数, 则将所有客户的客户数据中所
述目标结构化数据的平均值作为所述目标 结构化数据的标准数值;
若所述目标结构化数据的分类结果为类别型数据, 则判断所述目标结构化数据的实际
取值是否在对应的预设取值范围内; 若是, 则将所述实际取值作为所述 目标结构化数据的
标准数值, 若否, 则生成特殊字符作为所述目标结构化数据的标准数值, 所述特殊字 符为所
述目标结构化数据的预设取值范围之外的任意字符;
遍历所有结构化数据获取每一种结构化数据的标准数值。
5.如权利要求3所述的基于多元数据融合的精准推荐方法, 其特征在于, 所述对所述数
值型数据的标准数值进行分箱处 理以获取每一种数值型 数据的特 征值包括:权 利 要 求 书 1/3 页
2
CN 115238189 A
2获取目标数值型数据的预设取值范围, 所述目标数值型数据为所有数值型数据中的任
意一个;
依据分箱 处理函数将所述预设取值范围划分为预设数量的子范围, 并为每一个子范围
分配不同的整型 数据作为索引ID;
获取所述目标数值型数据的标准数值对应的子范围作为目标子范围, 将所述目标子范
围的索引ID作为所述目标 数值型数据的特 征值;
遍历所有数值型 数据以获取每一种数值型 数据的特 征值。
6.如权利要求1所述的基于多元数据融合的精准推荐方法, 其特征在于, 所述基于所述
非结构化数据构建所述目标客户的第二 客户特征包括:
对所述非结构化数据进行非结构化预处理得到标准序列 数据, 所述非结构化预处理包
括序列化处 理和去除预设字符;
按照预设规则拆分所述标准序列数据以获取多个标准子序列;
将所有标准子序列依次输入训练完毕的意图识别模型以获取每一个标准子序列的意
图识别结果, 并按照标准子序列在所述标准序列数据中的先后顺序排列所有标准子序列的
意图识别结果得到意图序列, 所述 意图识别结果 为客户对目标 行为的需求 程度等级;
基于所述 意图序列构建所述目标客户的第二 客户特征。
7.如权利要求6所述的基于多元数据融合的精准推荐方法, 其特征在于, 所述基于所述
意图序列构建所述目标客户的第二 客户特征包括:
获取所述意图序列中不同意图识别结果的种类数作为第一统计特 征;
获取所述意图序列中出现次数最多的意图识别结果作为第二统计特 征;
将所述意图序列中最后一个意图识别结果作为时间特 征;
截取所述意图序列中起始端预设数量的意图识别结果作为起始序列, 截取所述意图序
列中末尾端预设数量的意图识别结果作为末尾序列;
计算所述起始序列和所述末尾序列中每一种意图识别结果的占比的差值以获取每一
种意图识别结果的趋势特 征;
将所述第一统计特征、 所述第二统计特征、 所述时间特征和每一种意图识别结果的趋
势特征按照固定顺序进行排列, 得到所述目标客户的第二 客户特征。
8.如权利要求1所述的基于多元数据融合的精准推荐方法, 其特征在于, 所述将所述第
一客户特征和所述第二客户特征输入训练完毕的精准匹配模型以获取所述目标客户的目
标行为匹配率包括:
在所述第一客户特征和所述第 二客户特征的末端填充0以获取预设尺寸的第 一客户特
征和第二 客户特征;
依据融合系数对所述第 一客户特征和所述第 二客户特征进行融合以获取融合向量, 所
述融合向量满足关系式:
H=ch1+(1‑c)h2
其中, h1和h2分别为预设尺寸的第一客户特征和第一客户特征, c为融合系数, 所述融合
系数的取值范围为[0,1], H为融合向量;
将所述融合向量输入训练完毕的精准匹配模型以获取所述目标客户的目标行为匹配
率。权 利 要 求 书 2/3 页
3
CN 115238189 A
3
专利 基于多元数据融合的精准推荐方法、装置、设备及介质
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:35:39上传分享