(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210880920.1
(22)申请日 2022.07.26
(71)申请人 青岛小贝信息技 术有限公司
地址 266555 山东省青岛市黄岛区江山 南
路480号4栋904室-8
(72)发明人 徐淑宏 孙秋霞 吕玉敏 李勍
(74)专利代理 机构 青岛智地领创专利代理有限
公司 37252
专利代理师 张凯
(51)Int.Cl.
G06Q 40/08(2012.01)
G06Q 30/06(2012.01)
G06F 16/9535(2019.01)
(54)发明名称
一种基于混合推荐算法的保险产品精准推
荐方法
(57)摘要
本发明公开了一种基于混合推荐算法的保
险产品精准推荐方法, 利用TF ‑IDF模型计算新客
户保障项目需求与保险条款相关度M, 得到包含
高相关度的保险条款集的保险产品集合A; 利用
余弦相似度方法在已有客户信息资料库中寻找
相似客户集合和相似用户选购的保险产品集合
B; 构建“客户‑保障项目 ‑保险产品 ”保险数据三
阶评分张量, 利用Tucker张量 分解算法预测新客
户对保险产品的评分, 获得保险产品集合C; 利用
Personal Rank算法输出新客户兴趣度较高的保
险产品集合V, 得到新客户既感兴趣又符合需求
的保险产品集合Z。 本发明考虑保险条款对保障
项目的限制, 利用TF ‑IDF关键词提取方法, 将真
正符合客户保障需求的保险产品推荐给用户, 降
低客户基 于主观判断, 错选保险产品的概 率。
权利要求书3页 说明书7页 附图2页
CN 115409630 A
2022.11.29
CN 115409630 A
1.一种基于混合推荐算法的保险产品精准推荐方法, 其特 征在于, 包括以下步骤:
S1、 根据保险公司现有数据构建保险条款数据集、 已有客户信息资料库以及保障项目
需求词汇库;
S2、 收集新客户特性信息和保障项目需求信息, 通过有监督学习方法提取新客户保障
项目需求关键词;
S3、 利用TF ‑IDF模型计算新客户保障项目需求与保险条款相关度M, 设定相关度阈值a,
输出M>a的保险条款集, 进而 得到包含 所述保险条款集的保险产品集合A, 利用T F‑IDF算法
计算新客户保障项目需求评分;
S4、 利用余弦相似度 方法在已有客户信 息资料库中寻找相似客户集合和相似用户选购
的保险产品集 合B, 并提取相似用户的保障项目需求, 补充到新 客户保障项目需求中;
S5、 构建“客户‑保障项目 ‑保险产品 ”保险数据三阶评分张量, 通过S3中计算出的保障
项目需求评分以及S4中补充的新客户保障项目需求, 完善 “客户‑保障项目 ”信息, 利用
Tucker张量分解算法补全保险数据三阶评分张量, 预测新客户对保险产品的评分, 获得符
合新客户需求的保险产品集 合C;
S6、 合并S3、 S4和S5输出的保 险产品集合A、 B和C, 得到保 险产品集合D, 其中D=A∪B∪
C;
S7、 利用Person al Rank算法分析新客户在浏览保险产品时的数据, 输出新客户兴趣度
较高的保险产品集合V, 并与S6中的保险产品集合D比对, 得到新客户既感兴趣又符合需求
的保险产品集 合Z。
2.根据权利要求1所述的一种基于混合推荐算法的保险产品精准推荐方法, 其特征在
于, 在所述S2中, 将包括文字录入和 语音录入在内的各个渠道收集到的新客户需求转化为
文本信息, 并通过有监督关键词提取方法与保险行业专业词汇进行比对, 提取新客户的保
障项目需求关键词集 合H=(h1,h2,…,hi,…)。
3.根据权利要求1所述的一种基于混合推荐算法的保险产品精准推荐方法, 其特征在
于, 在所述S3中, 具体过程如下:
S31、 运用TF ‑IDF算法进行相关保险条款检索:
设保险条款数据集 N=(y1,y,…,yj,…),
关键词hi在保险条款yj中出现的频率TFij的计算公式为:
TFij=dij/(Σkdkj) (1)
其中, dij表示客户保 障项目需求关键词hi在保险条款yj中出现的次数, k表示关键词hi
的总数量;
逆文档频率 IDFi的计算公式为:
其中, |D|表示数据集中所有保险条款的数量, |j:hi∈yj|表示包含关键词hi的保险条
款数量, 加 “1”是为了防止数量 为“0”导致运算出错;
则保险条款yj与新客户保障项目需求的相关程度M计算公式为:
M=ΣiTFij·IDFi (3)
输出M>a的前b篇保险条款, 若不够b篇, 从低于阈值a的保险条款中按相关程度由高到权 利 要 求 书 1/3 页
2
CN 115409630 A
2低递补, 输出 涉及这些保险条款的保险产品集 合A;
S32、 运用TF ‑IDF算法计算 新客户保障项目需求评分;
在S31中的b篇保险条款中, 将同一保障项目需求关键词在不同保险条款中的TF ‑IDF权
重相加, 作为 新客户对该保障项目需求的评分。
4.根据权利要求1所述的一种基于混合推荐算法的保险产品精准推荐方法, 其特征在
于, 在所述S4中, 具体过程如下:
设描述新客户的特征属性向量为
若新客户具有属性pi, 则pi=1,否
则pi=0;
由余弦相似度定理计算 新客户s和客户t的相似程度:
若ω大于设定的阈值c, 则客户t为相似客户, 提取相似客户t的保障项目需求, 补全到
新客户保障项目需求中, 并获得相似客户t选购的保险产品集 合B。
5.根据权利要求1所述的一种基于混合推荐算法的保险产品精准推荐方法, 其特征在
于, 在所述S5中, 包括以下步骤:
S51、 构建“客户—保障项目—保险产品 ”保险数据三阶评分张量;
S52、 通过Tucker张量分解算法补全 “客户—保障项 目—保险产品 ”所构成的三阶评分
张量 χ;
设χ 的大小为 n1×n2×n3, 将位置索引集 合记为S, 进行T ucker分解后的表达式为:
χ≈g×1U×2V×3W (5)
其中, g为核心向量, 表示不同因子矩阵之间的相互作用水平; U为大小为n1×r1的客户
因子矩阵, V为大小为 n2×r2的保险产品因子矩阵, W 为大小为 n3×r3的保障项目因子矩阵;
则(5)式等 价于:
其中, xijk表示保险数据三阶张量中用户i对 包含保障项目k的保险产品j的评分;
将张量分解问题转 化为优化问题:
对目标函数J中的uim、 vjn、 wkl和gmnl求偏导数 可得:
根据梯度下降方法, uim、 vjn、 wkl和gmnl在每次迭代过程中的更新公式为:权 利 要 求 书 2/3 页
3
CN 115409630 A
3
专利 一种基于混合推荐算法的保险产品精准推荐方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:33:17上传分享