(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210461027.5 (22)申请日 2022.04.28 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 王昊天 吴晓烽 王维强  (74)专利代理 机构 北京国昊天诚知识产权代理 有限公司 1 1315 专利代理师 朱文杰 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/33(2019.01) G06F 40/30(2020.01) G06F 40/211(2020.01) G06K 9/62(2022.01) (54)发明名称 数据处理方法、 装置及设备 (57)摘要 本说明书实施例提供了一种数据处理方法、 装置及设备, 所述方法包括: 获取目标用户对目 标话术的反馈信息, 并获取所述目标话术对应的 目标关键词, 所述目标话术用于在与所述目标用 户的交互过程中, 获取所述目标用户针对目标业 务的反馈信息; 基于所述目标话术、 所述目标关 键词、 所述反馈信息以及预先训练的分类模型, 确定所述反馈信息对应的意图类型, 所述预先训 练的分类模 型用于根据所述目标关键词、 所述目 标话术、 所述反馈信息, 以及预先学习的句式知 识, 确定所述反馈信息对应的意图类型; 基于所 述目标话术和所述反馈信息对应的意图类型, 确 定所述目标业 务是否存在风险。 权利要求书4页 说明书18页 附图7页 CN 114880472 A 2022.08.09 CN 114880472 A 1.一种数据处 理方法, 包括: 获取目标用户对目标话术的反馈信息, 并获取所述目标话术对应的目标关键词, 所述 目标话术用于在与所述目标用户的交互过程中, 获取所述目标用户针对目标业务的反馈信 息; 基于所述目标话术、 所述目标关键词、 所述反馈信息以及预先训练的分类模型, 确定所 述反馈信息对应的意图类型, 所述预先训练的分类模型用于根据所述 目标关键词、 所述 目 标话术、 所述反馈信息, 以及预 先学习的句式知识, 确定所述反馈信息对应的意图类型; 基于所述目标话术和所述反馈信息对应的意图类型, 确定所述目标业务是否存在风 险。 2.根据权利要求1所述的方法, 所述获取 所述目标话 术对应的目标关键词, 包括: 基于所述目标话术和预先训练 的关键词提取模型, 确定所述目标话术对应的第 一关键 词, 所述关键词提取模型为基于历史话 术对由机器学习算法构建的模型进行训练得到; 对所述第一关键词进行筛 选处理, 得到所述目标话 术对应的目标关键词。 3.根据权利要求1所述的方法, 所述获取 所述目标话 术对应的目标关键词, 包括: 基于所述目标话术和预先训练 的关键词提取模型, 确定所述目标话术对应的第 一关键 词, 所述关键词提取模型为基于历史话 术对由机器学习算法构建的模型进行训练得到; 基于预先构建的关键词对应关系, 获取与所述第一关键词对应的所述目标关键词。 4.根据权利要求2或3所述的方法, 所述目标话术有多个, 所述基于所述目标话术和所 述反馈信息对应的意图类型, 确定所述目标业 务是否存在风险, 包括: 基于所述目标话术对应的预设权重、 所述反馈信息以及所述反馈信息对应的意图类 型, 确定每 个所述目标话 术对应的风险分值; 基于所述每 个所述目标话 术对应的风险分值, 确定所述目标业 务是否存在风险。 5.一种数据处 理方法, 包括: 获取历史话术, 所述历史话术的历史反馈信息, 以及所述历史反馈信息对应的意图类 型; 获取与所述历史话 术对应的第一关键词; 基于所述历史话术、 所述第一关键词、 所述历史反馈信息以及所述历史反馈信息对应 的意图类型, 对分类模型进 行训练, 得到预先训练的分类模型, 所述预先训练的分类模型用 于基于目标话术、 所述目标话术的反馈信息、 所述目标话术对应的目标关键词, 以及在训练 过程中学习到的句式知识, 确定所述目标话 术的反馈信息对应的意图类型。 6.根据权利要求5所述的方法, 所述基于所述历史话术、 所述第一关键词、 所述历史反 馈信息以及所述历史反馈信息对应的意图类型, 对分类模型进行训练, 得到预先训练的分 类模型, 包括: 基于所述历史话 术和所述历史反馈信息, 确定语义字符序列; 基于所述语义字符序列中每 个字符的位置信息, 确定 字符位置序列; 基于所述历史话 术、 所述历史反馈信息和所述第一关键词, 确定语句分块序列; 将所述语义字符序列、 所述字符位置序列和所述语句分块序列输入所述分类模型进行 训练, 得到所述预 先训练的分类模型。 7.根据权利要求6所述的方法, 所述基于所述历史话术、 所述历史反馈信 息和所述第 一权 利 要 求 书 1/4 页 2 CN 114880472 A 2关键词, 确定语句分块序列, 包括: 将所述历史话 术确定为第一语块, 并生成与所述第一语块对应的第一子序列; 将所述历史反馈信息确定为第二语块, 并基于所述第一关键词和所述第二语块, 生成 第二子序列; 基于所述第一子序列和所述第二子序列, 确定所述语句分块序列, 所述第一子序列中 的序列号与所述第二子序列中的序列号 不同。 8.根据权利要求6所述的方法, 所述基于所述第 一关键词和所述第 二语块, 生成第 二子 序列, 包括: 将所述第二语块中与 所述第一关键词匹配的字符对应的序列号确定为第 一序列号, 与 所述目标关键词不匹配的字符对应的序列号确定为第二序列号, 所述第一序列号与所述第 二序列号 不同; 基于所述第一序列号和所述第二序列号, 确定所述第二子序列。 9.根据权利要求7所述的方法, 所述将所述语义字符序列、 所述字符位置序列和所述语 句分块序列输入所述分类模型进行训练, 得到所述预 先训练的分类模型, 包括: 在每次迭代训练时, 生成随机概 率; 若所述历史反馈信 息中包含与所述第 一关键词匹配的目标字符, 且所述随机概率大于 预设概率阈值, 则对所述语义字符序列中与所述目标字符对应的字符进 行屏蔽处理或替换 处理, 得到处 理后的语义字符序列; 将所述处理后的语义字符序列、 所述字符位置序列和所述语句分块序列输入所述分类 模型进行迭代训练, 得到所述预 先训练的分类模型。 10.一种数据处 理装置, 包括: 信息获取模块, 用于获取目标用户对目标话术的反馈信息, 并获取所述目标话术对应 的目标关键词, 所述 目标话术用于在与所述 目标用户的交互过程中, 获取所述目标用户针 对目标业 务的反馈信息; 类型确定模块, 用于基于所述目标话术、 所述目标关键词、 所述反馈信息以及预先训练 的分类模型, 确定所述反馈信息对应的意图类型, 所述预先训练的分类模型用于根据所述 目标关键词、 所述目标话术、 所述反馈信息, 以及预先学习的句式知识, 确定所述反馈信息 对应的意图类型; 风险确定模块, 用于基于所述目标话术和所述反馈信息对应的意图类型, 确定所述目 标业务是否存在风险。 11.一种数据处 理装置, 包括: 第一获取模块, 用于获取历史话术, 所述历史话术的历史反馈信 息, 以及所述历史反馈 信息对应的意图类型; 第二获取模块, 用于获取与所述历史话 术对应的第一关键词; 模型训练模块, 用于基于所述历史话术、 所述第 一关键词、 所述历史反馈信息以及所述 历史反馈信息对应的意图类型, 对分类模型进行训练, 得到预先训练的分类模型, 所述预先 训练的分类模型用于基于目标话术、 所述 目标话术的反馈信息、 所述 目标话术对应的目标 关键词, 以及在训练过程中学习到的句式知识, 确定所述 目标话术的反馈信息对应的意图 类型。权 利 要 求 书 2/4 页 3 CN 114880472 A 3

.PDF文档 专利 数据处理方法、装置及设备

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、装置及设备 第 1 页 专利 数据处理方法、装置及设备 第 2 页 专利 数据处理方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:50:49上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。