专利数据处理方法、装置及设备 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210461027.5 (22)申请日 2022.04.28 (71)申请人支付宝（杭州）信息技术有限公司地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人王昊天　吴晓烽　王维强　 (74)专利代理机构北京国昊天诚知识产权代理有限公司 1 1315 专利代理师朱文杰 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/33(2019.01) G06F 40/30(2020.01) G06F 40/211(2020.01) G06K 9/62(2022.01) (54)发明名称数据处理方法、装置及设备 (57)摘要本说明书实施例提供了一种数据处理方法、装置及设备，所述方法包括：获取目标用户对目标话术的反馈信息，并获取所述目标话术对应的目标关键词，所述目标话术用于在与所述目标用户的交互过程中，获取所述目标用户针对目标业务的反馈信息；基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型，确定所述反馈信息对应的意图类型，所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息，以及预先学习的句式知识，确定所述反馈信息对应的意图类型；基于所述目标话术和所述反馈信息对应的意图类型，确定所述目标业务是否存在风险。权利要求书4页说明书18页附图7页 CN 114880472 A 2022.08.09 CN 114880472 A 1.一种数据处理方法，包括：获取目标用户对目标话术的反馈信息，并获取所述目标话术对应的目标关键词，所述目标话术用于在与所述目标用户的交互过程中，获取所述目标用户针对目标业务的反馈信息；基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型，确定所述反馈信息对应的意图类型，所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息，以及预先学习的句式知识，确定所述反馈信息对应的意图类型；基于所述目标话术和所述反馈信息对应的意图类型，确定所述目标业务是否存在风险。 2.根据权利要求1所述的方法，所述获取所述目标话术对应的目标关键词，包括：基于所述目标话术和预先训练的关键词提取模型，确定所述目标话术对应的第一关键词，所述关键词提取模型为基于历史话术对由机器学习算法构建的模型进行训练得到；对所述第一关键词进行筛选处理，得到所述目标话术对应的目标关键词。 3.根据权利要求1所述的方法，所述获取所述目标话术对应的目标关键词，包括：基于所述目标话术和预先训练的关键词提取模型，确定所述目标话术对应的第一关键词，所述关键词提取模型为基于历史话术对由机器学习算法构建的模型进行训练得到；基于预先构建的关键词对应关系，获取与所述第一关键词对应的所述目标关键词。 4.根据权利要求2或3所述的方法，所述目标话术有多个，所述基于所述目标话术和所述反馈信息对应的意图类型，确定所述目标业务是否存在风险，包括：基于所述目标话术对应的预设权重、所述反馈信息以及所述反馈信息对应的意图类型，确定每个所述目标话术对应的风险分值；基于所述每个所述目标话术对应的风险分值，确定所述目标业务是否存在风险。 5.一种数据处理方法，包括：获取历史话术，所述历史话术的历史反馈信息，以及所述历史反馈信息对应的意图类型；获取与所述历史话术对应的第一关键词；基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型，对分类模型进行训练，得到预先训练的分类模型，所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词，以及在训练过程中学习到的句式知识，确定所述目标话术的反馈信息对应的意图类型。 6.根据权利要求5所述的方法，所述基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型，对分类模型进行训练，得到预先训练的分类模型，包括：基于所述历史话术和所述历史反馈信息，确定语义字符序列；基于所述语义字符序列中每个字符的位置信息，确定字符位置序列；基于所述历史话术、所述历史反馈信息和所述第一关键词，确定语句分块序列；将所述语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行训练，得到所述预先训练的分类模型。 7.根据权利要求6所述的方法，所述基于所述历史话术、所述历史反馈信息和所述第一权　利　要　求　书 1/4 页 2 CN 114880472 A 2关键词，确定语句分块序列，包括：将所述历史话术确定为第一语块，并生成与所述第一语块对应的第一子序列；将所述历史反馈信息确定为第二语块，并基于所述第一关键词和所述第二语块，生成第二子序列；基于所述第一子序列和所述第二子序列，确定所述语句分块序列，所述第一子序列中的序列号与所述第二子序列中的序列号不同。 8.根据权利要求6所述的方法，所述基于所述第一关键词和所述第二语块，生成第二子序列，包括：将所述第二语块中与所述第一关键词匹配的字符对应的序列号确定为第一序列号，与所述目标关键词不匹配的字符对应的序列号确定为第二序列号，所述第一序列号与所述第二序列号不同；基于所述第一序列号和所述第二序列号，确定所述第二子序列。 9.根据权利要求7所述的方法，所述将所述语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行训练，得到所述预先训练的分类模型，包括：在每次迭代训练时，生成随机概率；若所述历史反馈信息中包含与所述第一关键词匹配的目标字符，且所述随机概率大于预设概率阈值，则对所述语义字符序列中与所述目标字符对应的字符进行屏蔽处理或替换处理，得到处理后的语义字符序列；将所述处理后的语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行迭代训练，得到所述预先训练的分类模型。 10.一种数据处理装置，包括：信息获取模块，用于获取目标用户对目标话术的反馈信息，并获取所述目标话术对应的目标关键词，所述目标话术用于在与所述目标用户的交互过程中，获取所述目标用户针对目标业务的反馈信息；类型确定模块，用于基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型，确定所述反馈信息对应的意图类型，所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息，以及预先学习的句式知识，确定所述反馈信息对应的意图类型；风险确定模块，用于基于所述目标话术和所述反馈信息对应的意图类型，确定所述目标业务是否存在风险。 11.一种数据处理装置，包括：第一获取模块，用于获取历史话术，所述历史话术的历史反馈信息，以及所述历史反馈信息对应的意图类型；第二获取模块，用于获取与所述历史话术对应的第一关键词；模型训练模块，用于基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型，对分类模型进行训练，得到预先训练的分类模型，所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词，以及在训练过程中学习到的句式知识，确定所述目标话术的反馈信息对应的意图类型。权　利　要　求　书 2/4 页 3 CN 114880472 A 3

专利 数据处理方法、装置及设备

专利数据处理方法、装置及设备