(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210354702.4 (22)申请日 2022.04.06 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田街道福安 社区益田路5 033号平安金融 中心23楼 (72)发明人 胡兴 郝碧波 李春宇  (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 刘敏 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) (54)发明名称 标签生成方法、 装置、 存储介质及计算机设 备 (57)摘要 本发明公开了一种标签生成方法、 装置、 存 储介质及计算机设备, 涉及信息技术领域, 主要 在于能够提高标签生成的精度。 其中方法包括: 获取待生成标签文本; 将所述待生成标签文本输 入至预设实体识别模型中进行实体识别, 得到所 述待生成标签文本中包含的实体; 将所述待生成 标签文本和所述实体输入至预设标签生成模型 中进行标签识别, 得到所述待生成标签文本中包 含的各个标签; 基于所述各个标签, 确定所述待 生成标签文本中的目标标签。 本发 明适用于对 标 签进行生成。 权利要求书2页 说明书10页 附图3页 CN 114722825 A 2022.07.08 CN 114722825 A 1.一种标签生成方法, 其特 征在于, 包括: 获取待生成标签文本; 将所述待生成标签文本输入至预设实体识别模型中进行实体识别, 得到所述待生成标 签文本中包 含的实体; 将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别, 得到所 述待生成标签文本中包 含的各个标签; 基于所述各个标签, 确定所述待生成标签文本中的目标 标签。 2.根据权利要求1所述的方法, 其特征在于, 所述将所述待生成标签文本输入至预设实 体识别模型中进行实体识别, 得到所述待生成标签文本中包 含的实体, 包括: 对所述待生成标签文本 中的文本语句进行分词处理, 得到所述文本语句对应的各个分 词; 将所述各个分词输入至所述预设实体识别模型中进行实体识别, 得到所述待生成标签 文本中包 含的实体。 3.根据权利要求2所述的方法, 其特征在于, 所述预设实体识别模型包括第 一递归神经 网络和第二递归神经网络, 所述将所述各个分词输入至所述预设实体识别模型中进行实体 识别, 得到所述待生成标签文本中包 含的实体, 包括: 将所述各个分词按照其在所述待生成标签文本中的顺序输入至第一递归神经网络中 进行特征提取, 得到所述各个分词共同对应的第一特 征向量; 将所述各个分词按照其在所述待生成标签文本中的顺序逆序输入至第二递归神经网 络中进行 特征提取, 得到所述各个分词共同对应的第二特 征向量; 将所述第一特征向量和所述第二特征向量进行合并, 得到合并后的特征向量, 并根据 所述合并后的特 征向量, 确定所述各个分词对应的实体 类别; 基于所述实体 类别, 确定所述待生成标签文本中包 含的实体。 4.根据权利要求1所述的方法, 其特征在于, 所述将所述待生成标签文本和所述实体输 入至预设标签生成模型中进行标签识别, 得到所述待生成标签文本中包含的各个标签, 包 括: 确定所述待生成标签文本 中各个第 一字符对应的第 一嵌入向量, 以及所述实体中各个 第二字符对应的第二嵌入向量; 将所述第一嵌入向量与所述第 二嵌入向量进行横向拼接, 得到各个字符对应的拼接后 的向量, 其中, 所述各个字符包括所述各个第一字符和所述各个第二字符; 将所述拼接后的向量输入至预设自然语言模型中进行语义信 息提取, 得到所述待生成 标签文本对应的语义信息向量; 将所述语义信 息向量输入至预设标签生成模型中进行标签识别, 得到所述待生成标签 文本中包 含的各个标签。 5.根据权利要求4所述的方法, 其特征在于, 所述预设自然语言模型为预设编码器, 所 述预设编 码器包括注 意力层和前馈神经网络层, 所述将所述拼接后的向量输入至预设自然 语言模型中进行语义信息提取, 得到所述待生成标签文本对应的语义信息向量, 包括: 将所述拼接后的向量输入至所述注意力层进行特征提取, 得到所述各个字符对应的第 三特征向量;权 利 要 求 书 1/2 页 2 CN 114722825 A 2将所述第三特征向量和所述拼接后的向量相加, 得到所述各个字符对应的第四特征向 量; 将所述第四特征向量输入至所述前馈神经网络层进行特征提取, 得到所述待生成标签 文本对应的语义信息向量。 6.根据权利要求1所述的方法, 其特征在于, 所述基于所述各个标签, 确定所述待生成 标签文本中的目标 标签, 包括: 在预设字符字典中查询所述各个标签对应的标签注释; 基于所述各个标签及其对应的标签注释, 确定所述待生成标签文本中的目标 标签。 7.根据权利要求6所述的方法, 其特征在于, 所述基于所述各个标签及其对应的标签注 释, 确定所述待生成标签文本中的目标 标签, 包括: 将所述各个标签及其对应的标签注释输入至预设分类模型中进行分类, 得到所述各个 标签对应的概 率值; 在所述概率值中确定大于预设阈值的目标概率值, 并将所述目标概率值对应的标签确 定为所述待生成标签文本中的目标 标签。 8.一种标签生成装置, 其特 征在于, 包括: 获取单元, 用于获取待生成标签文本; 实体识别单元, 用于将所述待生成标签文本输入至预设实体识别模型中进行实体识 别, 得到所述待生成标签文本中包 含的实体; 标签识别单元, 用于将所述待生成标签文本和所述实体输入至预设标签生成模型中进 行标签识别, 得到所述待生成标签文本中包 含的各个标签; 确定单元, 用于基于所述各个标签, 确定所述待生成标签文本中的目标 标签。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现权利要求1至7中任一项所述的方法的步骤。 10.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述计算机程序被处理器执行时实现权利要求1至7中任一项所述 的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114722825 A 3

.PDF文档 专利 标签生成方法、装置、存储介质及计算机设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 标签生成方法、装置、存储介质及计算机设备 第 1 页 专利 标签生成方法、装置、存储介质及计算机设备 第 2 页 专利 标签生成方法、装置、存储介质及计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。