国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210354702.4 (22)申请日 2022.04.06 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田街道福安 社区益田路5 033号平安金融 中心23楼 (72)发明人 胡兴 郝碧波 李春宇 (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 刘敏 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) (54)发明名称 标签生成方法、 装置、 存储介质及计算机设 备 (57)摘要 本发明公开了一种标签生成方法、 装置、 存 储介质及计算机设备, 涉及信息技术领域, 主要 在于能够提高标签生成的精度。 其中方法包括: 获取待生成标签文本; 将所述待生成标签文本输 入至预设实体识别模型中进行实体识别, 得到所 述待生成标签文本中包含的实体; 将所述待生成 标签文本和所述实体输入至预设标签生成模型 中进行标签识别, 得到所述待生成标签文本中包 含的各个标签; 基于所述各个标签, 确定所述待 生成标签文本中的目标标签。 本发 明适用于对 标 签进行生成。 权利要求书2页 说明书10页 附图3页 CN 114722825 A 2022.07.08 CN 114722825 A 1.一种标签生成方法, 其特 征在于, 包括: 获取待生成标签文本; 将所述待生成标签文本输入至预设实体识别模型中进行实体识别, 得到所述待生成标 签文本中包 含的实体; 将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别, 得到所 述待生成标签文本中包 含的各个标签; 基于所述各个标签, 确定所述待生成标签文本中的目标 标签。 2.根据权利要求1所述的方法, 其特征在于, 所述将所述待生成标签文本输入至预设实 体识别模型中进行实体识别, 得到所述待生成标签文本中包 含的实体, 包括: 对所述待生成标签文本 中的文本语句进行分词处理, 得到所述文本语句对应的各个分 词; 将所述各个分词输入至所述预设实体识别模型中进行实体识别, 得到所述待生成标签 文本中包 含的实体。 3.根据权利要求2所述的方法, 其特征在于, 所述预设实体识别模型包括第 一递归神经 网络和第二递归神经网络, 所述将所述各个分词输入至所述预设实体识别模型中进行实体 识别, 得到所述待生成标签文本中包 含的实体, 包括: 将所述各个分词按照其在所述待生成标签文本中的顺序输入至第一递归神经网络中 进行特征提取, 得到所述各个分词共同对应的第一特 征向量; 将所述各个分词按照其在所述待生成标签文本中的顺序逆序输入至第二递归神经网 络中进行 特征提取, 得到所述各个分词共同对应的第二特 征向量; 将所述第一特征向量和所述第二特征向量进行合并, 得到合并后的特征向量, 并根据 所述合并后的特 征向量, 确定所述各个分词对应的实体 类别; 基于所述实体 类别, 确定所述待生成标签文本中包 含的实体。 4.根据权利要求1所述的方法, 其特征在于, 所述将所述待生成标签文本和所述实体输 入至预设标签生成模型中进行标签识别, 得到所述待生成标签文本中包含的各个标签, 包 括: 确定所述待生成标签文本 中各个第 一字符对应的第 一嵌入向量, 以及所述实体中各个 第二字符对应的第二嵌入向量; 将所述第一嵌入向量与所述第 二嵌入向量进行横向拼接, 得到各个字符对应的拼接后 的向量, 其中, 所述各个字符包括所述各个第一字符和所述各个第二字符; 将所述拼接后的向量输入至预设自然语言模型中进行语义信 息提取, 得到所述待生成 标签文本对应的语义信息向量; 将所述语义信 息向量输入至预设标签生成模型中进行标签识别, 得到所述待生成标签 文本中包 含的各个标签。 5.根据权利要求4所述的方法, 其特征在于, 所述预设自然语言模型为预设编码器, 所 述预设编 码器包括注 意力层和前馈神经网络层, 所述将所述拼接后的向量输入至预设自然 语言模型中进行语义信息提取, 得到所述待生成标签文本对应的语义信息向量, 包括: 将所述拼接后的向量输入至所述注意力层进行特征提取, 得到所述各个字符对应的第 三特征向量;权 利 要 求 书 1/2 页 2 CN 114722825 A 2将所述第三特征向量和所述拼接后的向量相加, 得到所述各个字符对应的第四特征向 量; 将所述第四特征向量输入至所述前馈神经网络层进行特征提取, 得到所述待生成标签 文本对应的语义信息向量。 6.根据权利要求1所述的方法, 其特征在于, 所述基于所述各个标签, 确定所述待生成 标签文本中的目标 标签, 包括: 在预设字符字典中查询所述各个标签对应的标签注释; 基于所述各个标签及其对应的标签注释, 确定所述待生成标签文本中的目标 标签。 7.根据权利要求6所述的方法, 其特征在于, 所述基于所述各个标签及其对应的标签注 释, 确定所述待生成标签文本中的目标 标签, 包括: 将所述各个标签及其对应的标签注释输入至预设分类模型中进行分类, 得到所述各个 标签对应的概 率值; 在所述概率值中确定大于预设阈值的目标概率值, 并将所述目标概率值对应的标签确 定为所述待生成标签文本中的目标 标签。 8.一种标签生成装置, 其特 征在于, 包括: 获取单元, 用于获取待生成标签文本; 实体识别单元, 用于将所述待生成标签文本输入至预设实体识别模型中进行实体识 别, 得到所述待生成标签文本中包 含的实体; 标签识别单元, 用于将所述待生成标签文本和所述实体输入至预设标签生成模型中进 行标签识别, 得到所述待生成标签文本中包 含的各个标签; 确定单元, 用于基于所述各个标签, 确定所述待生成标签文本中的目标 标签。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现权利要求1至7中任一项所述的方法的步骤。 10.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述计算机程序被处理器执行时实现权利要求1至7中任一项所述 的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114722825 A 3
专利 标签生成方法、装置、存储介质及计算机设备
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:51:28
上传分享
举报
下载
原文档
(579.3 KB)
分享
友情链接
华为干部赋能手册.pdf
GB-T 14617.1-2012 陆地移动业务和固定业务传播特性 第1部分:陆地移动业务传播特性.pdf
GB-T 29409-2012 木材储存保管技术规范.pdf
GB-T 41852-2022 半导体器件 微机电器件 MEMS结构黏结强度的弯曲和剪切试验方法.pdf
GB-T 39116-2020 智能制造能力成熟度模型.pdf
DB41-T 1666-2018 非金属矿绿色矿山建设规范 河南省.pdf
CCSP认证考试大纲 中文版 2022.pdf
GB-T 13448-2019 彩色涂层钢板及钢带试验方法.pdf
T-GDNAS 021—2022 急性冠脉综合征介入治疗术后心脏康复护理.pdf
GB-T 42467.5-2023 中医临床名词术语 第5部分:骨伤科学.pdf
GB-T 28750-2012 节能量测量和验证技术通则.pdf
生成式人工智能(AIGC).pdf
GM-T 0122-2022 区块链密码检测规范.pdf
GM-T 0106-2021 银行卡终端产品密码应用技术要求.pdf
GB-T 29193-2023 国际贸易术语解释通则缩写代码.pdf
GB-T 43156-2023 地理信息 矢量数据模型与存储规范.pdf
GB-T 24262-2009 石油物探仪器环境试验及可靠性要求.pdf
GB-T 411-2017 棉印染布.pdf
山东省数字政府建设实施方案-2.3.pdf
ISO SAE 21434 Road vehicles— Cybersecurity engineering.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(579.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。