(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210333859.9
(22)申请日 2022.03.30
(71)申请人 北京快确信息科技有限公司
地址 100000 北京市西城区阜成门外大街
31号4层411D
(72)发明人 甘伟超 林远平 邹鸿岳 周靖宇
(74)专利代理 机构 广东良马律师事务所 4 4395
专利代理师 李良
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 16/31(2019.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06Q 40/04(2012.01)
(54)发明名称
一种基于融合网络的交易对手识别方法、 装
置及电子设备
(57)摘要
本发明公开了一种基于融合网络的交易对
手识别方法、 装置及电子设备, 方法包括: 获取训
练样本, 将训练样本输入预训练模型编码层, 生
成文本编码; 获取训练样本, 根据训练样本构建
词汇和词语 之间的图关系; 根据图注 意力网络表
示层和图关系, 生成词汇对应的图表征向量; 将
图表征向量与文本编码进行融合, 生成文本表征
序列; 通过分类层对所述文本表征序列进行分
类, 生成交易对手识别模型; 获取待解析的文本
信息, 将所述待解析的文本输入交易对手识别模
型, 识别出交易对手类别。 本发明实施例解析识
别任务, 不需要用到复杂的规则逻辑, 实现了低
开发和低维护成本, 提高了覆盖率, 识别准确率
高。
权利要求书2页 说明书10页 附图6页
CN 114942992 A
2022.08.26
CN 114942992 A
1.一种基于融合网络的交易对手识别方法,其特征在于,所述融合网络包括预训练模
型编码层、 词汇关系连接图构建层、 图注意力网络表示层、 融合层和分类层, 所述方法包括:
获取训练样本, 将训练样本输入预训练模型编码层, 生成文本编码, 其中, 所述预训练
模型的编码层中 融合词汇适配 器;
获取训练样本, 将所述训练样本输入词汇关系连接 图构建层, 构建词汇和词语之间的
图关系;
根据图注意力网络表示层和所述图关系, 生成词汇对应的图表征向量;
将所述图表征向量与所述文本编码进行融合, 生成文本表征序列;
通过分类层对所述文本表征序列进行分类, 完成融合网络的训练, 生成交易对手识别
模型;
获取待解析的文本信息, 将所述待解析的文本输入交易对手识别模型, 根据交易对手
识别模型的输出, 得到交易对手 类别, 完成交易对手识别。
2.根据权利要求1所述的方法, 其特征在于, 所述获取训练样本, 将训练样本输入预训
练模型编码层, 生成文本编码前, 还 包括:
预先构建词汇适配 器,
将所述词汇适配 器加入预训练模型中的任意 一层或多层。
3.根据权利要求2所述的方法, 其特 征在于, 所述预 先构建词汇适配 器, 包括:
预先获取文本序列中字符表征向量;
获取字符相关的词汇的向量 集合;
根据双线性注意力机制, 将字符表征向量、 所述向量集合进行融合, 生成词汇表征向
量;
将字符表征向量与词汇 表征向量进行相加, 生成 综合表征向量;
根据综合表征向量, 输出文本序列每 个位置的表征向量。
4.根据权利要求3所述的方法, 其特征在于, 所述获取训练样本, 将所述训练样本输入
词汇关系连接图构建层, 构建词汇和词语之间的图关系, 包括:
获取训练样本, 将所述训练样本 输入词汇关系连接图构建层;
通过连接关系构建词汇和词语之间的转移图、 包 含图和栅格图。
5.根据权利要求4所述的方法, 其特征在于, 所述根据图注意力网络表示层和所述图关
系, 生成词汇对应的图表征向量, 包括:
根据转移图、 包含图和栅格图获取对应的第一连接矩阵、 第二连接矩阵和第三连接矩
阵;
将文本序列中每个位置的表征向量、 文本序列中的词汇向量及第一连接矩阵、 第二连
接矩阵和第三连接矩阵输入所述图注意力网络表示层;
获取图注意力网络表示层的输出, 生成词汇对应的图表征向量。
6.根据权利要求5所述的方法, 其特征在于, 所述将所述图表征向量与 所述文本编码进
行融合, 生成文本表征序列, 包括:
将所述图表征向量与所述文本编码采用投影加权的方式进行融合, 生成文本表征序
列。
7.根据权利要求6所述的方法, 其特征在于, 所述通过分类层对所述文本表征序列进行权 利 要 求 书 1/2 页
2
CN 114942992 A
2分类, 完成融合网络的训练, 生成交易对手识别模型, 包括:
将所述文本表征序列输入softmax分类函数,
获取softmax分类函数输出的每个位置的分类, 完成融合网络的训练, 生成交易对手识
别模型。
8.一种基于融合网络的交易对手识别装置, 其特征在于, 所述融合网络包括预训练模
型编码层、 词汇关系连接图构建层、 图注意力网络表示层、 融合层和分类层, 所述装置包括:
编码模块, 用于获取训练样本, 将训练样本输入预训练模型编码层, 生成文本编码, 其
中, 所述预训练模型的编码层中 融合词汇适配 器;
图关系构建模块, 用于获取训练样本, 将所述训练样本输入词汇关系连接图构建层, 构
建词汇和词语之间的图关系;
图表征向量生成模块, 用于根据图注意力网络表示层和所述图关系, 生成词汇对应的
图表征向量;
融合模块, 用于将所述图表征向量与所述文本编码进行融合, 生成文本表征序列;
分类模块, 用于通过分类层对所述文本表征序列进行分类, 完成融合网络的训练, 生成
交易对手识别模型;
识别模块, 用于获取待解析的文本信 息, 将所述待解析的文本输入交易对手识别模型,
根据交易对手识别模型的输出, 得到交易对手 类别, 完成交易对手识别。
9.一种电子设备, 其特 征在于, 所述电子设备包括至少一个处 理器; 以及,
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处
理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7任一项所述的基于融合网络的
交易对手识别方法。
10.一种非易失性计算机可读存储介质, 其特征在于, 所述非易失性计算机可读存储介
质存储有计算机可执行指令, 该计算机可执行指令被一个或多个处理器执行时, 可使得所
述一个或多个处 理器执行权利要求1 ‑7任一项所述的基于融合网络的交易对手识别方法。权 利 要 求 书 2/2 页
3
CN 114942992 A
3
专利 一种基于融合网络的交易对手识别方法、装置及电子设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:45:52上传分享