国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210223134.4 (22)申请日 2022.03.07 (71)申请人 华南理工大 学 地址 510641 广东省广州市天河区五山路 381号 (72)发明人 唐国志 薛洋 金连文 (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 郑宏谋 (51)Int.Cl. G06V 30/40(2022.01) G06V 30/418(2022.01) G06N 3/08(2006.01) G06K 9/62(2022.01) G06F 40/30(2020.01)G06V 10/764(2022.01) G06V 30/42(2022.01) (54)发明名称 基于布局关联性的视觉富文档信息抽取方 法、 系统及 介质 (57)摘要 本发明公开了一种基于布局关联性的视觉 富文档信息抽取方法、 系统及介质, 其中方法包 括: 获取视觉富文档图像, 并对视觉富文档图像 进行标注, 获得数据集; 构建针对布局关联性的 文档信息抽取模 型, 采用数据集对文档信息抽取 模型进行训练; 获取视觉富文档图片, 将视觉富 文档图片输入训练后的文档信息抽取模型, 获得 信息抽取结果; 其中, 布局关联性指 的是静态字 段和动态字段之间的位置关系, 静态字段为同一 模板中文字固定的字段, 动态字段为同一模板中 根据实际内容变化的字段。 本发 明提供了一种利 用文档布局关联性的视觉富文档信息抽取的方 案, 这种方案可在在小样本数据下即可实现高精 度的视觉富文档信息抽取任务, 可广泛应用于视 觉信息抽取 领域。 权利要求书2页 说明书8页 附图2页 CN 114782965 A 2022.07.22 CN 114782965 A 1.一种基于布局关联性的视 觉富文档 信息抽取 方法, 其特 征在于, 包括以下步骤: 获取视觉富文档图像, 并对视 觉富文档图像进行 标注, 获得 数据集; 构建针对布局关联性的文档信息抽取模型, 采用数据集对文档信息抽取模型进行训 练; 获取视觉富文档图片, 将视觉富文档图片输入训练后的文档信息抽取模型, 获得信息 抽取结果; 其中, 布局关联性指的是静态字段和动态字段之间的位置关系, 静态字段为同一模板 中文字固定的字段, 动态字段为同一模板中根据实际内容变化的字段。 2.根据权利要求1所述的一种基于布局关联性的视觉富文档信息抽取方法, 其特征在 于, 所述文档 信息抽取模型的训练过程, 包括: 将字段中不同的语义表示为一个1024维的嵌入向量, 将字段的位置特征量化为数字, 将处理好的语义和位置特 征输入作为输入特 征; 对预设模型中每个类别计算这个类别里面所有输入特征的均值, 作为每个类别的类别 中心; 通过衡量样本与类别中心的距离来完成分类。 3.根据权利要求1所述的一种基于布局关联性的视觉富文档信息抽取方法, 其特征在 于, 所述文档 信息抽取模型对输入的视 觉富文档图片进行如下处 理: 获取视觉富文档图片中每 个独立的字段, 作为图中的节点; 获取节点之间的边连接关系; 其中, 边连接关系为{|Xi‑j|, |Yi‑j|, Wi/Wj, Hi/Hj}, |Xi‑j|表 示两个字段节点在 横坐标上的距离, | Yi‑j|表示两个字段节点在纵坐 标上的距离, Wi/Wj表示 两个字段节点对 应的两个矩形框的宽的比值, Hi/Hj表示两个字段节点对 应的两个矩形框的 高的比值; 获取所有的静态字段和动态字段之间连接关系, 根据连接关系获取静态字段和动态字 段之间的匹配关系。 4.根据权利要求3所述的一种基于布局关联性的视觉富文档信息抽取方法, 其特征在 于, 所述匹配关系通过以下 方式获得: 获取预设字段和所有字段之间的匹配概 率值; 选取匹配概 率值大于阈值的匹配关系表示两个字段之间是一种匹配关系。 5.根据权利要求3所述的一种基于布局关联性的视觉富文档信息抽取方法, 其特征在 于, 所述匹配关系包括 一对一的匹配关系 、 一对多的匹配关系以及多对一的匹配关系; 当出现一对多的匹配关系以及多对一的匹配关系时, 根据概率值获取最优的概率匹 配。 6.根据权利要求4所述的一种基于布局关联性的视觉富文档信息抽取方法, 其特征在 于, 所述根据概率值获取最优的概 率匹配, 包括:权 利 要 求 书 1/2 页 2 CN 114782965 A 2获取每个动态字段的关于分类结果的概 率值R; 将每个动态字段的关于分类结果的概 率值R按从大到小顺序排序; 遍历概率值R的集合中的元 素i; 将概率值排名前三的元 素i添加到集 合Q中; 遍历概率值R的集合中除了元 素i的其他元素j; 如果当前概率值的累加概率和, 大于集合中已有的概率累加和, 则将当前的概率值添 加进集合Q中, 同时剔除掉旧的值; 更新集合Q。 7.根据权利要求1所述的一种基于布局关联性的视觉富文档信息抽取方法, 其特征在 于, 所述视觉富文档图像包括车票图像、 发票图像、 证书图像以及证件图像。 8.一种基于布局关联性的视 觉富文档 信息抽取系统, 其特 征在于, 包括: 数据采集模块, 用于获取视觉富文档图像, 并对视觉富文档 图像进行标注, 获得数据 集; 模型训练模块, 用于构建针对布局关联性的文档信息抽取模型, 采用数据集对文档信 息抽取模型进行训练; 信息抽取模块, 用于获取视觉富文档图片, 将视觉富文档图片输入训练后的文档信息 抽取模型, 获得信息抽取 结果; 其中, 布局关联性指的是静态字段和动态字段之间的位置关系, 静态字段为同一模板 中文字固定的字段, 动态字段为同一模板中根据实际内容变化的字段。 9.一种基于布局关联性的视 觉富文档 信息抽取系统, 其特 征在于, 包括: 至少一个处 理器; 至少一个存 储器, 用于存 储至少一个程序; 当所述至少一个程序被所述至少一个处理器执行, 使得所述至少一个处理器实现权利 要求1‑7任一项所述方法。 10.一种计算机可读存储介质, 其中存储有处理器可执行的程序, 其特征在于, 所述处 理器可执行的程序在由处 理器执行时用于执 行如权利要求1 ‑7任一项所述方法。权 利 要 求 书 2/2 页 3 CN 114782965 A 3
专利 基于布局关联性的视觉富文档信息抽取方法、系统及介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:49:22
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GB-T 30275-2013 信息安全技术 鉴别与授权 认证中间件框架与接口规范.pdf
GB 29837-2013 火灾探测报警产品的维修保养与报废.pdf
DB31-T 1109-2022 乡村振兴示范村建设指南 上海市.pdf
GB-T 14695-2021 臂式斗轮堆取料机 型式和基本参数.pdf
GB-T 41944-2022 丁基橡胶阻尼片.pdf
OWASP 软件保障成熟度模型 SAMM 2.0中文版.pdf
NB-T 47005-2021 板式蒸发装置.pdf
DB42-T 953-2014 “鄂引3号”狗牙根栽培技术规程 湖北省.pdf
GB-T 36710-2018 公共机构办公区节能运行管理规范.pdf
GB-T 13910-2008 石英砂 粉 厂、滑石粉厂防尘技术规程.pdf
T-CERACU 205—2022 数字素养与技能认证.pdf
GB-T 9711-2017 石油天然气工业 管线输送系统用钢管.pdf
DB52-T1239.5-2019 政府数据 核心元数据 第5部分:宏观经济数据 贵州省.pdf
GB-T 35010.3-2018 半导体芯片产品 第3部分:操作、包装和贮存指南.pdf
T-ACEF 107—2023 公民绿色低碳行为温室气体减排量化指南 行:地铁出行.pdf
IPC-A-610 电子组件的可接受性.pdf
GB-T 13171.1-2022 洗衣粉 第1部分:技术要求.pdf
GB-T 30503-2014 船用制氮装置通用技术条件.pdf
GA 1800.4-2021 电力系统治安反恐防范要求 第4部分:风力发电企业.pdf
人工智能大模型体验报告3.0.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。