(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210220756.1 (22)申请日 2022.03.08 (66)本国优先权数据 202210194901.3 202 2.03.01 CN (71)申请人 杭州量知数据科技有限公司 地址 310000 浙江省杭州市萧 山区经济技 术开发区明星路371号1幢6 01室 (72)发明人 杨彦飞 宗畅 王占飞  (74)专利代理 机构 杭州橙知果专利代理事务所 (特殊普通 合伙) 33261 专利代理师 李品 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/35(2019.01) G06F 40/194(2020.01)G06F 40/205(2020.01) G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 基于全球专利的产业领域关键短板技术的 自动挖掘系统 (57)摘要 本申请公开了基于全球专利的产业领域关 键短板技术的自动挖掘系统, 数据获取模块, 用 于获取标准输入数据; 数据库构建模块, 用于构 建目标产业领域的目标专利数据库; 领域优势国 家分析模块, 用于获得领域优势国家清单; 领域 优势国家的优势机构分析模块, 用于获得优势专 利权人名单; 优势机构专利技术解析模块, 用于 获得关键技术概念短语; 短板技术探查模块, 用 于根据关键技术概念短语所对应的国内外专利 数量对比结果获得关键短板技术清单。 本申请的 有益之处在于提供了一种可以自动获得关键短 板技术清单的基于全球专利的产业领域关键短 板技术的自动挖掘系统。 权利要求书2页 说明书10页 附图11页 CN 114791947 A 2022.07.26 CN 114791947 A 1.基于全球专利的产业领域关键短板技 术的自动挖掘系统, 包括: 数据获取模块, 用于获取 标准输入数据; 数据库构建模块, 用于构建目标产业领域的目标专利数据库; 领域优势国家分析模块, 用于分析 所述标准输入数据以获得 领域优势国家 清单; 领域优势国家的优势机构分析模块, 用于根据所述领域优势国家清单和所述标准输入 数据解析获得优势 专利权人名单; 优势机构专利技术解析模块, 用于解析获得所述优势专利权人在所述目标专利数据库 中的有效专利数据以获得关键技 术概念短语; 短板技术探查模块, 用于根据关键技术概念短语所对应的国内外专利数量对比结果获 得关键短板技 术清单。 2.根据权利要求1所述的基于全球专利的产业领域关键短板技术的自动挖掘系统, 其 中, 所述数据库构建模块的具体构建方法包括以下步骤: 匹配获得目标产业领域对应的IPC分类号; 根据所述 IPC分类号从全球专利数据库中采集有效专利数据; 选取所述有效数据中被引用量 为TOP K的有效专利数据构成目标专利数据库。 3.根据权利要求2所述的基于全球专利的产业领域关键短板技术的自动挖掘系统, 其 中, 所述选取所述有效数据中被引用量为TOP  K的有效专利数据构成目标专利数据库, 包 括: 将同族专利的被引次数进行累加计算以获得同族代表专利的同族被引次数, 其中, 同 族代表专利为优先权号所对应的专利; 根据同族专利的总数计算获得同族专利的篇均被引次数; 根据所述有效专利数据中的申请日和被引次数计算获得 所有专利的年均被引次数; 将同族被引次数的T OP K1项有效专利数据、 篇均被引次数的TOP  K2项有效专利数据、 年 均被引次数的TOP  K3项有效专利数据输入数据库进行存储, 剔除重复的有效专利数据, 构 成所述目标专利数据库, 其中K=K1+K2+K3。 4.根据权利要求1所述的基于全球专利的产业领域关键短板技术的自动挖掘系统, 其 中, 所述领域优势国家分析模块对所述标准输入数据的分析步骤 包括: 将所述目标专利数据库中的有效专利数据按照有效专利数据中的国家字段进行分类; 对每个国家字段对应的有效专利数据中的被引用量进行统计以获得国家专利被引用 总量、 国家 专利年均被引用总量、 国家 专利篇均被引用量; 取国家专利被引用总量为TOP  X1的国家字段、 国家专利年均被引用总量为TOP  X2的国 家字段、 国家 专利篇均被引用量 为TOP X3的国家字段构成领域优势国家 清单。 5.根据权利要求4所述的基于全球专利的产业领域关键短板技术的自动挖掘系统, 其 中, 所述领域优势国家的优势机构分析模块的具体分析步骤 包括: 召回所述目标专利数据库中所述领域优势国家清单中每个国家字段所对应的有效专 利数据; 将所述每个国家字段所对应的有效专利数据按照有效专利数据中的专利权人字段进 行分类; 对每个专利权人字段对应的有效专利数据中的被引用量进行统计以获得专利权人专权 利 要 求 书 1/2 页 2 CN 114791947 A 2利被引用总量、 专利权人专利年均被引用总量、 专利权人专利篇均被引用量; 取专利权人专利被引用总 量为TOP Z1的专利权人字段、 专利权人专利年均被引用总量 为TOP Z2的专利权人字段、 专利权人专利篇均被引用量为TOP  Z3的专利权人字段构 成优势 专利权人名单。 6.根据权利要求1所述的基于全球专利的产业领域关键短板技术的自动挖掘系统, 其 中, 所述优势机构专利技术解析模块解析所述优势专利权人在所述目标专利数据库中的有 效专利数据以获得关键技 术概念短语的步骤 包括: 召回所述优势专利权人在所述目标专利数据库中的有效专利数据以获得待解析专利 文献; 抽取出所述待解析专利文献中的候选短语; 计算所述 候选短语的语义重要度以获得重要度评分; 选取重要度评分为TOP  A的候选短语作为关键技 术概念短语。 7.根据权利要求6所述的基于全球专利的产业领域关键短板技术的自动挖掘系统, 其 中, 所述优势机构专利技术解析模块解析所述优势专利权人在所述目标专利数据库中的有 效专利数据以获得关键技 术概念短语的步骤 还包括: 召回所述目标专利数据库中对应所述关键技术概念短语的有效专利数据以获得待深 挖数据集; 抽取出所述待深挖数据集中的专利文献的深挖候选短语; 计算所述深挖候选短语的语义重要度以获得深挖重要度评分; 选取深挖重要度评分为TOP  B的深挖候选短语作为深挖关键技 术概念短语。 8.根据权利要求1所述的基于全球专利的产业领域关键短板技术的自动挖掘系统, 其 中, 所述短板技术探查模块根据关键技术概念短语所对应的国内外专利数量对比结果获得 关键短板技 术清单的步骤 包括: 翻译所述关键技 术概念短语以获得中文技 术短语; 根据所述中文技 术短语构建中文检索式; 根据所述中文检索式召回所述目标专利数据库中的有效专利数据以获得国内专利数 据; 比对所述关键技术概念短语所对应的国外专利数据与所述国内专利数据以获得TOP  T 关键短板技 术清单。权 利 要 求 书 2/2 页 3 CN 114791947 A 3

.PDF文档 专利 基于全球专利的产业领域关键短板技术的自动挖掘系统

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于全球专利的产业领域关键短板技术的自动挖掘系统 第 1 页 专利 基于全球专利的产业领域关键短板技术的自动挖掘系统 第 2 页 专利 基于全球专利的产业领域关键短板技术的自动挖掘系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:48:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。