(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210410510.0 (22)申请日 2022.04.19 (71)申请人 武汉大学 地址 430072 湖北省武汉市武昌区珞珈山 (72)发明人 彭智勇 周哲文  (74)专利代理 机构 武汉智权专利代理事务所 (特殊普通 合伙) 42225 专利代理师 罗成 (51)Int.Cl. G06F 40/30(2020.01) G06K 9/62(2022.01) G06F 16/2458(2019.01) G06Q 50/18(2012.01) G06N 3/00(2006.01) G06N 3/08(2006.01) (54)发明名称 专利新颖度评估方法、 装置、 设备及可读存 储介质 (57)摘要 本发明提供一种专利新颖度评估方法、 装 置、 设备及可读存储介质, 专利新颖度评估方法 包括: 基于待评估专利的类别确定对应的果蝇计 数布隆过滤器; 将所述待评估专利的文本输入到 语言模型中, 得到第一专利向量; 基于果蝇神经 网络算法对 所述第一专利向量进行重构, 得到第 二专利向量; 基于所述第二专利向量与所述果蝇 计数布隆过滤器, 计算得到所述待评估专利的新 颖度分数。 本发 明计算专利新 颖度分数的算法执 行速度较快, 时间效率高, 且采用果蝇计数布隆 过滤器结构 存储专利历史数据信息, 所占的内存 空间也较小, 空间效率高, 在此基础上所计算出 的专利新颖度分数 结果也较为准确。 权利要求书2页 说明书10页 附图3页 CN 114676703 A 2022.06.28 CN 114676703 A 1.一种专利新颖度评估方法, 其特 征在于, 所述专利新颖度评估方法包括: 基于待评估专利的类别确定对应的果蝇计数布隆过 滤器; 将所述待评估专利的文本 输入到语言模型中, 得到第一专利向量; 基于果蝇神经网络算法对所述第一专利向量进行重构, 得到第二专利向量; 基于所述第 二专利向量与 所述果蝇计数布隆过滤器, 计算得到所述待评估专利的新颖 度分数。 2.如权利要求1所述的专利新颖度评估方法, 其特征在于, 所述基于待评估专利的类别 确定对应的果蝇计数布隆过 滤器的步骤 包括: 基于目标专利文本构成目标数据集, 其中, 目标专利文本取自专利数据库中的专利历 史数据, 且目标专利文本的类别与待评估专利的类别一 致; 将所述目标数据集中的目标专利文本进行预处理后, 输入到语言模型中, 得到对应的 目标专利向量组, 所述目标专利向量组中各个目标专利向量维度数相同; 基于果蝇神经网络算法对所述目标专利向量组中的各个目标专利向量进行重构, 得到 第一目标专利向量组; 将所述第一目标专利向量组中各个第一目标专利向量的各个维度的数值叠加至果蝇 计数布隆过滤器结构的数组对应位置上, 得到待评估专利的类别对应的果蝇计数布隆过滤 器, 其中, 所述果蝇计数布隆过滤器结构的数组长度与第一 目标专利向量组中各个第一 目 标专利向量的维度数相同。 3.如权利要求1所述的专利新颖度评估方法, 其特征在于, 所述基于果蝇神经网络算法 对所述第一专利向量进行重构, 得到第二专利向量的步骤 包括: 对所述第一专利向量的每 个维度进行归一 化处理, 得到第三专利向量; 获取目标矩阵, 基于所述目标矩阵对所述第三专利向量进行维度扩展, 得到第 四专利 向量, 所述第四专利向量的维度数 大于第三专利向量的维度数; 对所述第四专利向量进行 赢者通吃策略的向量 二值化处理, 得到第二专利向量。 4.如权利要求3所述的专利新颖度评估方法, 其特征在于, 所述获取目标矩阵的步骤之 前包括: 生成目标矩阵, 所述 生成目标矩阵的步骤 包括: 生成预设大小的随机矩阵, 其中, 所述随机矩阵的列数基于目标专利文本的数据量确 定, 所述随机矩阵的行 数为目标专利向量组中各个目标专利向量的维度数; 将所述随机矩阵的所有位置的数值初始化置为 零; 对所述初始化后的随机矩阵的每一行进行随机采样, 并将采样选取的预设个数的位置 置为一, 得到目标矩阵。 5.如权利要求3所述的专利新颖度评估方法, 其特征在于, 所述对所述第 一专利向量的 每个维度进行归一 化处理, 得到第三专利向量的步骤 包括: 将第一专利向量的每个维度的数值代入到归一化公式中, 得到第三专利向量, 所述归 一化公式为: 其中, Vi'为第三专利向量, Vi为第一专利向量中各个维度的数值, Vmin为第一专利向量权 利 要 求 书 1/2 页 2 CN 114676703 A 2中各个维度中的数值最小值, avg(V)为第一专利向量中所有维度的数值均值, mean为预设 值。 6.如权利要求1所述的专利新颖度评估方法, 其特征在于, 所述基于所述第 二专利向量 与所述果蝇计数布隆过 滤器, 计算得到所述待评估专利的新颖度分数的步骤 包括: 将所述第二专利向量与所述果蝇计数布隆过滤器结构的数组代入到第 一公式中, 基于 第一公式计算得到待评估专利的新颖度分数, 所述第一公式为: 其中, s为待评估专利的新颖度分数, M[i]为果蝇计数布隆过滤器结构的数组第i个元 素的数值, ξ为缩放因子, Vi′为第二特征向量的第i个维度的数值, ||V ′||0为第二特征向量 中所有数值非零的维度个数。 7.一种专利新颖度评估 装置, 其特 征在于, 所述专利新颖度评估 装置包括: 确定模块, 用于基于待评估专利的类别确定对应的果蝇计数布隆过 滤器; 向量化表示模块, 用于将所述待评估专利的文本输入到语言模型中, 得到第一专利向 量; 重构模块, 用于基于果蝇神经网络算法对所述第一专利向量进行重构, 得到第二专利 向量; 计算模块, 用于基于所述第二专利向量与所述果蝇计数布隆过滤器, 计算得到所述待 评估专利的新颖度分数。 8.如权利要求7 所述的专利新颖度评估 装置, 其特 征在于, 所述确定模块, 具体用于: 基于目标专利文本构成目标数据集, 其中, 目标专利文本取自专利数据库中的专利历 史数据, 且目标专利文本的类别与待评估专利的类别一 致; 将所述目标数据集中的目标专利文本进行预处理后, 输入到语言模型中, 得到对应的 目标专利向量组, 所述目标专利向量组中各个目标专利向量维度相同; 基于果蝇神经网络算法对所述目标专利向量组中的各个目标专利向量进行重构, 得到 第一目标专利向量组; 将所述第一目标专利向量组中各个第一目标专利向量的各个维度的数值叠加至果蝇 计数布隆过滤器结构的数组对应位置上, 得到待评估专利的类别对应的果蝇计数布隆过滤 器, 其中, 所述果蝇计数布隆过滤器结构的数组长度与第一 目标专利向量组中各个第一 目 标专利向量的维度数相同。 9.一种专利新颖度评估设备, 其特征在于, 所述专利新颖度评估设备包括处理器、 存储 器、 以及存储在所述存储器上并可被所述处理器执行 的专利新颖度评估程序, 其中所述专 利新颖度评估程序被所述处理器执行时, 实现如权利要求 1至6中任一项 所述的专利新 颖度 评估方法的步骤。 10.一种可读存储介质, 其特征在于, 所述可读存储介质上存储有专利新颖度评估程 序, 其中所述专利新颖度评估程序被处理器执行时, 实现如权利要求1至6中任一项所述的 专利新颖度评估方法的步骤。权 利 要 求 书 2/2 页 3 CN 114676703 A 3

.PDF文档 专利 专利新颖度评估方法、装置、设备及可读存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 专利新颖度评估方法、装置、设备及可读存储介质 第 1 页 专利 专利新颖度评估方法、装置、设备及可读存储介质 第 2 页 专利 专利新颖度评估方法、装置、设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:47:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。