(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210511902.6
(22)申请日 2022.05.11
(71)申请人 国家电网有限公司
地址 100031 北京市西城区西长安 街86号
申请人 武汉电力职业 技术学院
(72)发明人 杨晨 陈聪 吴烜 汪洋 唐金锐
(74)专利代理 机构 湖北武汉 永嘉专利代理有限
公司 42102
专利代理师 崔友明
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/335(2019.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)G06Q 10/00(2012.01)
G06Q 50/06(2012.01)
(54)发明名称
语义分析知识库构建方法和配电自动化终
端运维知识库
(57)摘要
本发明提供了语义分析知识库构建方法和
配电自动化终端运维知 识库, 利用现场巡视人员
对配电自动化终端运行状态的自然语 言描述, 自
动抽取关键信息, 形成配电自动化终端描述文
本, 通过分词技术与深度学习算法, 形成配电自
动化终端运维知识库, 便于 现场人员提高其自身
在开展配电自动化终端维护工作。 通过在配电自
动化终端运维工作中引入自然语言语义分析技
术, 可实现配电自动化终端户外恶劣环境下巡视
信息的快速分析处理; 通过形成的的配电自动化
终端运维知识库, 可根据巡视人员给出的配电自
动化终端状态描述自然语言自动推荐相应的配
电自动化终端维护工作。
权利要求书2页 说明书9页 附图2页
CN 114880432 A
2022.08.09
CN 114880432 A
1.语义分析知识库构建方法, 其特 征在于: 包括以下步骤:
S1: 获取关于配电自动化终端的运行巡 视信息和维护 信息的自然语言描述资料;
S2: 对步骤S1得到的自然语言描述资料进行去停用词 处理, 用于过滤对配电自动化终
端运维知识库无帮助的字词;
S3: 设C1、 C2、…、 Cm分别表示第1个、 第2个、 …、 第m个词, 每个词至少包括1个中文字符,
组建配电自动化终端运维知识库词典{C1, C2,…, Cm};
S4: 利用双向匹配最大算法对步骤S2得到的自然语言描述资料进行分词 处理, 得到分
词结果;
S5: 根据步骤S4得到的分词结果和基于注意力机制的长短期记忆神经网络, 形成配电
自动化终端运维知识库。
2.根据权利要求1所述的语义分析知识库构建方法, 其特征在于: 所述的步骤S1中, 自
然语言描述资料的形式包括语音和文字 。
3.根据权利要求1所述的语义分析知识库构建方法, 其特征在于: 所述的步骤S2中, 具
体步骤为: 过 滤自然语言中包括 “的、 地、 得、 是、 如下、 了、 吃饭、 休息 ”的字。
4.根据权利要求1所述的语义分析知识库构建方法, 其特征在于: 所述的步骤S3中, 具
体步骤为:
S31: 根据现有的配电网运维检修规程提取描述设备运行和维护的词条, 形成配电自动
化终端运行巡 视和维护自然语言描述的词典{C1, C2,…, Cn};
S32: 设xi为自然语言描述中得到的2个中文字、 3个中文字和4个中文字的第i个字符串,
N(xi)为第i个字符串出现的频次, Nset为设定的裕度; 统计分析2个中文字、 3个中文字、 4个
中文字在现场巡视人员形成的所有历史自然语言描述资料中出现的频率, 若N(xi)≥Nset,
则在专家校验通过后加入词典, 形成配电自动化终端运维知识库词典{C1, C2,…, Cn,…,
Cm}, m≥n。
5.根据权利要求4所述的语义分析知识库构建方法, 其特征在于: 所述的步骤S4中, 具
体步骤为:
S41: 选择步骤S2得到的自然语言描述资料中的任意 一条语句;
S42: 在语句中从左 往右取字符串, 设字符串的最大长度为步骤S3得到的词典中所有词
的最大长度max{leng(Ci), 1≤i≤m}, leng(Ci)为第i个词Ci的字符数;
S43: 扫描词典, 若字符串在词典中匹配到至少一个词条, 则在语句中去掉该字符串, 跳
转至步骤S42对该语句的其他字 符串进行处理; 若字符串 无法匹配词典中的任意一个词条,
则进入步骤S4 4;
S44: 删除字符串最右边的1个字符, 形成新的字符串a, 跳转至步骤S43; 直至对语句完
成所有分割, 并得到该分割结果中词的最大长度La;
S46: 在语句中从左往右取字符串, 字符串的最大长度设置方法与步骤S42相同;
S47: 扫描词典, 若字符串在词典中匹配到至少一个词条, 则在语句中去掉该字符串, 跳
转至步骤S46对该语句的其他字 符串进行处理; 若字符串 无法匹配词典中的任意一个词条,
则进入步骤S48;
S48: 删除字符串最左边的1个字符, 形成新的字符串a, 跳转至步骤S47; 直至对语句完
成所有分割, 并得到该分割结果中词的最大长度Lb;权 利 要 求 书 1/2 页
2
CN 114880432 A
2S49: 若步骤S4 4和步骤S48得到的语句分割结果相同, 则分割结果即为分词结果;
若步骤S44和步骤S48得到的语句分割结果不同, 且La>Lb, 则选取步骤S 44得到的语句分
割结果;
若步骤S44和步骤S48得到的语句分割结果不同, 且La<Lb, 则选取步骤S 46得到的语句分
割结果。
6.根据权利要求1所述的语义分析知识库构建方法, 其特征在于: 所述的步骤S5中, 具
体步骤为:
S51: 对每一次配电自动化终端的运维信 息的自然语言进行分词处理, 形成该次配电自
动化终端的运行巡 视信息的自然语言的分词结果和维护 信息的自然语言的分词结果;
S52: 利用词向量Word2Vec的Skip ‑Gram模型对运行巡视信息的自然语言的分词结果进
行编码, 得到I ns向量;
S53: 利用词向量Word2Vec的Skip ‑Gram模型对维护信息的自然语言的分词结果进行编
码, 得到Mnt向量;
S54: 构建基于注意力机制的LSTM ‑Attention长短期记忆神 经网络, 将Ins向量作为输
入变量, 将Mnt向量做为输出 结果;
S55: 根据配电自动化终端的历史运维信息得到的典型Ins向量与典型Mnt向量, 对步骤
S54构建的LSTM ‑Attention长短期记忆神经网络进行训练, 实现连接配电自动化终端的运
行巡视信息的自然语言描述与维护信息的自然语言描述的LSTM ‑Attention配电自动化终
端运维知识库。
7.根据权利要求1所述的语义分析知识库构建方法, 其特 征在于: 还 包括以下步骤:
S6: 在现场开展配电自动化终端运行巡视时, 巡视人员用自然语言描述掌握到的待评
估的配电自动化终端的状态;
通过词向量 Word2Vec的Skip‑Gram模型 得到该次描述的分词结果的编码向量 Insp;
将Insp送入步骤S5得到的LSTM ‑Attention配电自动化终端运维知识库, 得到对应的配
电自动化终端的维护结果的编码向量Mntp;
通过词向量Word2Vec的Skip ‑Gram模型把编码向量Mntp转换成自然语言, 实现配电自动
化终端维护工作的自动推荐功能。
8.一种基于权利要求1至7中任意一项所述的语义分析知识库构建方法的配电自动化
终端运维知识库, 其特 征在于:
包括从底层依次向上的数据层、 算法层和应用层;
数据层包括巡 视记录、 消缺报告、 情况说明和语音对话;
算法层包括基于词向量Word2Vec的Skip ‑Gram模型和基于深度学习的LSTM ‑Attention
长短期记忆神经网络; 基于词向量Word2Vec的Skip ‑Gram模型构建基于深度学习的LSTM ‑
Attention长短期记忆神经网络; 基于深度学习的LSTM ‑Attention长短期记忆神经网络用
于对基于词向量 Word2Vec的Skip‑Gram模型进行语义理解;
应用层包括依次连接的配电自动 化终端运行巡视信 息语义分析模块、 配电自动 化终端
运维知识库和配电自动化终端维护工作建议模块。
9.一种计算机存储介质, 其特征在于: 其内存储有可被计算机处理器执行的计算机程
序, 该计算机程序执行如权利要求1至权利要求6中任意一项所述的语义分析知识库构建方法。权 利 要 求 书 2/2 页
3
CN 114880432 A
3
专利 语义分析知识库构建方法和配电自动化终端运维知识库
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:52:27上传分享