(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210462984.X
(22)申请日 2022.04.29
(65)同一申请的已公布的文献号
申请公布号 CN 114564967 A
(43)申请公布日 2022.05.31
(73)专利权人 天津大学
地址 300072 天津市南 开区卫津路9 2号
(72)发明人 张梅山 张鑫 孙越恒
(74)专利代理 机构 北京市广友专利事务所有限
责任公司 1 1237
专利代理师 张仲波
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/284(2020.01)
G06F 40/169(2020.01)G06F 40/117(2020.01)
(56)对比文件
CN 111191438 A,2020.0 5.22
审查员 王佳楠
(54)发明名称
一种面向情感语义的语义标注及语义依存
分析方法及装置
(57)摘要
本发明公开了一种面向情感语义的语义标
注及语义依存分析方法及装置, 涉及自然语言处
理技术领域。 包括: 获取待分析的文本; 将文本输
入到构建好的情感语义模型; 其中, 情感语义模
型包括情感语义依存表示及标注模块 以及情感
语义依存模型; 根据文本以及情感语义模型, 得
到待分析的文本的标注及分析结果; 其中, 标注
及分析结果包括情感语义标注结果 以及语义分
析结果, 情感语义标注结果根据文本以及情感语
义依存表 示及标注模块得到, 语义分析结果根据
文本以及情感语义依存模型得到。 本发明能够构
建面向情感的深层语义形式化表 示方案, 以及构
建面向情感语义的深层语义分析算法框架, 可以
输出高质量的深层情感语义分析 结果。
权利要求书3页 说明书11页 附图3页
CN 114564967 B
2022.09.13
CN 114564967 B
1.一种面向情感语义的语义标注及语义依存分析 方法, 其特 征在于, 所述方法包括:
S1、 获取待分析的文本;
S2、 将所述文本输入到构建好的情 感语义模型; 其中, 所述情 感语义模型包括情 感语义
依存表示及标注模块以及情感语义依存 模型;
S3、 根据所述文本以及情感语义模型, 得到待分析的文本的标注及分析结果; 其中, 所
述标注及分析结果包括情感语义标注结果以及语义分析结果, 所述情感语义标注结果根据
所述文本以及情感语义依存表示及标注模块得到, 所述语义分析结果根据所述文本以及情
感语义依存 模型得到;
所述情感语义依存表示及标注模块包括情感语义依存表示模块以及情感语义标注模
块;
所述S3中的所述情感语义标注结果根据所述文本以及情感语义依存表示及标注模块
得到包括:
S31、 根据所述文本以及所述情感语义依存表示模块, 得到情感语义依存表示结果; 其
中, 所述情感语义依存表示结果的表达方式为依存图;
S32、 根据所述情感语义依存表示结果以及情感语义标注模块, 得到情感语义标注结
果;
所述S31中的根据所述文本以及所述情感语义依存表示模块, 得到情感语义依存表示
结果包括:
S311、 对所述文本进行预处理, 得到文本中每个词语对应的语义义项; 其中, 所述对所
述文本进行预处理包括对文本中的每个词语进行语义标准化或对文本中的每个词语进行
语义消歧;
S312、 将所述语义义项转换为一组三元组(E1,R,E2), 得到情感语义依存表示结果; 其
中, 三元组中的E1和E2为语义义项, R为E1和E2之间的关系, 所述关系包括核心词、 施事、 受
事、 时期、 范围、 强度以及属性;
所述情感语义依存 模型由基于管道模型架构得到;
S3中的所述语义分析 结果根据所述文本以及情感语义依存 模型得到包括:
对所述文本中的词语进行语义标准 化, 得到每 个词语以及所述词语对应的语义 义项;
将所述每 个词语以及所述词语对应的语义 义项转换为词语的输入特 征向量;
根据所述词语的输入特 征向量以及特 征编码器, 得到情感语义依存特 征编码结果;
根据所述情 感语义依存特征编码结果以及基于深度 学习的解析模型, 得到文本的语义
分析结果; 其中, 所述基于深度学习的解析模型的算法包括移进归约算法或双仿射 算法;
所述S32中的根据所述情感语义依存表示结果以及情感语义标注模块, 得到情感语义
标注结果包括:
S321、 对所述情感语义依存表示结果中文本的词语进行 标准化;
S322、 对标准 化后的文本中的词语进行词义标注;
S323、 对标注后的文本中的词语进行情感触发词标注;
S324、 对情感触发词标注后的文本中词语之间的连接关系进行标注, 得到标注连接关
系后的文本中指定的词语对;
S325、 对所述标注连接关系后的文本中指定的词语对进行标注语义关系, 得到情感语权 利 要 求 书 1/3 页
2
CN 114564967 B
2义标注结果;
所述得到文本的情 感语义标注结果的方法包括: 采用众包的方法得到文本的情感语义
标注结果;
所述得到文本的情 感语义标注结果的方法包括: 采用局部标注策略得到文本的情 感语
义标注结果; 其中, 局部标注策略为在给定条件下给出文本中相关词语的情感语义标注结
果;
所述得到文本的情感语义标注结果的过程由后台标注管理监控系统进行监控;
所述对所述文本 中的词语进行语义标准化, 得到每个词语以及所述词语对应的语义义
项包括:
采用分类模型将所述文本中的词语分为与情感语义有关的词语和与情感语义无关的
词语;
计算所述与情感语义有关的词语和情感语义知识库中的语义义项之间的关联度, 选取
关联度最高的语义义项作为所述与情感语义有关的词语的语义义项; 所述语义义项的特征
表示使用多元关系数据嵌入算法从所述情感语义知识库中计算得到;
所述将所述每 个词语以及所述词语对应的语义 义项转换为词语的输入特 征向量包括:
获取所述词语的特 征向量以及所述词语对应的语义 义项的特 征向量;
将所述词语的特征向量以及所述词语对应的语义义项的特征向量进行拼接, 得到所述
词语的输入特 征向量。
2.一种面向情感语义的语义标注及语义依存分析装置, 其特 征在于, 所述装置包括:
获取模块, 用于获取待分析的文本;
输入模块, 用于将所述文本输入到构建好的情感语义模型; 其中, 所述情 感语义模型包
括情感语义依存表示及标注模块以及情感语义依存 模型;
输出模块, 用于根据所述文本以及情感语义模型, 得到待分析的文本的标注及分析结
果; 其中, 所述标注及分析结果包括情感语义标注结果以及语义分析结果, 所述情感语义标
注结果根据所述文本以及情感语义依存表示及标注模块得到, 所述语义分析结果根据所述
文本以及情感语义依存 模型得到;
所述情感语义依存表示及标注模块包括情感语义依存表示模块以及情感语义标注模
块;
所述情感语义标注结果 根据所述文本以及情感语义依存表示及标注模块得到包括:
S31、 根据所述文本以及所述情感语义依存表示模块, 得到情感语义依存表示结果; 其
中, 所述情感语义依存表示结果的表达方式为依存图;
S32、 根据所述情感语义依存表示结果以及情感语义标注模块, 得到情感语义标注结
果;
所述根据所述文本以及所述情感语义依存表示模块, 得到情感语义依存表示结果包
括:
S311、 对所述文本进行预处理, 得到文本中每个词语对应的语义义项; 其中, 所述对所
述文本进行预处理包括对文本中的每个词语进行语义标准化或对文本中的每个词语进行
语义消歧;
S312、 将所述语义义项转换为一组三元组(E1,R,E2), 得到情感语义依存表示结果; 其权 利 要 求 书 2/3 页
3
CN 114564967 B
3
专利 一种面向情感语义的语义标注及语义依存分析方法及装置
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:47:45上传分享