(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210314409.5
(22)申请日 2022.03.29
(65)同一申请的已公布的文献号
申请公布号 CN 114417001 A
(43)申请公布日 2022.04.29
(73)专利权人 山东大学
地址 250100 山东省济南市历城区山大南
路27号
(72)发明人 王兰忠
(74)专利代理 机构 济南智本知识产权代理事务
所(普通合伙) 37301
专利代理师 张平平
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/30(2020.01)G06F 40/253(2020.01)
G06N 3/04(2006.01)
G06K 9/62(2022.01)
(56)对比文件
CN 111488931 A,2020.08.04
CN 113326348 A,2021.08.31
US 2009012789 A1,20 09.01.08
CN 113435179 A,2021.09.24
CN 111079444 A,2020.04.28
韩林倩. 《高 中生英语写作语篇衔接 手段与
作文质量的相关性研究》 . 《 《中国优秀硕士学位
论文全文数据库 (社会科 学Ⅱ辑)》 》 .2019,
审查员 刘莹
(54)发明名称
基于多模态模式的中文写作智能分析方法、
系统及介质
(57)摘要
本发明公开了一种基于多模态模式的中文
写作智能分析方法、 系统及介质, 涉及智能文本
分析技术领域, 包括: 获取中文写作原文中的模
态资源信息, 并提取所述中文写作原文的多模态
特征; 获取所述中文写作原文中的中心思想及分
类结果, 根据所述模态资源信息与所述中心思想
及分类结果的匹配程度对中文写作原文进行分
析评估; 构建写作评估模型, 通过所述写作评估
模型根据所述多模态特征判断中文写作原文的
流畅程度; 根据所述匹配程度及流畅程度生成中
文写作原文的分析结果。 本发明通过对中文写作
中的多模态资源及多模态特征进行提取及评价
并识别判断文章中的语 法错误, 提高了多模态模
式下中文 写作的分析效率及准确度。
权利要求书3页 说明书10页 附图1页
CN 114417001 B
2022.07.01
CN 114417001 B
1.一种基于多模态模式的中文 写作智能分析 方法, 其特 征在于, 包括以下步骤:
获取中文 写作原文中的模态资源信息, 并提取 所述中文 写作原文的多模态特 征;
获取中文写作原文中的中心思想及分类结果, 根据 所述模态资源信 息与所述中心思想
及分类结果的匹配程 度对中文 写作原文 进行分析评估;
构建写作评估模型, 通过所述写作评估模型根据 所述多模态特征判中文写作原文的流
畅程度;
根据所述匹配程度及流畅程度生成中文写作原文的分析结果, 并将所述分析结果按照
预设方式进行显示;
所述的根据所述模态资源信息与所述中心思想及分类结果的匹配度对中文写作原文
进行分析评估, 具体为:
提取中文写作原文的中心思想及所属类别, 获取中文写作原文中图像模态资源及表格
模态资源的位置信息, 根据所述 位置信息的上 下文信息捕捉局部语义;
根据所述局部语义获取所述图像模态资源及表格模态资源的相关性, 生成第 一相关性
得分;
根据所述中心思想及所属类别判断中文写作原文中的图像模态资源和表格模态资源
的第二相关性得分;
根据所述第一相关性得分及第二相关性得分通过 预设权重计算生成最终匹配度得分;
所述的构建写作评估模型, 通过所述写作评估模型根据 所述多模态特征判中文写作原
文的流畅程度, 具体为:
获取中文写作原文中的多模态特征, 所述多模态特征包括但不 限于语义特征、 排版特
征及图表特 征;
构建写作评估模型, 通过所述写作评估模型获取中文写作原文中的连接性关键词信 息
及总结性关键词信息;
提取连接性关键词的上下文信 息, 结合上下文的多模态特征获取能够正确衔接上文与
下文并保持语义 一致的连接性关键词个数, 并进行 标注;
根据所述能够正确衔接上文与下文并保持语义一致的连接性关键词个数判断中文写
作原文的流畅程度。
2.根据权利要求1所述的一种基于多模态模式的中文写作智能分析方法, 其特征在于,
所述的获取中文 写作原文中的中心思想及分类结果, 具体为:
对文本模态资源进行预处理, 将预处理后的文本模态资源通过Word2vec模型进行提取
词向量, 根据所述词向量进行加权平均构建句向量表达, 根据所述词向量及句向量表达作
为语义特 征;
计算所述句向量之间的相似度, 若任意两个句向量之间的相似度大于预设相似度阈
值, 则获取每个句向量在中文写作原文中的出现频率及分布广度, 根据所述出现频率及分
布广度计算句向量在中文 写作原文中的贡献值;
根据所述贡献值进行排序, 根据贡献值最高的句向量在中文写作原文中进行抽取生成
主题句集合, 并提取主题句集合的语义特征, 根据所述语义特征获取中文写作原文的中心
思想;
基于双向长短期记忆神经网络模型建立文本分类模型, 将所述句向量输入到所述文本权 利 要 求 书 1/3 页
2
CN 114417001 B
2分类模型, 并结合注意力机制配置差异化权重获取中文写作原文的最终语义特征, 根据所
述最终语义特 征输出中文 写作原文所属类别的概 率;
选取所述概率最高的类别 信息作为中文 写作原文的所属类别。
3.根据权利要求1所述的一种基于多模态模式的中文写作智能分析方法, 其特征在于,
根据所述匹配程度及流畅程度生成中文 写作原文的分析 结果, 具体为:
根据匹配程度得分及流畅程度得分按照预设权重信 息获取中文写作原文的综合得分,
根据预设阈值构建综合得分阈值区间;
根据所述综合得分所落在的阈值区间确定中文写作原文的质量等级, 同时将中文写作
原文中与中心思想不匹配的图表及中文写作原文中不连贯位置进 行标注, 并根据标注位置
分析语法错 误;
根据质量 等级及标注信息获取中文 写作原文的分析 结果。
4.根据权利要求1所述的一种基于多模态模式的中文写作智能分析方法, 其特征在于,
还包括:
构建中文写作分析数据库, 将用户的身份信 息与历史写作原文及写作分析结果存入所
述中文写作分析 数据库;
将目标用户当前待分析中写作原文的分析结果导入所述中文写作分析数据库中进行
相似度对比, 获取历史写作分析 结果中与当前写作分析的同类型写作分析 标注;
将所述同类型写作分析按照预设时间生成目标用户中文 写作的阶段性分析 结果;
同时, 根据所述阶段性分析结果根据 大数据生成 目标用户当前中文写作的建议及注意
事项。
5.一种基于多模态模式的中文写作智能分析系统, 其特征在于, 该系统包括: 存储器、
处理器, 所述存储器中包括一种基于多模态模式的中文写作智能分析方法程序, 所述一种
基于多模态模式的中文 写作智能分析的方法程序被所述处 理器执行时实现如下步骤:
获取中文 写作原文中的模态资源信息, 并提取 所述中文 写作原文的多模态特 征;
获取中文写作原文中的中心思想及分类结果, 根据 所述模态资源信 息与所述中心思想
及分类结果的匹配程 度对中文 写作原文 进行分析评估;
构建写作评估模型, 通过所述写作评估模型根据 所述多模态特征判中文写作原文的流
畅程度;
根据所述匹配程度及流畅程度生成中文写作原文的分析结果, 并将所述分析结果按照
预设方式进行显示;
所述的根据所述模态资源信息与所述中心思想及分类结果的匹配度对中文写作原文
进行分析评估, 具体为:
提取中文写作原文的中心思想及所属类别, 获取中文写作原文中图像模态资源及表格
模态资源的位置信息, 根据所述 位置信息的上 下文信息捕捉局部语义;
根据所述局部语义获取所述图像模态资源及表格模态资源的相关性, 生成第 一相关性
得分;
根据所述中心思想及所属类别判断中文写作原文中的图像模态资源和表格模态资源
的第二相关性得分;
根据所述第一相关性得分及第二相关性得分通过 预设权重计算生成最终匹配度得分;权 利 要 求 书 2/3 页
3
CN 114417001 B
3
专利 基于多模态模式的中文写作智能分析方法、系统及介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:49:12上传分享