专利基于多模态模式的中文写作智能分析方法、系统及介质 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210314409.5 (22)申请日 2022.03.29 (65)同一申请的已公布的文献号申请公布号 CN 114417001 A (43)申请公布日 2022.04.29 (73)专利权人山东大学地址 250100 山东省济南市历城区山大南路27号 (72)发明人王兰忠　 (74)专利代理机构济南智本知识产权代理事务所(普通合伙) 37301 专利代理师张平平 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01)G06F 40/253(2020.01) G06N 3/04(2006.01) G06K 9/62(2022.01) (56)对比文件 CN 111488931 A,2020.08.04 CN 113326348 A,2021.08.31 US 2009012789 A1,20 09.01.08 CN 113435179 A,2021.09.24 CN 111079444 A,2020.04.28 韩林倩. 《高中生英语写作语篇衔接手段与作文质量的相关性研究》 . 《《中国优秀硕士学位论文全文数据库 (社会科学Ⅱ辑)》》 .2019, 审查员刘莹 (54)发明名称基于多模态模式的中文写作智能分析方法、系统及介质 (57)摘要本发明公开了一种基于多模态模式的中文写作智能分析方法、系统及介质，涉及智能文本分析技术领域，包括：获取中文写作原文中的模态资源信息，并提取所述中文写作原文的多模态特征；获取所述中文写作原文中的中心思想及分类结果，根据所述模态资源信息与所述中心思想及分类结果的匹配程度对中文写作原文进行分析评估；构建写作评估模型，通过所述写作评估模型根据所述多模态特征判断中文写作原文的流畅程度；根据所述匹配程度及流畅程度生成中文写作原文的分析结果。本发明通过对中文写作中的多模态资源及多模态特征进行提取及评价并识别判断文章中的语法错误，提高了多模态模式下中文写作的分析效率及准确度。权利要求书3页说明书10页附图1页 CN 114417001 B 2022.07.01 CN 114417001 B 1.一种基于多模态模式的中文写作智能分析方法，其特征在于，包括以下步骤：获取中文写作原文中的模态资源信息，并提取所述中文写作原文的多模态特征；获取中文写作原文中的中心思想及分类结果，根据所述模态资源信息与所述中心思想及分类结果的匹配程度对中文写作原文进行分析评估；构建写作评估模型，通过所述写作评估模型根据所述多模态特征判中文写作原文的流畅程度；根据所述匹配程度及流畅程度生成中文写作原文的分析结果，并将所述分析结果按照预设方式进行显示；所述的根据所述模态资源信息与所述中心思想及分类结果的匹配度对中文写作原文进行分析评估，具体为：提取中文写作原文的中心思想及所属类别，获取中文写作原文中图像模态资源及表格模态资源的位置信息，根据所述位置信息的上下文信息捕捉局部语义；根据所述局部语义获取所述图像模态资源及表格模态资源的相关性，生成第一相关性得分；根据所述中心思想及所属类别判断中文写作原文中的图像模态资源和表格模态资源的第二相关性得分；根据所述第一相关性得分及第二相关性得分通过预设权重计算生成最终匹配度得分；所述的构建写作评估模型，通过所述写作评估模型根据所述多模态特征判中文写作原文的流畅程度，具体为：获取中文写作原文中的多模态特征，所述多模态特征包括但不限于语义特征、排版特征及图表特征；构建写作评估模型，通过所述写作评估模型获取中文写作原文中的连接性关键词信息及总结性关键词信息；提取连接性关键词的上下文信息，结合上下文的多模态特征获取能够正确衔接上文与下文并保持语义一致的连接性关键词个数，并进行标注；根据所述能够正确衔接上文与下文并保持语义一致的连接性关键词个数判断中文写作原文的流畅程度。 2.根据权利要求1所述的一种基于多模态模式的中文写作智能分析方法，其特征在于，所述的获取中文写作原文中的中心思想及分类结果，具体为：对文本模态资源进行预处理，将预处理后的文本模态资源通过Word2vec模型进行提取词向量，根据所述词向量进行加权平均构建句向量表达，根据所述词向量及句向量表达作为语义特征；计算所述句向量之间的相似度，若任意两个句向量之间的相似度大于预设相似度阈值，则获取每个句向量在中文写作原文中的出现频率及分布广度，根据所述出现频率及分布广度计算句向量在中文写作原文中的贡献值；根据所述贡献值进行排序，根据贡献值最高的句向量在中文写作原文中进行抽取生成主题句集合，并提取主题句集合的语义特征，根据所述语义特征获取中文写作原文的中心思想；基于双向长短期记忆神经网络模型建立文本分类模型，将所述句向量输入到所述文本权　利　要　求　书 1/3 页 2 CN 114417001 B 2分类模型，并结合注意力机制配置差异化权重获取中文写作原文的最终语义特征，根据所述最终语义特征输出中文写作原文所属类别的概率；选取所述概率最高的类别信息作为中文写作原文的所属类别。 3.根据权利要求1所述的一种基于多模态模式的中文写作智能分析方法，其特征在于，根据所述匹配程度及流畅程度生成中文写作原文的分析结果，具体为：根据匹配程度得分及流畅程度得分按照预设权重信息获取中文写作原文的综合得分，根据预设阈值构建综合得分阈值区间；根据所述综合得分所落在的阈值区间确定中文写作原文的质量等级，同时将中文写作原文中与中心思想不匹配的图表及中文写作原文中不连贯位置进行标注，并根据标注位置分析语法错误；根据质量等级及标注信息获取中文写作原文的分析结果。 4.根据权利要求1所述的一种基于多模态模式的中文写作智能分析方法，其特征在于，还包括：构建中文写作分析数据库，将用户的身份信息与历史写作原文及写作分析结果存入所述中文写作分析数据库；将目标用户当前待分析中写作原文的分析结果导入所述中文写作分析数据库中进行相似度对比，获取历史写作分析结果中与当前写作分析的同类型写作分析标注；将所述同类型写作分析按照预设时间生成目标用户中文写作的阶段性分析结果；同时，根据所述阶段性分析结果根据大数据生成目标用户当前中文写作的建议及注意事项。 5.一种基于多模态模式的中文写作智能分析系统，其特征在于，该系统包括：存储器、处理器，所述存储器中包括一种基于多模态模式的中文写作智能分析方法程序，所述一种基于多模态模式的中文写作智能分析的方法程序被所述处理器执行时实现如下步骤：获取中文写作原文中的模态资源信息，并提取所述中文写作原文的多模态特征；获取中文写作原文中的中心思想及分类结果，根据所述模态资源信息与所述中心思想及分类结果的匹配程度对中文写作原文进行分析评估；构建写作评估模型，通过所述写作评估模型根据所述多模态特征判中文写作原文的流畅程度；根据所述匹配程度及流畅程度生成中文写作原文的分析结果，并将所述分析结果按照预设方式进行显示；所述的根据所述模态资源信息与所述中心思想及分类结果的匹配度对中文写作原文进行分析评估，具体为：提取中文写作原文的中心思想及所属类别，获取中文写作原文中图像模态资源及表格模态资源的位置信息，根据所述位置信息的上下文信息捕捉局部语义；根据所述局部语义获取所述图像模态资源及表格模态资源的相关性，生成第一相关性得分；根据所述中心思想及所属类别判断中文写作原文中的图像模态资源和表格模态资源的第二相关性得分；根据所述第一相关性得分及第二相关性得分通过预设权重计算生成最终匹配度得分；权　利　要　求　书 2/3 页 3 CN 114417001 B 3

专利 基于多模态模式的中文写作智能分析方法、系统及介质

专利基于多模态模式的中文写作智能分析方法、系统及介质