(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210502122.5 (22)申请日 2022.05.10 (71)申请人 中教云智数字科技有限公司 地址 100191 北京市海淀区花园东路3 5号 融合创新产业园中教云 (72)发明人 郭子铭 钱锟  (51)Int.Cl. G06F 16/33(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06V 30/14(2022.01) G06V 30/41(2022.01) G06Q 50/20(2012.01) (54)发明名称 一种文科解 答题自动批改方法 (57)摘要 本发明公开了一种文科解答题自动批改方 法, 包括批卷教师将示例答案修改为标准化答 案; 对标准化答案进行提取处理, 获得关键词信 息和标准答案的句向量组信息, 并对关键词信息 和标准答案的句向量信息分别标注分值; 获取学 生的作答文本, 并对作答文本进行语句和词语的 分别切分和Embedding工作; 将作答的词语与关 键词信息对比, 获得关键词命中情况, 获得关键 词赋分; 根据关键词命中情况, 为语句的语义相 似度得分进行范围的划分, 并对于语句的语义与 标准答案的句向量组相似度进行对比, 获得语义 相似度赋分; 关键词赋分值和语义相似度赋分值 之和, 即为此回答所获得的总得分。 本方案, 简便 的进行文科试卷的批改过程, 减少教师的劳动 量。 权利要求书2页 说明书7页 附图4页 CN 114936265 A 2022.08.23 CN 114936265 A 1.一种文科解 答题自动批改方法, 其特 征在于, 具体包括以下步骤: S1、 批卷教师将示例答案修改为标准 化答案; S2、 对标准化答案进行提取处理, 获得关键词信息和标准答案的句向量组信息, 并对关 键词信息和标准 答案的句向量信息分别标注分值; S3、 获取学生的作答文本, 并对作答文本进行语句和词语的分别切分和Embedding工 作; S4、 将作答的词语与关键词信息对比, 获得关键词命中情况, 获得关键词赋分; S5、 根据关键词命中情况, 为语句的语义相似度 得分进行范围的划分, 并对于语句的语 义与标准 答案的句向量组相似度进行对比, 获得语义相似度赋分; S6、 关键词赋分值和语义相似度赋分值之和, 即为此回答所获得的总得分。 2.如权利要求1所述的一种文科解答题自动批改方法, 其特征在于, 所述S3中, 获取学 生的作答文本, 具体包括以下步骤: S31、 获取 学生的答题试 卷; S32、 利用扫描设备扫描答题试 卷, 获得作答的图片; S33、 利用OCR文字识别设备, 对作答图片中的文字识别, 并生成作答文本 。 3.如权利要求1所述的一种文科解答题自动批改方法, 其特征在于, 所述S4中, 关键词 赋分的赋分单位为字词或由数个词组成的短语, 关键词赋分包括精确匹配与模糊匹配两种 关键词匹配方式。 4.如权利要求3所述的一种 文科解答题自动批改方法, 其特征在于, 所述精确匹配为教 师所指定的关键词, 完全正确地出现在学生作答中, 才可对此 学生作答进行 赋分。 5.如权利要求3所述的一种 文科解答题自动批改方法, 其特征在于, 所述模糊匹配包括 词语切分、 词嵌入与关键词相似度计算 三个部分, 其中: 词语切分部分, 调用中文分词库jieba库进行词语切分; 词嵌入部分, 使用向量数据集Tencent_AI Lab_ChineseEmbed ding; 关键词相似度计算部分, 使用动态滑动 窗口原理, 将窗口尺寸设定为教师指定的模糊 匹配关键词中词语个数的0.5 ‑1.5倍, 并向上取整, 用以在学生作答中选定用于模糊匹配的 短语内容, 随后计算窗口中的所有词语的词向量的平均值与教师指定的模糊匹配关键词中 的所有词语的词向量的平均值, 获得两个180 ‑220维的向量, 并进行余弦相 似度的计算, 然 后以相似度最高的短语作为匹配对象, 若相似度高于 设计的阈值, 则匹配成功, 获得对应分 数, 反之则匹配失败, 不得分。 6.如权利要求1所述的一种文科解答题自动批改方法, 其特征在于, 所述S6中, 语义相 似度赋分的赋分单位为完整的语句, 语义相似度赋分包括示例答案预处理、 学生作答预处 理和语义相似度计算 三个部分, 其中: 示例答案预处理部分, 将示例答案中的各个得分点语句进行切分, 并借助BERT ‑ whitening模型为各个 语句进行句向量的计算; 学生作答预处理部分, 以句号、 分号、 叹号、 问号为分隔, 将学生作答进行整句的切分; 同时在每个整句内, 以逗号为分隔, 进行分句的切分; 所有的整句与分句均通过BERT ‑ whitening进行句向量的计算; 语义相似度计算部分, 为每个示例答案的得分点语句, 在对应的范围内匹配合适的学权 利 要 求 书 1/2 页 2 CN 114936265 A 2生作答语句进行余弦相似度的计算。 7.如权利要求6所述的一种 文科解答题自动批改方法, 其特征在于, 对应的范围具体分 为: 若该示例答案语句中包括关键词, 则系统只会在命中了关键词的学生作答的整句及其 所有的分句内尝试匹配; 否则, 将该示例答案语句与学生作答的所有 整句及其分句进行尝试匹配。 8.如权利要求6所述的一种 文科解答题自动批改方法, 其特征在于, 在语义相似度计算 后, 根据预先设计的两个阈值, 来为每个得分点语句进 行完全命中和部 分命中的评价, 并进 行对应的赋分。权 利 要 求 书 2/2 页 3 CN 114936265 A 3

.PDF文档 专利 一种文科解答题自动批改方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种文科解答题自动批改方法 第 1 页 专利 一种文科解答题自动批改方法 第 2 页 专利 一种文科解答题自动批改方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:46:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。