(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210426140.X (22)申请日 2022.04.22 (71)申请人 珠海翼字科技有限公司 地址 519085 广东省珠海市高新区唐家湾 镇香山路88号二栋15层15 04室 (72)发明人 陈涯 牛颖 蒋东辰 康鑫  隗艳萍 孙艳  (74)专利代理 机构 北京科迪生专利代理有限责 任公司 1 1251 专利代理师 金怡 (51)Int.Cl. G06F 40/284(2020.01) G06F 40/253(2020.01) G06F 40/216(2020.01) G06F 40/211(2020.01)G06F 40/30(2020.01) G06Q 10/06(2012.01) G06Q 50/20(2012.01) (54)发明名称 一种可设置打分等级的英语作文打分方法 及系统 (57)摘要 本发明涉及一种可设置打分等级的英语作 文打分方法及系统, 其方法包 括: S1: 设置英语等 级的各个等级中的单词、 语法、 主题度和流畅度 等级的分值范围; 用户输入起始等级, 根据该起 始等级得到对应的单词、 语法、 主题度和流畅度 的等级, 并输入至少一篇待打分英文作文; S2: 对 待打分英文作文进行预处理, 获取其中的句子、 单词和实体; S3: 基于单词、 句子、 待打分英文作 文和实体分别计算待打分英文作文对应的单词、 语法、 主题度以及流畅度的等级; S4: 基于起始等 级和待打分英文作文的单词、 语法、 主题度以及 流畅度等级进行加权计算, 得到最终的作文分 数。 本发明提供的方法根据不同水平的英语学习 者采用了不同的标准来进行打分, 该打分方法更 灵活, 更具实用性。 权利要求书3页 说明书7页 附图4页 CN 114841149 A 2022.08.02 CN 114841149 A 1.一种可设置打 分等级的英语作文打 分方法, 其特 征在于, 包括: 步骤S1: 设置英语等级的各个等级中的单词等级Word、 语法等级KPG、 主题度等级TC和 流畅度等级Fluency的分值范围; 用户输入其起始等级, 根据该起始等级, 得到该起始等级 对应的单词等级WordBase、 语法等级KPGBase、 主题度等级TCBase和流畅度等级FluencyBase, 并 输入至少一篇待打分英文作文; 其中, 所述英语等级包括: 小学等级、 初中等级、 高中等级、 大学四级和大 学六级; 步骤S2: 对所述待打 分英文作文 进行预处理, 获取其中的句子、 单词和实体; 步骤S3: 基于所述单词、 句子、 待打分英文作文和实体分别 进行词汇分析、 语法点分析、 主题度分析以及流畅度分析, 得到所述待打分英文作文对应的单词等级、 语法等级、 主题度 等级以及流畅度等级; 步骤S4: 基于所述起始等级和所述待打分英文作文的单词等级、 语法等级、 主题度等级 以及流畅度等级 进行加权计算, 得到最终的作文分数。 2.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤 S2: 对所述待打 分英文作文 进行预处理, 获取其中的句子、 单词和实体, 具体包括: 对每一篇所述待打分的英文作文, 使用StanfordNLPCore工具进行处理, 获取其 中的句 子存储于句子集合SentenceList, 单词存储于单词集合WordsList, 以及实体存储于实体集 合EntityL ist。 3.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤 S3中基于所述单词进行词汇分析, 得到所述待打 分英文作文对应的单词等级, 具体包括: 步骤S301 : 基于所述单词集合WordsList , 获取每个所述单词的难度值 WordDifficulty; 步骤S302: 将所有所述单词按照其难度值降序排列, 取前m%, 通过累加求和取平均的 方法, 计算前m%单词的平均难度值AveWordDifficult, 根据所述平均难度值获取其对应的 单词等级W ordtarget。 4.根据权利要求2所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤 S301: 获取所述单词的难度值, 具体包括: 步骤S3011: 获取已有公开的英语语料, 对所述英语语料进行分句和分词, 统计其中所 有单词及其使用频率, 得到词典Dict ionary、 词频m与总词数M, 以及每个单词对应的单词等 级N; 步骤S3012: 获取WordsList中每个单词wordi的词频mi以及词总数M, 根据公式(1), 可计 算得到wordi的信息量 Infoi: Infoi=log2(1/pi)               (1) 其中, pi为单词Wordi的频率, pi=mi/M; 步骤S3013: 根据公式(2), 可计算得到w ordi的难度值 WordiDifficulty: WordiDifficulty=(a*I nfoi)+N           (2) 其中, a为预设的系数, I nfoi为单词wordi的信息量, N 为wordi所对应的单词等级。 5.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤 S3中基于所述句子进行语法点分析, 得到所述待打 分英文作文对应的语法等级, 具体包括: 步骤S311 : 遍历所述句子集合SentenceList, 以每个句子为单位, 利用权 利 要 求 书 1/3 页 2 CN 114841149 A 2StanfordNLP Core工具对 所述句子进行分析, 得到句法结构, 并根据所述句法结构与其对应 英语等级的关系Map, 将其对应的英语等级存放于KPGL ist; 步骤S312: 将KPGList按照降序排序, 取前m%, 累加求和取平均, 根据该平均值获取对 应的语法等级KPGTarget。 6.根据权利要求5所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤 S311中构建句法结构与其对应英语等级的关系Map, 具体包括: 步骤S3111: 根据中小学英语教学大纲、 大学四级和六级考试要求, 获取不同英语等级 的语法知识点; 利用StanfordN LPCore工具, 分析 得到所述语法知识点的句法结构; 步骤S3112: 基于所述句法结构, 构建与其对应英语等级的关系Map。 7.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤 S3中对所述待打分的英文作文进 行主题度分析, 得到所述待打分英文作文对应的主题度等 级, 具体包括: 步骤S321: 收集已有 的不同级别的英语作文, 按照其对应的等级划分为不同的等级集 合Set1、 Set2、 Set3, Set4、 Set5; 步骤S322: 获取所述等级集合中每一篇英文作文, 根据所述英文作文的主题Topic或者 将所述英文作文的第一句作为其主题Topic, 去掉所述主题Topic中的停止词, 得到词袋 WordsBag=[Word1,Word2,…,Wordn]; 根据公式(3), 计算所述英文作文的主题向量: 其中, Ii为Wordi对应的该词信息量Infoi, Vi为基于Skip ‑gram模型计算得到Wordi的多 维词向量, n 为词袋WordsBag中单词的个数; 步骤S323: 获取所述英文作文中的每个句子, 重复步骤S322, 计算其句向量, 并存储于 SenVecList; 步骤S324: 根据公式(4), 计算SenVecList中的句向量与主题向量 的夹角距离并求和, 记为Dist ance; 如果用采用第一句话作为主题句, 则计算除第一句以外的句子的句向量与 主题向量的夹角距离并求和: 其中, n为总句数; VT为主题向量; Vi为句向量; 步骤S325: 将Distance除以所述英文作文总句数n, 得到平均夹角距离; 如果用第一句 作为主题, 则除以n ‑1; 所述平均夹角距离作为该篇英文作文的主题度Topic  Conformity; 步骤S326: 计算每个等级集合Seti中所有英文作文的主题度, 去掉分数最高的n%和得 分最低的n%后, 累加所述等级集合中剩余英文作文的主题度并除以剩下的作文 数量, 求得 每个所述等级集合的平均主题度, 作为该等级所对应的主题度; 步骤S327: 根据所述待打分英文作文, 重复步骤S322~S325计算得到其主题度, 获取该 主题度所对应的主题度等级 TCTarget。 8.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤 S3中对所述实体进行流畅度分析, 得到所述待打 分英文作文对应的流畅度等级, 具体包括: 步骤S331: 使用StandfordNLPCore, 对于步骤S321得到不同的等级集合Set1、 Set2、权 利 要 求 书 2/3 页 3 CN 114841149 A 3

.PDF文档 专利 一种可设置打分等级的英语作文打分方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种可设置打分等级的英语作文打分方法及系统 第 1 页 专利 一种可设置打分等级的英语作文打分方法及系统 第 2 页 专利 一种可设置打分等级的英语作文打分方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:44:32上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。