(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210426140.X
(22)申请日 2022.04.22
(71)申请人 珠海翼字科技有限公司
地址 519085 广东省珠海市高新区唐家湾
镇香山路88号二栋15层15 04室
(72)发明人 陈涯 牛颖 蒋东辰 康鑫
隗艳萍 孙艳
(74)专利代理 机构 北京科迪生专利代理有限责
任公司 1 1251
专利代理师 金怡
(51)Int.Cl.
G06F 40/284(2020.01)
G06F 40/253(2020.01)
G06F 40/216(2020.01)
G06F 40/211(2020.01)G06F 40/30(2020.01)
G06Q 10/06(2012.01)
G06Q 50/20(2012.01)
(54)发明名称
一种可设置打分等级的英语作文打分方法
及系统
(57)摘要
本发明涉及一种可设置打分等级的英语作
文打分方法及系统, 其方法包 括: S1: 设置英语等
级的各个等级中的单词、 语法、 主题度和流畅度
等级的分值范围; 用户输入起始等级, 根据该起
始等级得到对应的单词、 语法、 主题度和流畅度
的等级, 并输入至少一篇待打分英文作文; S2: 对
待打分英文作文进行预处理, 获取其中的句子、
单词和实体; S3: 基于单词、 句子、 待打分英文作
文和实体分别计算待打分英文作文对应的单词、
语法、 主题度以及流畅度的等级; S4: 基于起始等
级和待打分英文作文的单词、 语法、 主题度以及
流畅度等级进行加权计算, 得到最终的作文分
数。 本发明提供的方法根据不同水平的英语学习
者采用了不同的标准来进行打分, 该打分方法更
灵活, 更具实用性。
权利要求书3页 说明书7页 附图4页
CN 114841149 A
2022.08.02
CN 114841149 A
1.一种可设置打 分等级的英语作文打 分方法, 其特 征在于, 包括:
步骤S1: 设置英语等级的各个等级中的单词等级Word、 语法等级KPG、 主题度等级TC和
流畅度等级Fluency的分值范围; 用户输入其起始等级, 根据该起始等级, 得到该起始等级
对应的单词等级WordBase、 语法等级KPGBase、 主题度等级TCBase和流畅度等级FluencyBase, 并
输入至少一篇待打分英文作文; 其中, 所述英语等级包括: 小学等级、 初中等级、 高中等级、
大学四级和大 学六级;
步骤S2: 对所述待打 分英文作文 进行预处理, 获取其中的句子、 单词和实体;
步骤S3: 基于所述单词、 句子、 待打分英文作文和实体分别 进行词汇分析、 语法点分析、
主题度分析以及流畅度分析, 得到所述待打分英文作文对应的单词等级、 语法等级、 主题度
等级以及流畅度等级;
步骤S4: 基于所述起始等级和所述待打分英文作文的单词等级、 语法等级、 主题度等级
以及流畅度等级 进行加权计算, 得到最终的作文分数。
2.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤
S2: 对所述待打 分英文作文 进行预处理, 获取其中的句子、 单词和实体, 具体包括:
对每一篇所述待打分的英文作文, 使用StanfordNLPCore工具进行处理, 获取其 中的句
子存储于句子集合SentenceList, 单词存储于单词集合WordsList, 以及实体存储于实体集
合EntityL ist。
3.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤
S3中基于所述单词进行词汇分析, 得到所述待打 分英文作文对应的单词等级, 具体包括:
步骤S301 : 基于所述单词集合WordsList , 获取每个所述单词的难度值
WordDifficulty;
步骤S302: 将所有所述单词按照其难度值降序排列, 取前m%, 通过累加求和取平均的
方法, 计算前m%单词的平均难度值AveWordDifficult, 根据所述平均难度值获取其对应的
单词等级W ordtarget。
4.根据权利要求2所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤
S301: 获取所述单词的难度值, 具体包括:
步骤S3011: 获取已有公开的英语语料, 对所述英语语料进行分句和分词, 统计其中所
有单词及其使用频率, 得到词典Dict ionary、 词频m与总词数M, 以及每个单词对应的单词等
级N;
步骤S3012: 获取WordsList中每个单词wordi的词频mi以及词总数M, 根据公式(1), 可计
算得到wordi的信息量 Infoi:
Infoi=log2(1/pi) (1)
其中, pi为单词Wordi的频率, pi=mi/M;
步骤S3013: 根据公式(2), 可计算得到w ordi的难度值 WordiDifficulty:
WordiDifficulty=(a*I nfoi)+N (2)
其中, a为预设的系数, I nfoi为单词wordi的信息量, N 为wordi所对应的单词等级。
5.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤
S3中基于所述句子进行语法点分析, 得到所述待打 分英文作文对应的语法等级, 具体包括:
步骤S311 : 遍历所述句子集合SentenceList, 以每个句子为单位, 利用权 利 要 求 书 1/3 页
2
CN 114841149 A
2StanfordNLP Core工具对 所述句子进行分析, 得到句法结构, 并根据所述句法结构与其对应
英语等级的关系Map, 将其对应的英语等级存放于KPGL ist;
步骤S312: 将KPGList按照降序排序, 取前m%, 累加求和取平均, 根据该平均值获取对
应的语法等级KPGTarget。
6.根据权利要求5所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤
S311中构建句法结构与其对应英语等级的关系Map, 具体包括:
步骤S3111: 根据中小学英语教学大纲、 大学四级和六级考试要求, 获取不同英语等级
的语法知识点; 利用StanfordN LPCore工具, 分析 得到所述语法知识点的句法结构;
步骤S3112: 基于所述句法结构, 构建与其对应英语等级的关系Map。
7.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤
S3中对所述待打分的英文作文进 行主题度分析, 得到所述待打分英文作文对应的主题度等
级, 具体包括:
步骤S321: 收集已有 的不同级别的英语作文, 按照其对应的等级划分为不同的等级集
合Set1、 Set2、 Set3, Set4、 Set5;
步骤S322: 获取所述等级集合中每一篇英文作文, 根据所述英文作文的主题Topic或者
将所述英文作文的第一句作为其主题Topic, 去掉所述主题Topic中的停止词, 得到词袋
WordsBag=[Word1,Word2,…,Wordn]; 根据公式(3), 计算所述英文作文的主题向量:
其中, Ii为Wordi对应的该词信息量Infoi, Vi为基于Skip ‑gram模型计算得到Wordi的多
维词向量, n 为词袋WordsBag中单词的个数;
步骤S323: 获取所述英文作文中的每个句子, 重复步骤S322, 计算其句向量, 并存储于
SenVecList;
步骤S324: 根据公式(4), 计算SenVecList中的句向量与主题向量 的夹角距离并求和,
记为Dist ance; 如果用采用第一句话作为主题句, 则计算除第一句以外的句子的句向量与
主题向量的夹角距离并求和:
其中, n为总句数; VT为主题向量; Vi为句向量;
步骤S325: 将Distance除以所述英文作文总句数n, 得到平均夹角距离; 如果用第一句
作为主题, 则除以n ‑1; 所述平均夹角距离作为该篇英文作文的主题度Topic Conformity;
步骤S326: 计算每个等级集合Seti中所有英文作文的主题度, 去掉分数最高的n%和得
分最低的n%后, 累加所述等级集合中剩余英文作文的主题度并除以剩下的作文 数量, 求得
每个所述等级集合的平均主题度, 作为该等级所对应的主题度;
步骤S327: 根据所述待打分英文作文, 重复步骤S322~S325计算得到其主题度, 获取该
主题度所对应的主题度等级 TCTarget。
8.根据权利要求1所述的可设置打分等级的英语作文打分方法, 其特征在于, 所述步骤
S3中对所述实体进行流畅度分析, 得到所述待打 分英文作文对应的流畅度等级, 具体包括:
步骤S331: 使用StandfordNLPCore, 对于步骤S321得到不同的等级集合Set1、 Set2、权 利 要 求 书 2/3 页
3
CN 114841149 A
3
专利 一种可设置打分等级的英语作文打分方法及系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:44:32上传分享