国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210359959.9 (22)申请日 2022.04.07 (71)申请人 南京航空航天大 学 地址 210016 江苏省南京市秦淮区御道街 29号 (72)发明人 沈国华 杨思恩 黄志球 李广龙 李锐 蔡茂东 (74)专利代理 机构 南京苏高专利商标事务所 (普通合伙) 32204 专利代理师 孟红梅 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/20(2012.01) G06F 16/2458(2019.01) G06F 16/242(2019.01)G06F 16/22(2019.01) G06F 16/215(2019.01) G06F 40/216(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 一种基于学生画像的编程成绩预测方法与 系统 (57)摘要 本发明公开了一种基于学生画像的编程成 绩预测方法与系统, 包括: 获取学生编程数据并 进行预处理; 生成包括个人信息、 编程技能和学 习记录的学生画像; 其中编程技能包括擅长题 型、 代码质量、 代码风格和时空消耗, 学习记录包 括总提交数、 总通过数、 实验分数和正确率; 计算 代码质量问题总数、 总提交数等数值的中位数, 并进行异常判定, 同时利用克隆检测技术检测标 记为异常的学生提交的代码与其他学生提交的 代码之间的相似性, 若相似性超过设定阈值, 则 删除该学生的数据; 构建深度神经网络, 并使用 删除异常数据之后的数据集进行网络训练, 得到 训练好的编程成绩预测模型。 本发 明能够更全面 准确地进行编程成绩预测, 并能减少抄袭代码对 成绩预测的影响。 权利要求书2页 说明书7页 附图2页 CN 114662779 A 2022.06.24 CN 114662779 A 1.一种基于学生画像的编程成绩预测方法, 其特 征在于, 包括如下步骤: (1)从在线测评系统获取学生编程数据, 包括学生个人信息、 问题信息和学生的提交数 据; 其中问题信息包括问题描述、 问题类型和测试用例, 学生的提交数据包括问题结果、 源 代码和实验分数; (2)对获取的数据进行 预处理, 包括归一 化、 编码和处 理缺失值; (3)生成学生画像, 包括个人信息、 编程技能和学习记录; 其中编程技能包括擅长题型、 代码质量、 代码风格和时空消耗, 学习记录包括总提交数、 总通过 数、 实验分数和正确率; (4)计算代码质量问题总数中位数、 总提交数中位数、 总通过数中位数和实验分数中位 数, 将期末成绩不合格且符合异常判定条件的学生数据设置为异常数据; 并利用克隆检测 技术检测标记为异常的学生提交的代码与其他学生提交的代码之 间的相似性, 若相似性超 过设定阈值, 则 删除该学生的数据; (5)构建深度神经网络, 并使用删除异常数据之后的数据集进行网络训练, 得到训练好 的编程成绩预测模型。 2.根据权利要求1所述的基于学生画像的编程成绩预测方法, 其特征在于, 所述编程技 能中擅长题型根据学生对于每一类型编程问题的答题准确率得出, 准确率越高则视为越擅 长该题型; 时空消耗从每次学生的提交记录中读取, 最终计算平均值。 3.根据权利要求1所述的基于学生画像的编程成绩预测方法, 其特征在于, 所述编程技 能中代码质量通过使用质量检查工具对数据库中学生所提交的代码进 行度量, 从而获得该 学生对每一类型代码质量问题出现的次数; 代码风格通过使用自然语言分析工具对数据库 中学生所提交的代码进行文本处理, 从而获得该学生书写代码时的命名风格、 注释使用情 况及缩进情况。 4.根据权利要求1所述的基于学生画像的编程成绩预测方法, 其特征在于, 所述学习记 录中总提交数与总通过数根据数据库中每名学生的每条记录求和计算得出; 实验分数可根 据每次实验的最 终得分计算得出, 最 终得分取的是每名学生在规定时间内能够获取的最高 分; 正确率 通过提交数与通过 数计算得 出。 5.根据权利要求1所述的基于学生画像的编程成绩预测方法, 其特征在于, 异常判定条 件为: 其中flag值为1时表示数据异常, mcq、 msn、 man、 mcs分别为代码质量问题总数中位数、 总提 交数中位数、 总通过数中位数和实验分数中位数, scq、 ssn、 san、 scs分别为学生的代码质量问 题总数、 总提交数、 总通过 数和实验分数。 6.根据权利要求1所述的基于学生画像的编程成绩预测方法, 其特征在于, 还将标记为 异常的学生提交的代码与所收集的代码库中的代码之 间进行比较, 将相似性超过设定阈值 的学生的数据删除。 7.根据权利要求1所述的基于学生画像的编程成绩预测方法, 其特征在于, 深度神经网权 利 要 求 书 1/2 页 2 CN 114662779 A 2络采用全连接的四层网络结构, 包括输入层, 两个隐藏层和输出层, 使用线性整流函数作为 激活函数, 使用均方根传递 算法作为优化 函数。 8.一种基于学生画像的编程成绩预测系统, 其特 征在于, 包括: 数据获取模块, 用于从在线测评系统获取学生编程数据, 包括学生个人信息、 问题信 息 和学生的提交数据; 其中问题信息包括问题描述、 问题类型和测试用例, 学生的提交数据包 括问题结果、 源代码和实验分数; 预处理模块, 用于对获取的数据进行预处理, 包括归一化、 编码和处理缺失值; 以及生 成学生画像, 包括个人信息、 编程技能和学习记录; 其中编程技能包括擅长题型、 代码质量、 代码风格和时空消耗, 学习记录包括总提交数、 总通过 数、 实验分数和正确率; 异常处理模块, 用于计算代码质量问题总数中位数、 总提交数中位数、 总通过数中位数 和实验分数中位数, 将期末成绩不合格且符合异常判定条件的学生数据设置为异常数据; 并利用克隆检测 技术检测标记为异常的学生提交的代码与其他学生提交的代码之间的相 似性, 若相似性超过设定阈值, 则 删除该学生的数据; 以及, 编程成绩预测模块, 用于构建深度神经网络, 并使用删除异常数据之后的数据集 进行网络训练, 得到训练好的编程成绩预测模型。 9.一种计算机系统, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述计算机程序被加载至处理器时实现根据权利要求 1‑7任一项所 述的基于学生画像的编程成绩预测方法的步骤。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现根据权利要求1 ‑7任一项所述的基于学生画像的 编程成绩预测方法的步骤。权 利 要 求 书 2/2 页 3 CN 114662779 A 3
专利 一种基于学生画像的编程成绩预测方法与系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:45:16
上传分享
举报
下载
原文档
(816.9 KB)
分享
友情链接
GB-T 35164-2017 用于水泥、砂浆和混凝土中的石灰石粉.pdf
GB-T 19483-2016 无绳电话的电磁兼容性要求及测量方法.pdf
信通院 量子信息技术发展与应用研究报告.pdf
专利 一种温控器.PDF
GB-T 33674-2017 气象数据集核心元数据.pdf
GB-T 25068.4-2022 信息技术 安全技术 网络安全 第4部分:使用安全网关的网间通信安全保护.pdf
DB37-T 3642-2019 全氟己酮灭火系统设计、施工及验收规范 山东省.pdf
GB-T 36456.3-2018 面向工程领域的共享信息模型 第3部分:测试方法.pdf
GB-T 7826-2012 系统可靠性分析技术 失效模式和影响分析 FMEA 程序.pdf
JR-T 0191-2020 证券期货业软件测试指南 软件安全测试.pdf
GB-T 39622-2020 挖泥船重力抓斗.pdf
GB-T 8013.1-2018 铝及铝合金阳极氧化膜与有机聚合物膜 第1部分:阳极氧化膜.pdf
GB-T 43236-2023 城市生态风险评价技术指南.pdf
T-XLTDA 005—2021 地方特色乳制品 风味奶酪.pdf
T-GDAEPI 01—2019 固定污染源自动监控系统运行服务规范.pdf
GB-T 36351.2-2018 信息技术 学习、教育和培训 教育管理数据元素 第2部分:公共数据元素.pdf
GY-T 352-2021 广播电视网络安全等级保护基本要求.pdf
GB-T 28583-2012 供电服务规范.pdf
NIST SP 800-210 云系统通用访问控制指南 .pdf
GB-T 42331-2023 潮流能发电装置技术成熟度评估导则.pdf
1
/
3
12
评价文档
赞助2.5元 点击下载(816.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。