基于决策树技术的高校程序设计课程成绩预测分析研究开题报告
1. 研究目的与意义
在学生生活以及教师教学过程中往往积累了大量的数据,但目前对这些数据的处理还停留在初级的数据备份、查询及简单统计阶段.不能发挥它应有的作用.如对学生成绩的分析处理一般仅仅是统计成绩为优、良、一般、差等级别的人数,对于学生取得这些成绩的原因往往无法了解.鉴于社会对高等学校发展的需求和目前高校数据管理现状,利用这些数据理性的分析学校各方面工作的成效以及学生培养过程中的得失变的十分重要。本课题提出了一种应用决策树技术来挖掘隐藏在学生成绩背后有价值信息的研究方案,通过对大量原始数据信息的挖掘处理,找出最能影响学生成绩的因素,目的是为教师今后的教学工作提供重要的决策依据。
2. 课题关键问题和重难点
【关键问题】
(1) 数据的收集:怎样收集大量的数据为建模提供基础。
(2) 数据的处理:在大量的数据中怎么样提取到相对准确的,规范的数 据。
3. 国内外研究现状(文献综述)
【国内现状】 数据挖掘作为人工智能与数据库分析研究的新领域,近些年来,数据挖掘技术理论和应用研究得到了进一步的发展,并引起了国内外研究人士的高度关注。而随着计算机对数据的采集、处理、存储能力的不断提高,数据量也在不断增加,传统数据分析工具难以满足现如今的数据处理需求,数据挖掘技术在这种形势下诞生了。中国科研人员对数据挖掘进行几年的研究,并在理论研究与实际应用方面获得了一定的成绩,但是相关数据挖掘技术成功的应用还是偏少。
1993年国家自然科学基金首次支持中科院合肥分院对该领域的研究项目,目前从事数据挖掘的研究人员主要在大学,也有部分在研究所或公司。研究领域一般集中在学习算法的研究、数据挖掘的实际应用以及有关数据挖掘理论方面的研究。目前大多数的研究项目是由政府资助进行的,如国家自然科学基金、863计划、九五计划等。
我国近几年成立的专门的数据挖掘研究机构有:sas数据挖掘卓越中心,中国科大博纳数据挖掘、厦门大学数据挖掘中心、复旦大学数据挖掘实验室、南京大学机器学习与数据挖掘研究组等
4. 研究方案
该课题的研究是基于决策树技术、以web的方式展现的应用,以浏览器作为客户端与服务器进行交互。将学生的学习行为习惯作为数据采集到数据库中,通过决策树技术进行处理、建模。再将建模的模型预测学生的学习行为习惯对学习成绩的影响。决策树技术是核心,以web应用的形式服务于师生。
5. 工作计划
第1周: 撰写开题报告和完成外文翻译。
第2周: 进行课题总体规划和课题的详细设计。
第3-5周: 进行课题模块化设计并进行模块代码编写与调试。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。