用K均值法对自考考生流失的研究.pdf
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
9 0人已下载
| 下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 均值 自考 考生 流失 研究
- 资源描述:
-
1、用均值法对自考考生流失的研究摘要:高等教育自学考试(自考)是我国高等教育的一种重要形式,考生流失是自考的一种普遍现象。流失原因分析对自考管理方法的改革有着重要的意义。文章尝试采用聚类分析中 K-Means 方法对北京市自考考生流失的多重因素进行分析,揭示出自考考生流失的一些规律。关键词:数据挖掘;K-均值;高等教育自学考试;考生流失;聚类引言数据挖掘(Data Mining)指的是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘与知识发现技术是计算机领域一个非常有活力的研究课题,其研究成果已广泛应用于金融、医疗保
2、健、零售、制造业、工程与科学等行业。考生流失是自考的一种普遍现象,分析流失原因对自考管理方法的改革有着重要意义。一些研究人员采用分类统计等研究方法,从公共课成绩入手分析流失的规律,对该问题进行了基础性的研究。本文采用数据挖掘中的聚类分析方法寻找高等教育自学考试考生各种属性和考生流失之间的联系,希望能为相关机构提供浓缩的数据归纳结果和有效的建议,更好地服务于教育机构,服务于考生。1、流失定义与流失考生数据提取自学考试的考试时间完全可以由考生自己选择,学制没有明确的期限,考生流失既不需要到相关部门认定,也不保证以后不会再来参加考试。也就是说不再参加考试的考生在学籍中不会有记载,而且过了很长时间(2
3、、3 年)后也许会重新参加考试。因此研究自学考试考生流失就必须对流失考生加以明确定义。首先定义两个概念:“跨度”和“暂停期”。“跨度”定义为考生参加第一门课程考试与参加最后一门课程考试的时间间隔(单位为月);“暂停期”定义为考生两门课程考试间隔的最大时间(单位为月)。图 1、图 2 分别是北京市 12658 名自考已毕业的考生“跨度”和“暂停期”的统计数据,其中专科 8859 人,他们中 99.5以上的毕业生跨度为 66 个月,94.1以上的毕业生的暂停期为 24 个月;本科 3799 人,他们中 99.3以上的毕业生跨度为 66 个月,95.0以上的毕业生的暂停期为 24 个月。因此在研究中定义 66 个月和 24 个月作为“跨度”和“暂停期”的流失阈值 A 和 B。自考考生流失的定义:跨度大于等于 A(66 个月)且最后一门课程考试距当前最近一次考试时间大于等于 B(24 个月)的考生即为流失考生。根据上述定义,从还未毕业的 18050 名考生中筛选出 12545 名流失考生。总流失率为69.5。其中专科流失率为 72,本科流失率为 54.3。(注:其中专本同时报考的考生人数为 1275 人。)注:本文中所涉及到的图表、注解、公式等内容请以 PDF 格式阅读原文
展开阅读全文
课堂库(九科星学科网)所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。


2019届人教A版数学必修二同步课后篇巩固探究:2-1-1 平面 WORD版含解析.docx
