数学人教A版选修2-3教案:3.1回归分析的基本思想及其初步应用第二课时 WORD版含解析.doc
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5 0人已下载
| 下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学人教A版选修2-3教案:3.1回归分析的基本思想及其初步应用第二课时 WORD版含解析 学人 选修 教案 3.1 回归 分析 基本 思想 及其 初步 应用 第二 课时 WORD 解析
- 资源描述:
-
1、第二课时教学目标知识与技能从相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤过程与方法在发现直接求回归直线方程存在缺陷的基础上,引导学生去发现解决问题的新思路进行回归分析,进而介绍残差分析的方法和利用R2来表示解释变量对于预报变量变化的贡献率情感、态度与价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,掌握处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神培养学生运用所学知识解决实际问题的能力教学中适当地利用学生的合作与交流,使学生在学习的同时,体会与他人合作的重要性重点难点教学重点:从残差分析、相关指数角度探讨回归模型的拟合效果,
2、以及建立回归模型的基本步骤;教学难点:了解评价回归效果的两个统计量:相关指数、残差和残差平方和(幻灯片)编号12345678身高/cm165165157170175165155170体重/kg4857505464614359上表是上一节课我们从某大学选取8名女大学生其身高和体重数据组成的数据表,在上一节课中我们通过数据建立了回归直线方程,并根据方程预测了身高为172 cm的女大学生的体重当时,我们提到根据回归直线方程求得的体重数据,仅是一个估计值,其与真实值之间存在着误差,为了综合分析身高和体重的关系,我们引入了线性回归模型ybxae来表示两变量之间的关系,其中e为随机变量,又称随机误差线性回
3、归模型ybxae增加了随机误差项e,因变量y的值由自变量x和随机误差e共同确定假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上但是,在图中,数据点并没有完全落在回归直线上这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上“推”开了,即自变量x只能解释部分y的变化同学们考虑一下,随机变量e的均值是多少?方差又是多少?活动设计:学生思考回答问题学情预测:学生回答E(e)0,D(e)20.教师提问:能否通过D(e)来刻画线性回归模型的拟合程度?学情预测:随机误差e的方差越小,通过回归直线预报真实值y的精度越高随机误差是引起预报值与真实值
4、y之间的误差的原因之一,其大小取决于随机误差的方差设计意图:说明研究随机误差e的必要性,通过研究随机误差e可以分析预报值的可信度提出问题:既然可以用随机变量e的方差来衡量随机误差的大小,即通过方差2来刻画预报变量(体重)的变化在多大程度上与随机误差有关,那么如何获得方差2呢?学生活动:学生独立思考,小组合作交流讨论活动结果:可以采用抽样统计的思想,通过随机变量e的样本来估计2的大小设计目的:复习抽样统计思想,以便通过随机变量e的样本来估计总体提出问题:既然e表示了除解释变量以外其他各种影响预报值的因素带来的误差,那么如何获得e的样本来计算2呢?学生活动:分组合作讨论交流学情预测:由函数模型 x
5、 和回归模型ybxae可知ey ,这样根据图表中女大学生的身高求出预报值,再与真实值作差,即可求得e的一个估计值教师:由于在计算回归直线方程时,利用公式求得的 和 为斜率和截距的估计值,它们与真实值a和b之间存在误差,因此 是估计值,所以 y 也是一个估计值由上可知,对于样本点(x1,y1),(x2,y2),(xn,yn)而言,它们的随机误差为eiyibxia,i1,2,n,称其估计值 iyi i为相应于点(xi,yi)的残差将所有残差的平方加起来,即 ,这个和称作残差平方和类比样本方差估计总体方差的思想,可以用 2 (yi i)2(n2)作为2的估计量,通常, 2越小,预报精度越高这样,当我
6、们求得回归直线方程后,可以通过残差来判断模型拟合程度的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析设计目的:通过问题诱思,引入残差概念提出问题:对照女大学生的身高和体重的原始数据,结合求出的回归直线方程,求出相应的残差数据学生活动:独立完成活动结果:编号12345678身高( cm)165165157170175165155170体重( kg)4857505464614359残差 6.3732.6272.4194.6181.1376.6272.8830.382提出问题:根据表格中的数据,以样本编号为横坐标,残差值为纵坐标,做出散点图(这样的散点图称作残差图)学生活动:分组
7、合作,共同完成活动结果:残差图提出问题:观察上面的残差图,你认为哪几个样本点在采集时可能存在人为的错误?为什么?学生活动:分组讨论活动结果:第一个和第六个样本点在采集过程中可能存在错误,因为其他的样本点基本都集中在一个区域内,只有这两个样本点的残差比较大,相对其他样本点来说,分布得较为分散提出问题:如何从残差图来判断模型的拟合程度?学生活动:独立思考也可相互讨论活动结果:因为 2越小,预报精度越高,即模型的拟合程度越高,而 2越小, 的取值越集中,故若残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,且带状区域的宽度越窄,说明拟合精度越高,回归直线的预报精度越高教师:在统计学上,人
8、们经常用相关指数R2来刻画回归的效果,其计算公式是:R21提出问题:分析上面计算相关指数R2的公式,如何根据R2来判断模型的拟合效果?学生活动:独立思考也可相互讨论,教师加以适当的引导提示活动结果:因为对于确定的样本数据而言,(yi)2是一个定值,故R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好提出问题:在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近1,表示回归的效果越好,即解释变量和预报变量的线性相关性越强,试计算关于女大学生身高与体重问题中的相关指数R2.学生活动:学生独立计算获得数据活动结果:R20.64.根据R20.64就可得出“女大学生的身高解
9、释了64%的体重变化”,或者说“女大学生的体重差异有64%是由身高引起的”由此就不难理解为什么预报体重和真实值之间有差距了设计目的:结合图象,让学生直观感受残差图在刻画回归模型拟合效果方面的应用,体会残差分析和相关指数的意义提出问题:根据前面得到的回归方程,能否预测一名美国女大学生的体重?建立回归模型后能否一劳永逸,在若干年后还可以使用,或者适用于多年以前的女大学生体重预测?学生活动:讨论交流总结发言活动结果:在使用回归方程进行预报时要注意:(1)回归方程只适用于我们所研究的样本的总体;(2)我们建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程
10、得到的预报值就是预报变量的精确值提出问题:结合我们刚学习的概念,现在能否将建立回归模型的步骤补充完整?学生活动:讨论交流,合作完成活动结果:一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)(4)按一定规则(如最小二乘法)估计回归方程中的参数(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性,等等)若存在异常,则检查数据是否有误,或模型是否合适等设
展开阅读全文
课堂库(九科星学科网)所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
链接地址:https://www.ketangku.com/wenku/file-529110.html


2019届人教A版数学必修二同步课后篇巩固探究:2-1-1 平面 WORD版含解析.docx
