2020-2021学年高考数学 考点 第十章 统计与概率 变量间的相关关系、统计案例(理).docx
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
7 0人已下载
| 下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2020-2021学年高考数学 考点 第十章 统计与概率 变量间的相关关系、统计案例理 2020 2021 学年 高考 数学 第十 统计 概率 变量 相关 关系 案例
- 资源描述:
-
1、变量间的相关关系、统计案例 1相关关系与回归方程(1)相关关系的分类正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(3)回归方程最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法回归方程方程x是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中,是待定参数(4)回归
2、分析定义:对具有相关关系的两个变量进行统计分析的一种常用方法样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中(,)称为样本点的中心相关系数当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性2独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x
3、1,x2和y1,y2,其样本频数列联表(称为22列联表)为22列联表y1y2总计x1ababx2cdcd总计acbdabcd构造一个随机变量K2,其中nabcd为样本容量(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验概念方法微思考1变量的相关关系与变量的函数关系有什么区别?提示相同点:两者均是指两个变量的关系不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系2线性回归方程是否都有实际意义?根据回归方程进行预报是否一定准确?提示(1)不一定都有实际意义回归分析是对具有相关关系的两个变量
4、进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值1(2020新课标)某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据,2,得到下面的散点图:由此散点图,在至之间,下面四个回归方程类型中最适宜作为发芽率和温度的回归方程类型的是ABCD【答案】D【解析】由散点图可知,在至之间,发芽率和温度所对应的点在一段对数函数的曲线附近,结合选项可知,可作为发芽率和温度的回归方程类型故选2(2017山东)为了研究某班学生
5、的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为,已知,该班某学生的脚长为24,据此估计其身高为A160B163C166D170【答案】C【解析】由线性回归方程为,则,则数据的样本中心点,由回归直线方程样本中心点,则,回归直线方程为,当时,则估计其身高为166,故选3(2018新课标)如图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型根据2000年至2016年的数据(时间变量的值依次为1,2,建立模
6、型:;根据2010年至2016年的数据(时间变量的值依次为1,2,建立模型:(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由【解析】(1)根据模型:,计算时,;利用这个模型,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;根据模型:,计算时,;利用这个模型,求该地区2018年的环境基础设施投资额的预测值是256.5亿元;(2)模型得到的预测值更可靠;因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,而从2000年到2009年间递增的幅度较小些,从2010年到2016年
7、间递增的幅度较大些,所以,利用模型的预测值更可靠些1(2020河南模拟)某公司的广告费支出x与销售额y(单位:万元)之间有下列对应数据:已知y对x呈线性相关关系,且回归方程为y=6.5x+17.5,工作人员不慎将表格中y的第一个数据遗失,该数据为()x24568y40605070A28B30C32D35【答案】B【解析】设第一个数据遗失为y,由表中数据,可得:x=15(2+4+5+6+8)5,且回归方程y=6.5x+17.5,过样本中心点(x,y),即y=6.55+17.550,所以y=15(y+40+60+50+70)50,解得y30故选B2(2020衡水模拟)某公司某型号无人机以其小巧轻便
8、、高效机动、影像清晰、智能化、用途广等突出特点,得到广大用户的青睐,该型号无人机近5年销售量数据统计如表所示年份20152016201720182019年份代码x01234年销量y/万件1015203035根据表中的数据用最小二乘法求得y关于x的线性回归方程为y=6.5x+t,则可以预测2020年该型号无人机的销量大约为()A40万件B41.5万件C45万件D48万件【答案】B【解析】x=0+1+2+3+45=2,y=10+15+20+30+355=22又因为直线y=6.5x+t过点(2,22),故6.52+t22,解得t9故预测2020年该型号无人机的销量大约为y=6.55+9=41.5(万
9、件),故选B3(2020东湖区校级模拟)某产品的宣传费用x(万元)与销售额y(万元)的统计数据如表所示:宣传费用x(万元)4235销售额y(万元)4524a50根据上表可得回归方程y=9.6x+2.9,则宣传费用为3万元时,对应的销售额a为()A36.5B30C33D27【答案】D【解析】由题意产品的宣传费用x(万元)与销售额y(万元)的统计数据满足回归方程y=9.6x+2.9,则x=4+2+3+54=3.5,y=45+24+a+504=119+a4,因为回归直线经过样本中心,所以119+a4=9.63.5+2.9,解得a27,宣传费用为3万元时,y=27故选D4(2020桃城区校级模拟)已知
10、某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y3040m6570根据表中提供的全部数据,用最小二乘法得出y关于x的线性回归方程为y=7x+15,则表中m的值为()A45B50C55D60【答案】A【解析】x=2+4+5+6+85=5,y=30+40+m+65+705=205+m5,样本点的中心坐标为(5,205+m5),代入y=7x+15,得205+m5=50,解得m45,故选A5(2020吉林四模)若通过10组数据(xi,yi)(i1,2,10)得到y关于x的线性回归方程为y=3x+a,且i=110 xi=10,i=110 yi=90,则a=(
11、)A4B5C6D7【答案】C【解析】x=110i=110 xi=10=1,y=110i=110 yi=90=9,样本点的中心为(1,9),代入y=3x+a,得931+a,即a=6故选C6(2020衡水模拟)某市2015年至2019年新能源汽车年销量y(单位:百台)与年份代号x之间的关系如表所示:年份20152016201720182019年份代号x01234年销量y101520m35若根据表中的数据用最小二乘法求得y关于x的回归直线方程为y=6.5x+9,则表中m的值为()A22B25.5C28.5D30【答案】D【解析】因为x=0+1+2+3+45=2,所以y=6.52+9=22,因为回归直
12、线方程过样本中心,所以10+15+20+m+35225,解得m30故选D7(2020茂名二模)某市2015年至2019年新能源汽车年销量y(单位:百台)与年份代号x的数据如表:年份20152016201720182019年份代号x01234年销量y101520m35若根据表中的数据用最小二乘法求得y关于x的回归直线方程为y=6.5x+9,则表中m的值为()A22B25C30D无法确定【答案】C【解析】因为x=0+1+2+3+45=2,代入回归直线方程为y=6.5x+9,所以,y=6.52+9=22,于是得10+15+20+m+35225,解得m30故选C8(2020沈阳三模)已知x与y之间的几
13、组数据如表:x1234y1mn4如表数据中y的平均值为2.5,若某同学对m赋了三个值分别为1.5,2,2.5,得到三条线性回归直线方程分别为yb1x+a1,yb2x+a2,yb3x+a3,对应的相关系数分别为r1,r2,r3,下列结论中错误的是()参考公式:线性回归方程y=bx+a中,其中b=i=1n (xi-x)(yi-y)i=1n (xi-x)2,a=y-bx相关系数r=i=1n (xi-x)(yi-y)i=1n (xi-x)2i=1n (yi-y)2A三条回归直线有共同交点B相关系数中,r2最大Cb1b2Da1a2【答案】D【解析】由题意,1+m+n+410,即m+n5若m1.5,则n3
14、.5,此时x=1+2+3+44=2.5,y=2.5i=14 (xi-x)(yi-y)=(12.5)(12.5)+(22.5)(1.52.5)+(32.5)(3.52.5)+(42.5)(42.5)5.5,i=14 (xi-x)2=(1.5)2+(0.5)2+0.52+1.525,i=14 (yi-y)2=(1.5)2+(1)2+12+1.526.5则b1=5.55=1.1,a12.51.12.50.25,r1=5.556.50.93;若m2,则n3,此时x=1+2+3+44=2.5,y=2.5i=14 (xi-x)(yi-y)=(12.5)(12.5)+(22.5)(22.5)+(32.5)(
15、32.5)+(42.5)(42.5)5,i=14 (xi-x)2=5,i=14 (yi-y)2=(1.5)2+(0.5)2+0.52+1.525b2=55=1,a22.512.50,r2=555=1;若m2.5,则n2.5,此时x=1+2+3+44=2.5,y=2.5i=14 (xi-x)(yi-y)=(12.5)(12.5)+(22.5)(2.52.5)+(32.5)(2.52.5)+(42.5)(42.5)4.5,i=14 (xi-x)2=5,i=14 (yi-y)2=(1.5)2+1.524.5,r3=4.554.5=0.9由样本点的中心相同,故A正确;由以上计算可得,相关系数中,r2最
16、大,b1b2,a1a2,故B,C正确,D错误故选D9(2020雅安模拟)一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据如表可得回归方程y=8x+11,则实数a的值为()零件数x(个)2345加工时间y(分钟)30a4050A34B35C36D37【答案】C【解析】x=2+3+4+54=3.5,y=30+a+40+504=120+a4,则样本点的中心坐标为(3.5,120+a4),代入线性回归方程,得120+a4=83.5+11,解得a36故选C10(2020包头二模)对两个变量x与y进行线性相关性和回归效果分析,得到一组样本数据:(x1,y1),(
17、x2,y2),(xn,yn),则下列说法不正确的是()A残差平方和越小的模型,拟合的效果越好B由样本数据利用最小二乘法得到的回归方程表示的直线必过样本点的中心(x,y)C若变量x与y之间的相关系数r0.80,则变量x与y之间具有很强的线性相关性D用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好【答案】D【解析】对两个变量x与y进行线性相关性和回归效果分析,得到一组样本数据残差平方和越小的模型,拟合的效果越好,故A正确;由样本数据利用最小二乘法得到的回归方程表示的直线必过样本点的中心(x,y),故B正确;若变量x与y之间的相关系数r0.800.75,则变量x与y之间具有很强的线性相
18、关性,故C正确;用相关指数R2来刻画回归效果,R2越大,说明模型的拟合效果,故D错误故选D11(2020南岗区校级模拟)某市为了解中学教师学习强国的情况,调查了高中、初中各5所学校,根据教师学习强国人数的统计数据(单位:人),画出如图茎叶图(其中一个数字被污损)并从学习强国的教师中随机抽取了4人,统计了其学习强国的周平均时间(单位:小时)与年龄(单位:岁),并绘制了如图:年龄20304050周平均学校强国时间2.5344.5(I)若所调查的5所初中与5所高中学习强国的平均人数相同,求茎叶图中被污损的数字a;(II)根据表(2)中提供的数据,用最小二乘法求出周平均学习强国时间y关于年龄x的回归直
展开阅读全文
课堂库(九科星学科网)所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
链接地址:https://www.ketangku.com/wenku/file-583613.html


2019届人教A版数学必修二同步课后篇巩固探究:2-1-1 平面 WORD版含解析.docx
