分享
分享赚钱 收藏 举报 版权申诉 / 44

类型专题10.2 统计案例(解析版).docx

  • 上传人:a****
  • 文档编号:831285
  • 上传时间:2025-12-16
  • 格式:DOCX
  • 页数:44
  • 大小:2.16MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    专题10.2 统计案例解析版 专题 10.2 统计 案例 解析
    资源描述:

    1、专题10.2 统计案例题型一相关关系与相关系数题型二回归直线方程与样本中心题型三线性回归方程题型四非线性回归方程题型五误差分析题型六独立性检验题型一相关关系与相关系数例1(2022春河南省直辖县级单位高一济源高中校考期末)下列两个变量具有相关关系的是()A正方形的边长与面积B匀速行驶的车辆的行驶距离与时间C人的身高与视力D人的身高与体重【答案】D【分析】根据函数关系及相关关系的定义判断即可.【详解】对于A,由正方形的面积与边长的公式知,即正方形的边长与面积具有函数关系,故A错误;对于B,匀速行驶车辆的行驶距离与时间为,其中为匀速行驶的速度,即匀速行驶的车辆的行驶距离与时间具有函数关系,故B错误

    2、;对于C,人的身高与视力无任何关系,故C错误;对于D,人的身高会影响体重,但不是唯一因素,即人的身高与体重具有相关关系,故D正确 故选:D例2(2023春河南濮阳高二统考期末)某公司对其产品研发的年投资额(单位:百万元)与其年销售量(单位:千件)的数据进行统计,整理后得到如下统计表;123451.523.5815(1)求变量和的样本相关系数(精确到0.01),并推断变量和的线性相关程度;(参考;若,则线性相关性程度很强;若,则线性相关性程度一般,若,则线性相关性程度很弱.)(2)求年销售量关于年投资额的经验回归方程.参考公式:样本相关系数;经验回归方程中;参考数据【答案】(1),变量和线性相关

    3、性程度很强(2)【分析】(1)根据公式求出相关系数约等于,从而得到答案;(2)根据公式计算出,得到答案.【详解】(1)由题意,因为,所以因为,所以变量和线性相关性程度很强.(2)根据得,所以年销售量关于年投资额的经验回归方程为.练习1(2023春山东高三济南市章丘区第四中学校联考阶段练习)(多选)在以下4幅散点图中,所对应的成对样本数据呈现出线性相关关系的是()A B C D 【答案】AB【分析】根据数据点的分布情况直观判断是否有线性相关关系即可.【详解】A、B中各点都有线性拟合趋势,其中A样本数据正相关,B样本数据负相关;C中各点有非线性拟合趋势,D中各点分布比较分散,它们不具有线性相关.故

    4、选:AB练习2(2023秋高三课时练习)相关系数r是衡量两变量之间的线性相关程度的,对此有下列说法:越接近于1,相关程度越大;越接近于0,相关程度越小;越接近于1,相关程度越小;越接近于0,相关程度越大其中正确的是()ABCD【答案】A【分析】根据相关系数的性质可得结论.【详解】由相关系数性质:越接近于1,成对样本数据的线性相关程度越强,越接近于0,成对样本数据的线性相关程度越弱,可知正确;故选:A.练习3(2023春江苏常州高三常州高级中学校考阶段练习)(多选)某学校一名同学研究温差与本校当天新增感冒人数(人)的关系,该同学记录了5天的数据:x568912y1720252835经过拟合,发现

    5、基本符合经验回归方程,则下列说法正确的有()参考公式:相关系数公式A样本中心点为BC当时,残差为D若去掉样本点,则样本的相关系数r增大【答案】ABC【分析】根据平均数公式计算可得A正确;由计算可得B正确;根据残差的定义计算可得C正确;根据相关系数的公式分析可得D不正确.【详解】,,所以样本中心点为,则A正确;由,得,则B正确;由B知,当时,则残差为,则C正确;因为,所以,所以去掉样本点后,相关系数的公式中的分子、分母的大小都不变,故相关系数的大小不变,故D不正确.故选:ABC练习4(2023春全国高三卫辉一中校联考阶段练习)(多选)沃柑,因其口感甜柔、低酸爽口,且营养成分高,成为大家喜欢的水果

    6、之一,目前主要种植于我国广西、云南、四川、湖南等地.得益于物流的快速发展,沃柑的销量大幅增长,同时刺激了当地农民种植沃柑的热情.根据对广西某地的沃柑种植面积情况进行调查,得到统计表如下:年份t20182019202020212022年份代码x12345种植面积y/万亩814152028附:样本相关系数;为经验回归方程,.根据上表,下列结论正确的是()A该地区这5年沃柑的种植面积的方差为212B种植面积y与年份代码x的样本相关系数约为0.972(精确到0.001)Cy关于x的经验回归方程为D预测该地区沃柑种植面积最早在2027年能突破40万亩【答案】BC【分析】根据样本方差、相关系数、回归方程等

    7、知识对选项进行分析,从而确定正确答案.【详解】根据题意,得,A错误;由题意得,所以,B正确;所以,.所以y关于x的经验回归方程为,C正确;令,得,所以最小的整数为8,所以该地区沃柑种植面积最早在2025年能突破40万亩,D错误.故选:BC练习5(2023春重庆沙坪坝高三重庆一中校考期中)根据国家统计局统计,我国20182022年的新生儿数量如下:年份编号12345年份20182019202020212022新生儿数量(单位:万人)1523146512001062956(1)由表中数据可以看出,可用线性回归模型拟合新生儿数量与年份编号的关系,请用相关系数说明相关关系的强弱;(,则认为与线性相关性

    8、很强)(2)建立关于的回归方程,并预测我国2025年的新生儿数量.参考公式及数据:r=i=1nxiyinxyi=1nxi2nx2i=1nyi2ny2,b=i=1nxiyinxyi=1nxi2nx2,a=ybx,i=15yi=6206,i=15yi=6206,i=15xiyi5xy=1537,i=15xi25x2i=15yi25y21564.【答案】(1)答案见解析;(2),472.7万人.【分析】(1)求出相关系数即得解;(2)利用最小二乘法求出关于的回归方程,再预测我国2025年的新生儿数量.【详解】(1),故与的线性相关性很强.从而可以用线性回归模型拟合与的关系.(2),.故,所以,所以关

    9、于的回归方程为,将2025年对应的年份编号代入回归方程得所以我国2025年的新生儿数量约为472.7万人.题型二回归直线方程与样本中心例3(2023春上海宝山高二上海市行知中学校考期中)已知x,y的对应值如下表所示:02468113若y与x线性相关,且回归直线方程为,则_【答案】1【分析】根据线性回归方程过样本中心点直接计算即可.【详解】根据表格可知,因为y与x线性相关,且回归直线方程为,所以,得,解得.故答案为:1例4(2023春湖北武汉高二武钢三中校考阶段练习)已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除后重新求得的回归直线的斜率为,则去除后当时,的估计

    10、值为_【答案】/【分析】根据给定条件,求出去除前后的样本中心点,求出新的回归方程即可求解作答.【详解】将代入得,即样本中心点为,由数据点和知:,因此去除这两个数据点后,样本中心点不变,设新的回归直线方程为,则,即新的回归直线方程为,当时,的估计值为,所以的估计值为.故答案为:.练习6(2023上海奉贤校考模拟预测)已知一组成对数据的回归方程为,则该组数据的相关系数_(精确到0.001)【答案】【分析】一组成对数据的平均值一定在回归方程上,可求得,再利用相关系数的计算公式算出即可.【详解】由条件可得,一定在回归方程上,代入解得,故答案为:练习7(2023春山东聊城高三山东聊城一中校联考阶段练习)

    11、为研究变量的相关关系,收集得到如下数据:5678998643若由最小二乘法求得关于的经验回归方程为,则据此计算残差为0的样本点是()ABCD【答案】C【分析】先求出回归方程的样本中心点,从而可求得,再根据残差的定义可判断.【详解】由题意可得:,即样本中心点为,可得,解得,所以,可得56789986439.27.664.42.80所以残差为0的样本点是.故选:C.练习8(2023春江苏连云港高三校考阶段练习)某人工智能公司近5年的利润情况如下表所示:第年12345利润/亿元23457已知变量与之间具有线性相关关系,设用最小二乘法建立的回归直线方程为,预测该人工智能公司第6年的利润约为_亿元.【答

    12、案】7.8/【分析】分别求得,又回归直线方程必过样本中心点,可得,将代入即可得出结果.【详解】依题意,因为回归直线方程为必过样本中心点,即,解得,则回归直线方程为,当时,即该人工智能公司第6年的利润约为7.8亿元.故答案为:7.8练习9(2023春山东青岛高三青岛市即墨区第一中学统考期中)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,据统计得出了昼夜温差x()与实验室种子浸泡后的发芽数y(颗)之间的线性回归方程:,且对应数据如下表:温差x()12345发芽数y/颗3781012如果昼夜温差为13时,那么种子的发芽数大约是()A20颗B29颗C30颗D36颗【答案】B

    13、【分析】根据给定的数表,求出样本的中心点,进而求出值,再代入计算作答.【详解】依题意,于是,解得,即线性回归方程为,当时,所以昼夜温差为13时,那么种子的发芽数大约是29颗.故选:B练习10(2023春江苏淮安高三淮阴中学校联考阶段练习)用模型拟合一组数据组,其中.设,变换后的线性回归方程为,则_.【答案】【分析】根据回归直线方程,必过样本点中心,再利用换元公式,以及对数运算公式,化简求值.【详解】因为线性回归方程为恒过,因为,所以,即,所以,即.故答案为:题型三线性回归方程例5(2023春重庆北碚高三重庆市兼善中学校考阶段练习)近年来随着教育科研的不断进步,兼善中学教育质量不断提高,某知名机

    14、构对近年来升入北京航天航空大学兼善学子人数作了如下统计年份20182019202020212022时间代号人数(人)附:回归方程中,.(1)求关于t的回归方程;(2)用所求回归方程预测兼善中学2023年(t=6)升入北航的人数【答案】(1)(2)11人.【分析】(1)求线性回归方程,先求出,再根据公式求出,即可.(2)将代入回归方程即可.【详解】(1)这里又从而1.2,.故所求回归方程为.(2)将代入回归方程(人).故升入北航11人.例6(2023春陕西延安高二陕西延安中学校考期中)某校在一次强基计划模拟考试后,从全体考生中随机抽取52名,获取他们本次考试的数学成绩(x)和物理成绩(y),绘制

    15、成如图散点图:根据散点图可以看出y与x之间有线性相关关系,但图中有两个异常点A,B经调查得知,A考生由于重感冒导致物理考试发挥失常,B考生因故未能参加物理考试为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据作处理,得到一些统计的值:,其中,分别表示这50名考生的数学成绩物理成绩,2,50,y与x的相关系数(1)若不剔除A,B两名考生的数据,用52组数据作回归分析,设此时y与x的相关系数为r0试判断r0与r的大小关系(不必说明理由);(2)求y关于x的线性回归方程(系数精确到0.01),并估计如果B考生加了这次物理考试(已知B考生的数学成绩为125分),物理成绩是多少?(精确到0.1)附

    16、:线性回归方程中中:,【答案】(1),理由见解析(2);分,【分析】(1)根据已知条件,结合数据的散点图,即可求解;(2)根据已知条件,结合最小二乘法求得回归直线方程,再将代入,即可求解.【详解】(1)解:.理由如下:由图可知,变量与正相关关系,异常点会降低变量之间的线性相关程度;52个数据点与其回归直线的总偏差更大,回归效果更差,所以相关系数更小;50个数据点与其回归直线的总偏差更小,回归效果更好,所以相关系数更大;50个数据点更贴近其回归直线;52个数据点与其回归直线更离散.(2)解:由题设中的数据,可得,所以,所以,则,所以回归直线方程为,将代入回归直线方程,可得,所以估计考试的物理成绩

    17、为分.练习11(2023安徽亳州蒙城第一中学校联考模拟预测)为调查某地区植被覆盖面积x(单位:公顷)和野生动物数量y的关系,某研究小组将该地区等面积花分为400个区块,从中随机抽取40个区块,得到样本数据(),部分数据如下:x2.73.63.23.9y50.663.752.154.3经计算得:,.(1)利用最小二乘估计建立y关于x的线性回归方程;(2)该小组又利用这组数据建立了x关于y的线性回归方程,并把这两条拟合直线画在同一坐标系下,横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致.设前者与后者的斜率分别为,比较,的大小关系,并证明.附:y关于x的回归方程中,斜率和截距的最小二乘

    18、估计公式分别为: ,【答案】(1)(2),证明见解析【分析】(1)根据最小二乘法计算公式求解;(2)根据相关系数证明.【详解】(1),故回归方程为;(2)x关于y的线性回归方程为, , 则 ,r为y与x的相关系数,又,故,即,下证:,若,则,即恒成立,代入表格中的一组数据得:,矛盾,故.综上,y关于x的回归方程为.练习12(2023春陕西宝鸡高三眉县中学校考阶段练习)根据统计,某蔬菜基地西红柿亩产量的增加量(百千克)与某种液体肥料每亩使用量(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合与的关系,请计算相关系数并加以说明(若,则线性相关程度很高,可

    19、用线性回归模型拟合);(2)求关于的回归方程,并预测液体肥料每亩使用量为千克时,西红柿亩产量的增加量约为多少?附:相关系数公式,回归方程中斜率和截距的最小二乘估计公式分别为:,.【答案】(1)答案见解析;(2),9.9百千克.【分析】(1)利用给定的图象,求出相关系数公式中的相关量,再代入公式计算并判断作答.(2)利用(1)中信息,结合最小二乘法公式求出回归直线方程,再估计作答.【详解】(1)因为,因此相关系数,所以可用线性回归模型拟合与的关系.(2)由(1)知,因此,当时,所以预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为9.9百千克练习13(2023春贵州黔东南高三校考阶段练

    20、习)随着农村电子商务体系和快递物流配送体系加快贯通,以及内容电商、直播电商等模式不断创新落地,农村电商呈现高速发展的态势,下表为2017-2022年中国农村网络零售额规模(单位:千亿元),其中2017-2022年对应的代码分别为16.年份代码123456农村网络零售额12.513.717.118.020.523.02(1)根据2017-2021年的数据求农村网络零售额规模关于年度代码的线性回归方程(,的值精确到0.01);(2)若由回归方程得到的估计数据与剩下的检验数据的误差不超过1千亿,则认为得到的回归方程是“理想的”,试判断(1)中所得回归方程是否是“理想的”.参考公式:,.参考数据:,.

    21、【答案】(1)(2)回归方程是“理想的”.【分析】(1)根据题设中的公式可求线性回归方程.(2)根据(1)的结果可计算估计数据与剩下的检验数据的误差,从而可判断回归方程是否是“理想”.【详解】(1),故,故,故.(2)当,由可得对应的估计数据为,此时,故回归方程是“理想的”.练习14(2023春广东广州高三广州市真光中学校考阶段练习)某乡政府为提高当地农民收入,指导农民种植药材,并在种植药材的土地附近种草放牧发展畜牧业.牛粪、羊粪等有机肥可以促进药材的生长,发展生态循环农业.下图所示为某农户近7年种植药材的平均收入y(单位:千元)与年份代码x的折线图.并计算得到,其中.(1)根据折线图判断,与

    22、哪一个适宜作为平均收入y关于年份代码x的回归方程类型?并说明理由;(2)根据(1)的判断结果及数据,建立y关于x的回归方程,并预测2023年该农户种植药材的平均收入.附:相关系数,回归直线的斜率和截距的最小二乘法估计公式分别为:,.【答案】(1);理由见解析(2);87.39千元【分析】(1)由相关系数的计算即可由大小作出判断,(2)根据最小二乘法即可求解方程,代入即可求值.【详解】(1)因为,.对于模型,相关系数,对于模型,相关系数因为,所以适宜作为平均收入y关于年份代码x的回归方程.(2)由(1)可知回归方程类型为,由已知数据及公式可得,.所以y关于x的回归方程为,又年份代码1-7分别对应

    23、年份2016-2022,所以2023年对应年份代码为8,代入可得千元,所以预测2023年该农户种植药材的平均收入为87.39千元.练习15(2023春安徽阜阳高三安徽省临泉第一中学校考阶段练习)某城市的公交公司为了方便市民出行,科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为了研究车辆发车间隔时间x与乘客等候人数y之间的关系,经过调查得到如下数据:间隔时间(x分钟)68101214等候人数(y人)1518202423(1)易知可用线性回归模型拟合y与x的关系,请用相关系数加以说明;(2)建立y关于x的回归直线方程,并预测车辆发车间隔时间为20分钟时乘客的等候人数附:回归直线的斜率和截

    24、距的最小二乘估计分别为,;相关系数;【答案】(1)答案见解析(2),31人.【分析】(1)根据相关系数的公式,分别计算数据求解即可;(2)根据回归直线方程的参数计算公式可得关于的回归直线方程为,再代入求解即可.【详解】(1)由题意,知,所以.又,则.因为与的相关系数近似为0.95,说明与的线性相关非常高,所以可以用线性回归模型拟合与的关系.(2)由(1)可得,则,所以关于的回归直线方程为,当时,所以预测车辆发车间隔时间为20分钟时乘客的等候人数为31人.题型四非线性回归方程例7(2023陕西西北工业大学附属中学校联考模拟预测)为了反映城市的人口数量x与就业压力指数y之间的变量关系,研究人员选择

    25、使用非线性回归模型对所测数据进行拟合,并设,得到的数据如表所示,则_.x46810z2c56【答案】3【分析】由非线性回归模型和,得回归直线方程,代入样本点中心即可求值.【详解】,依题意,而回归直线方程过点,故,解得.故答案为:3例8(2023江苏镇江江苏省镇江中学校考三模)经观测,长江中某鱼类的产卵数与温度有关,现将收集到的温度和产卵数的10组观测数据作了初步处理,得到如图的散点图及一些统计量表.360表中(1)根据散点图判断,与哪一个适宜作为与之间的回归方程模型并求出关于回归方程;(给出判断即可,不必说明理由)(2)某兴趣小组抽取两批鱼卵,已知第一批中共有6个鱼卵,其中“死卵”有2个;第二

    26、批中共有8个鱼卵,其中“死卵”有3个现随机挑选一批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布列及数学期望.附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.【答案】(1)适宜,(2)分布列见解析,.【分析】(1)根据散点图判断,看出样本点分布在一条指数函数的周围,所以适宜作为与之间的回归方程模型;令,转化线性回归方程求解,进而得关于回归方程;(2)由题意,的取值为,由全概率公式求得对应的概率,从而可求分布列及数学期望.【详解】(1)根据散点图判断,看出样本点分布在一条指数函数的周围,所以适宜作为与之间的回归方程模型;令,则,关于的回归方程为.(2)由题意,设随机挑选

    27、一批,取出两个鱼卵,其中“死卵”个数为,则的取值为,设“所取两个鱼卵来自第批”,所以,设“所取两个鱼卵有个”“死卵”,由全概率公式,所以取出“死卵”个数的分布列为:012.所以取出“死卵”个数的数学期望.练习16(2023春辽宁高三辽宁实验中学校考阶段练习)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图根据散点图判断,下面四个回归模型中,最适合的是()AybxaBCD【答案】C【分析】根据样本点分布的分布情况和函数的图象特征判断.【详解】解:由散点图看出,样本点分布在开口向右

    28、的抛物线(上支)附近,整体趋势递增,单位增长率逐渐变小,所以函数较适宜,故选:C练习17(2023全国高二专题练习)规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有放回的任取一个,连续取两次,将以上过程记为一轮如果每一轮取到的两个球都是白球,则记该轮为成功,否则记为失败在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此不断继续下去,直至成功(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行

    29、该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:1234523298604020求关于的回归方程,并预测成功的总人数(精确到1);【答案】(1)分布列见解析,(2),465【分析】(1)由条件确定的取值,再求取各值的概率,由此可得分布列,再由期望公式求期望;(2)令,则,利用最小二乘法结论求,由此可得回归方程,再利用回归方程预测成功的总人数.【详解】(1)由题知,的取值可能为1,2,3,所以;所以的分布列为:123所以数学期望为(2)令,则,由题知:,所以,所以,故所求的回归方程为:,所以,估计时,;估计时,;估计时,;预测成功的总人数为.练习18(2023河北统考

    30、模拟预测)为了研究某种细菌随天数变化的繁殖个数,设,收集数据如下:天数123456繁殖个数612254995190表()3.5062.833.5317.50596.5712.08表()(1)根据表()在图中作出繁殖个数关于天数变化的散点图,并由散点图判断(,为常数)与(,为常数,且,)哪一个适宜作为繁殖个数关于天数变化的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)中的判断结果和表()中的数据,建立关于的经验回归方程(结果保留2位小数).附:对于一组数据,其经验回归直线的斜率和截距的最小二乘法估计分别为,.【答案】(1)散点图见解析;适宜.(2)【分析】(1)由已知数据即可作出散

    31、点图,据此可判断出结论;(2)由最小二乘法计算和,可得,即可求得答案.【详解】(1)由题意作出散点图如图:由散点图可知,样本点是沿指数型曲线分布,不是分布在某直线附近,故(,为常数,且,)适宜作为繁殖个数关于天数变化的回归方程类型.(2)由题意知,故,则,则,故.练习19(2023春山东聊城高三山东聊城一中校联考阶段练习)今年刚过去的4月份是“全国消费促进月”,各地拼起了特色经济”,带动消费复苏、市场回暖.“小饼烤炉加蘸料,灵魂烧烤三件套”,最近,淄博烧烤在社交媒体火爆出圈,吸引全国各地的游客坐着高铁,直奔烧烤店,而多家店铺的营业额也在近一个月内实现了成倍增长.因此某烧烤店老板考虑投入更多的人

    32、工成本,现有以往的服务人员增量x(单位:人)与年收益增量y单位:万元)的数据如下:服务人员增量x/人234681013年收益增量y/万元13223142505658据此,建立了y与x的两个回归模型:模型:由最小二乘公式可求得与的一元线性经验回归方程为;模型:由散点图(如图)的样本点分布,可以认为样本点集中在曲线的附近对数据进行初步处理后,得到了一些统计的量的值:,其中,(1)根据所给的统计量,求模型中关于的经验回归方程(精确到0.1);(2)根据下列表格中的数据,比较两种模型的决定系数,并选择拟合精度更高的模型,预测服务人员增加25人时的年收益增量回归模型模型模型回归方程182.479.2附:

    33、样本的最小二乘估计公式为,刻画样本回归效果的决定系数 【答案】(1)21.314.4(2)模型的R2小于模型,说明回归模型刻画的拟合效果更好,92.1万元【分析】(1)令,则,然后根据表中的数据和公式可求出模型中y关于x的经验回归方程;(2)由表中的数据和样本回归效果的决定系数可判断回归模型刻画的拟合效果更好,再根据模型的回归方程可预测服务人员增加25人时的年收益增量【详解】(1)令,则. 由参考数据得38.921.322.514.4,所以,模型中y关于x的经验回归方程为21.314.4(2)由表格中的数据,有182.479.2,即,模型的小于模型,说明回归模型刻画的拟合效果更好当x25时,模

    34、型的收益增量的预测值为21.314.421.3514.492.1(万元)所以预测服务人员增加25人时的年收益增量为92.1万元练习20(2023全国二三专题练习)党的二十大报告提出,从现在起,中国共产党的中心任务就是团结带领全国各族人民全面建成社会主义现代化强国、实现第二个百年奋斗目标,以中国式现代化全面推进中华民族伟大复兴.高质量发展是全面建设社会主义现代化国家的首要任务.加快实现高水平科技自立自强,才能为高质量发展注入强大动能.某科技公司积极响应,加大高科技研发投入,现对近十年来高科技研发投入情况分析调研,其研发投入y(单位:亿元)的统计图如图1所示,其中年份代码x=1,2,10分别指20

    35、13年,2014年,2022年.现用两种模型,分别进行拟合,由此得到相应的回归方程,并进行残差分析,得到图2所示的残差图结合数据,计算得到如下值:752.2582.54.512028.67表中(1)根据残差图,比较模型,的拟合效果,应选择哪个模型?并说明理由;(2)根据(1)中所选模型,求出y关于x的回归方程;根据所选模型,求该公司2028年高科技研发投入y的预报值(回归系数精确到0.01)附:对于一组数据其回归直线的斜率和截距的最小二乘估计分别为.【答案】(1)选择模型,利用见解析(2),.【分析】(1)根据残差点的分布可得出结论;(2)令,可得出,利用参考数据可求出、的值,可得出关于的回归

    36、方程,然后将代入回归方程,可得出该公司年高科投研发投入的预报值.【详解】(1)应该选择模型,理由如下:由于模型残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型带状宽度窄,所以模型的拟合精度更高,回归方程的预报精度相应就会越高,故选模型比较合适.(2)根据模型,令,研发投入与可用线性回归来拟合,有.则,所以,则关于的线性回归方程为,所以关于的回归方程为,年,即时,(亿元),所以该公司年高科技研发投入的预报值为(亿元).题型五误差分析例9(2023春河南濮阳高三统考期末)某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起,第天的高度为,测得一些数据如下表所示第天1234567高度1

    37、469111213由表格数据可得到关于的经验回归方程为,则第6天的残差为()AB2.12CD0.08【答案】A【分析】根据样本中心得回归直线方程,由残差的计算即可求解.【详解】根据线性经验回归方程过样本中心,故有,则有,此时,当时,残差,故选:A.例10(2023春浙江高二统考阶段练习)(多选)某兴趣小组研究光照时长和向日葵种子发芽数量颗之间的关系,采集5组数据,作如图所示的散点图.若去掉后,下列说法正确的是()A相关系数的绝对值变小B决定系数变大C残差平方和变大D解释变量与响应变量的相关性变强【答案】BD【分析】由图可知:较其他的点偏离直线最大,所以去掉后,回归效果更好.结合相关系数、决定系

    38、数、残差平方和以及相关性逐项分析判断.【详解】由图可知:较其他的点偏离直线最大,所以去掉后,回归效果更好.对于选项A:相关系数越接近于1,线性相关性越强,所以去掉后,相关系数的绝对值变大,故A错误;对于选项B:决定系数越接近于1,拟合效果越好,所以去掉后,决定系数变大,故B正确;对于选项C:残差平方和变大,拟合效果越差,所以去掉后,残差平方和变小,故C错误对于选项D:由选项A可知:去掉后,相关系数的绝对值变大,所以解释变量与响应变量的相关性变强,故D正确;故选:BD.练习21(2023春河南新乡高三统考阶段练习)两个变量与的回归模型中,分别选择了4个不同的模型,其中拟合效果最好的模型是()A模

    39、型1的决定系数B模型2的决定系数C模型3的决定系数D模型4的决定系数【答案】D【分析】根据决定系数的意义即可解答.【详解】决定系数越大(接近1),模型的拟合效果越好;决定系数越小,模型的拟合效果越差模型4的决定系数最大、最接近1,其拟合效果最好.故选:D.练习22(2023河南南阳南阳中学校考模拟预测)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数(其中10场为一个周期)与产品销售额(千元)的数据统计如下:直播周期数12345产品销售额(千元)37153040根据数据特点,甲认为样本点分布在指数型曲线的周围,

    40、据此他对数据进行了一些初步处理如下表:5538265978101其中,(1)请根据表中数据,建立关于的回归方程(系数精确到);(2)乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(3)由所得的结论,计算该直播间欲使产品销售额达到8万元以上,直播周期数至少为多少?(最终答案精确到1)附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,相关指数:【答案】(1)(2)乙建立的回归模型拟合效果更好(3)10【分析】(1)取对数,把非线性方程转化为线性方程,利用公式求解系数可得答案;(2)根据公式求解相关指数,比较两

    41、个方程的相关指数的大小可得结论;(3)利用乙的方程进行预测,求解不等式可得结果.【详解】(1)将两边取对数得,令,则;,根据最小二乘估计可知,;,回归方程为,即(2)甲建立的回归模型的乙建立的回归模型拟合效果更好(3)由知,乙建立的回归模型拟合效果更好设,解得,直播周期数至少为10.练习23(2023高二课时练习)已知x、y的取值如下表:x1234y32487288根据表中的数据求得y关于x的回归直线方程为,则这组数据相对于所求的回归直线方程的4个残差的方差为_【答案】【分析】先求出估计值,然后求出残差,求出残差的平均数,最后利用方差的计算公式求解即可【详解】将代入回归直线方程可得的值分别为:

    42、,所以残差分别为:残差的平均数为:,所以该组数据相对于所求的回归直线方程的4个残差的方差为:,故答案为:3.2.练习24(2023四川成都四川省成都市玉林中学校考模拟预测)如图是某企业2016年至2022年的污水净化量(单位:吨)的折线图.注:年份代码17分别对应年份20162022.(1)由折线图看出,可用线性回归模型拟合y和t的关系,请建立y关于t的回归方程,并预测2025年该企业的污水净化量;(2)请用相关指数说明回归方程预报的效果.参考数据:;参考公式:线性回归方程;相关指数:【答案】(1),58.5吨(2)答案见解析【分析】(1)结合题目数据利用最小二乘法求出线性回归直线方程,代入计

    43、算即可;(2)利用已知数据求出相关指数,利用统计知识说明即可.【详解】(1)由折线图中的数据得,所以,所以y关于t的线性回归方程为,将2025年对应的t=10代入得,所以预测2025年该企业污水净化量约为58.5吨.(2)因为,所以“污水净化量的差异”有87.5%是由年份引起的,说明回归方程预报的效果是良好的.练习25(2023全国高三专题练习)某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:根据表中的数据可得回归直线方程,以下说法正确的是()广告支出费用2.22.64.05.35.9销售量3.85.47.011.6122A销售量的多少有96%是由广告支出费

    44、用引起的B销售量的多少有4%是由广告支出费用引起的C第三个样本点对应的残差,回归模型的拟合效果一般D第三个样本点对应的残差,回归模型的拟合效果较好【答案】A【分析】根据已知条件结合残差和相关系数的定义可得答案.【详解】因为表示解释变量对于预报变量的贡献率,所以销售量的多少有96%由广告支出费用引起的,故A正确,B错误;当时,第三个样本点对应的残差为,又,故拟合效果较好,故CD错误.故选:A.题型六独立性检验例11(2023全国模拟预测)2023上海蒸蒸日上迎新跑于2023年2月19日举办,该赛事设有21.6公里竞速跑、5.4公里欢乐跑两个项目某马拉松兴趣小组为庆祝该赛事,举行一场小组内有关于马

    45、拉松知识的有奖比赛,一共有25人报名(包括20位新成员和5位老成员),其中20位新成员的得分情况如下表所示(满分30分):得分人数234641得分在20分以上(含20分)的成员获得奖品一份(1)请根据上述表格中的统计数据,将下面的列联表补充完全,并通过计算判断在20位新成员中,是否有的把握认为“获奖”与性别有关?没获奖获奖合计男4女78合计(2)若5名老成员的性别相同并全部获奖,且进行计算发现在所有参赛人员中,有的把握认为“获奖”与性别有关请判断这5名老成员的性别?附:参考公式:临界值表:0.1000.0500.0100.0012.7063.8416.63510.828【答案】(1)列联表见解

    46、析,没有的把握认为“获奖”与性别有关(2)这5名老成员全是男成员【分析】(1)完善列联表,计算出卡方即可判断;(2)分别假设名老成员的性别为女性或男性,求出相应的卡方值,即可判断.【详解】(1)依题意可得列联表如下:没获奖获奖合计男8412女718合计15520由列联表中数据,计算得到,所以没有的把握认为“获奖”与性别有关(2)当这名老成员中都为女成员时,计算得,不合题意;当名老成员都为男成员时,计算得,符合题意故这名老成员全是男成员例12(2023全国高三专题练习)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).(1)设其中两只小鼠中对照

    47、组小鼠数目为,求的分布列和数学期望;(2)测得40只小鼠体重如下(单位:g):(已按从小到大排好)对照组:17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.426.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5 27.6 28.3实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.214.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0(i)求40只小鼠体重的中位数m,并完成下面22列联表:对照组实验组(ii)根据22列联表,能否有95%的把

    48、握认为药物对小鼠生长有抑制作用.参考数据:0.100.050.0102.7063.8416.635【答案】(1)分布列见解析,(2)(i),列联表见解析;(ii)能【分析】(1)由题意可得的可能取值为,然后求出各自对应的概率,从而可求出的分布列和数学期望;(2)(i)先对这40个数按从小到大的顺序排列,找出第20个和第21个数,这两个数的平均数就是中位数,然后根据已知数据填22列联表;(ii)由列联表中的数据,根据卡方公式求出卡方,再根据临界值可得结论.【详解】(1)依题意,的可能取值为,则,所以的分布列为:故.(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后

    49、第20位与第21位数据的平均数,由于原数据已经排好,所以我们只需要观察对照组第一排数据与实验组第二排数据即可,可得第11位数据为,后续依次为,故第20位为,第21位数据为,所以,故列联表为:合计对照组61420实验组14620合计202040(ii)由(i)可得,所以能有的把握认为药物对小鼠生长有抑制作用.练习26(2023春重庆沙坪坝高三重庆一中校考期中)有两个分类变量和,其中一组观测值为如下的列联表:总计1030总计103040其中均为大于的整数,则_时,在犯错误的概率不超过0.01的前提下为“和之间有关系”.附:【答案】【分析】由题意,计算,列出不等式求出的取值范围,再根据题意求得的值.

    50、【详解】由题意知:,则,解得:或(舍去),因为:且,综上得:,所以:.故答案为:6.练习27(2023春福建三明高三三明市第二中学校考阶段练习)两个分类变量和;其列联表如表,对同一样本,的可能取值集合为能说明与有关联的可能性最大的的值为_合计3698合计14【答案】【分析】给m赋值,依次计算的预测值并比较大小即可.【详解】由列联表可知,的预测值,当时,当时,当时,当时,.又因为,所以当时,的预测值最大,说明X与Y有关联的可能性最大.故答案为:6.练习28(2023上海徐汇上海市南洋模范中学校考模拟预测)根据北京冬奥组委会与特许生产商的特许经营协议,从7月1日开始,包括冰墩墩公仔等在内的2022

    51、北京冬奥会各种特许商品将停止生产现给出某零售店在某日(7月1日前)上午的两种颜色冰墩墩的销售数据统计表(假定每人限购一个冰墩墩):蓝色粉色男顾客女顾客(1)若有99%的把握认为顾客购买的冰墩墩颜色与其性别有关,求a的最小值;(2)在(1)中a取得最小值的条件下,现从所有顾客中选出9人,记选到的人中女顾客人数为X,求X的分布及数学期望附:0.050.0100.0013.8416.63510.828【答案】(1)12(2)分布列见解析,【分析】(1)根据独立性检验,计算卡方值,与临界值比较即可求解,(2)根据超几何分布即可求解分布列,以及用超几何的期望公式即可求解.【详解】(1)因为有的把握认为顾

    52、客购买的冰墩墩颜色与其性别有关,不妨给出零假设:顾客购买的冰墩墩颜色与其性别无关,且该假设成立概率小于等于,且由表知,则,即,又,所以的最小值为12;(2)由(1)知,的最小值为12,此时女顾客一共有人,男顾客一共有人,又从所有顾客中选出9人,所以的所有可能取值是,所以的分布列为,且,其中,所以.练习29(2023春云南昆明高三昆明一中校考期中)对某校900名学生每周的运动时间进行调查,其中有男生540名,女生360名,根据性别利用分层抽样的方法,从这900名学生中选取60名学生进行分析,统计数据如下表(运动时间单位:小时)男生运动时间统计:运动时间(小时)人数98124女生运动时间统计:运动

    53、时间(小时)人数10521(1)计算,的值;若每周运动时间不低于6小时的同学称为“运动爱好者”,每周运动时间低于6小时的同学称为“非运动爱好者”,根据以上统计数据填写下面的列联表,则是否可以认为在犯错误的概率不超过的前提下认为“运动爱好者与性别有关”?男生女生合计运动爱好者非运动爱好者合计附:,0.100.050.0250.0100.0052.7063.8415.0246.6357.879(2)在抽取的60名学生样本中,从每周运动时间在的同学中任取3人,记抽到的男生人数为随机变量,求的分布列和数学期望.【答案】(1),列联表见解析,能在犯错误的概率不超过的前提下认为“运动爱好者与性别有关”(2

    54、)分布列见解析,【分析】(1)按照分层抽样求出男生、女生应该选取的人数,从而,求出列联表,计算出卡方,即可判断(2)每周运动时间在的同学中,男生有人,女生有人,从而得到随机变量可取,分别求出相应的概率,由此能求出的分布列和【详解】(1)依题意,男生应该选取名,女生应该选取名,所以,可得列联表:男生女生合计运动爱好者24832非运动爱好者121628合计362460,能在犯错误的概率不超过的前提下认为“运动爱好者与性别有关”(2)每周运动时间在的同学中,男生有人,女生有人,则随机变量可取,所以,的分布列为:0123所以练习30(2023春江苏淮安高三淮阴中学校联考阶段练习)某中学对50名学生的“

    55、学习兴趣”和“主动预习”情况进行长期调查,得到统计数据如下表所示:主动预习不太主动预习合计学习兴趣高18725学习兴趣一般61925合计242650(1)现从“学习兴趣一般”的25个学生中,任取2人,若表示其中“会主动预习”的学生的人数,求的分布列与数学期望;(2)依据小概率值的独立性检验,分析“学习兴趣”是否与“主动预习”有关.参考数据、附表及公式:,.0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828【答案】(1)分布列见解析,(2)“学习兴趣”与“主动预习”有关【分析】(1)根据超几何分布的概率公式可求出分布列,根据期望公式可得期望;(2)根据公式求出,结合临界值表可得结果.【详解】(1),随机变量X的分布列为:012所以,X的数学期望是.(2)提出零假设:假设“学习兴趣”与“主动预习”无关,因此在犯错率小于的条件下,认为“学习兴趣”与“主动预习”有关.

    展开阅读全文
    提示  课堂库(九科星学科网)所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:专题10.2 统计案例(解析版).docx
    链接地址:https://www.ketangku.com/wenku/file-831285.html
    相关资源 更多
  • 人教版一年级上册数学 期中测试卷含解析答案.docx人教版一年级上册数学 期中测试卷含解析答案.docx
  • 人教版一年级上册数学 期中测试卷含精品答案.docx人教版一年级上册数学 期中测试卷含精品答案.docx
  • 人教版一年级上册数学 期中测试卷含答案解析.docx人教版一年级上册数学 期中测试卷含答案解析.docx
  • 人教版一年级上册数学 期中测试卷含答案下载.docx人教版一年级上册数学 期中测试卷含答案下载.docx
  • 人教版一年级上册数学 期中测试卷含答案.docx人教版一年级上册数学 期中测试卷含答案.docx
  • 人教版一年级上册数学 期中测试卷含下载答案.docx人教版一年级上册数学 期中测试卷含下载答案.docx
  • 人教版一年级上册数学 期中测试卷可打印.docx人教版一年级上册数学 期中测试卷可打印.docx
  • 人教版一年级上册数学 期中测试卷及解析答案.docx人教版一年级上册数学 期中测试卷及解析答案.docx
  • 人教版一年级上册数学 期中测试卷及精品答案.docx人教版一年级上册数学 期中测试卷及精品答案.docx
  • 人教版一年级上册数学 期中测试卷及答案(考点梳理).docx人教版一年级上册数学 期中测试卷及答案(考点梳理).docx
  • 人教版一年级上册数学 期中测试卷及答案(网校专用).docx人教版一年级上册数学 期中测试卷及答案(网校专用).docx
  • 人教版一年级上册数学 期中测试卷及答案(精选题).docx人教版一年级上册数学 期中测试卷及答案(精选题).docx
  • 人教版一年级上册数学 期中测试卷及答案(精品).docx人教版一年级上册数学 期中测试卷及答案(精品).docx
  • 人教版一年级上册数学 期中测试卷及答案(有一套).docx人教版一年级上册数学 期中测试卷及答案(有一套).docx
  • 人教版一年级上册数学 期中测试卷及答案(最新).docx人教版一年级上册数学 期中测试卷及答案(最新).docx
  • 人教版一年级上册数学 期中测试卷及答案(易错题).docx人教版一年级上册数学 期中测试卷及答案(易错题).docx
  • 人教版一年级上册数学 期中测试卷及答案(新).docx人教版一年级上册数学 期中测试卷及答案(新).docx
  • 人教版一年级上册数学 期中测试卷及答案(必刷).docx人教版一年级上册数学 期中测试卷及答案(必刷).docx
  • 人教版一年级上册数学 期中测试卷及答案(夺冠).docx人教版一年级上册数学 期中测试卷及答案(夺冠).docx
  • 人教版一年级上册数学 期中测试卷及答案(夺冠系列).docx人教版一年级上册数学 期中测试卷及答案(夺冠系列).docx
  • 人教版一年级上册数学 期中测试卷及答案(历年真题).docx人教版一年级上册数学 期中测试卷及答案(历年真题).docx
  • 人教版一年级上册数学 期中测试卷及答案(典优).docx人教版一年级上册数学 期中测试卷及答案(典优).docx
  • 人教版一年级上册数学 期中测试卷及答案(全国通用).docx人教版一年级上册数学 期中测试卷及答案(全国通用).docx
  • 人教版一年级上册数学 期中测试卷及答案(全优).docx人教版一年级上册数学 期中测试卷及答案(全优).docx
  • 人教版一年级上册数学 期中测试卷及答案解析.docx人教版一年级上册数学 期中测试卷及答案解析.docx
  • 人教版一年级上册数学 期中测试卷及答案参考.docx人教版一年级上册数学 期中测试卷及答案参考.docx
  • 人教版一年级上册数学 期中测试卷及答案免费下载.docx人教版一年级上册数学 期中测试卷及答案免费下载.docx
  • 人教版一年级上册数学 期中测试卷及答案免费.docx人教版一年级上册数学 期中测试卷及答案免费.docx
  • 人教版一年级上册数学 期中测试卷及答案下载.docx人教版一年级上册数学 期中测试卷及答案下载.docx
  • 关于我们 - 联系我们 - 加入我们 - 常用工具与软件 - 公益活动

    copyright@ 2020-2024 www.ketangku.com网站版权所有

    黑ICP备2024021605号-1