某单位有员工120人,其中女员工有72人,为做某项调查,拟采用分层抽样抽取容量为15的样本,则男员工应选取的人数是( )
A.5 B.6 C.7 D.8
B
【解析】
试题分析:男员工应抽取的人数为,故选B.
考点:分层抽样.
【方法点晴】本题主要考查了分层抽样方法及其应用,分层抽样中各层抽取个数依据各层个体数之比来分配,这是分层抽样的最主要的特点,首先各确定分层抽样的个数,分层后,各层的抽取一定要考虑到个体数目,选取不同的抽样方法,但一定要注意按比例抽取,牢记分层抽样的特点和方法是解答的关键,着重考查了学生的分析问题和解答问题的能力.
甲、乙两位同学在高一年级的5次考试中,数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是,则下列叙述正确的是( )
A.,乙比甲成绩稳定
B.,甲比乙成绩稳定
C.,乙比甲成绩稳定
D.,甲比乙成绩稳定
C
【解析】
甲的平均成绩,甲的成绩的方差
;
乙的平均成绩,乙的成绩的方差
.
∴,乙比甲成绩稳定.
故选C.
从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:
身高x/cm | 160 | 165 | 170 | 175 | 180 |
体重y/kg | 63 | 66 | 70 | 72 | 74 |
根据上表可得回归直线方程=0.56x+
,据此模型预报身高为172 cm的高三男生的体重为( )
A.70.09 kg B.70.12 kg
C.70.55 kg D.71.05 kg
B
【解析】
试题分析:由表中数据可得.,
,
∵一定在回归直线方程
上,
∴69=0.56×170+a,
解得a=-16.2
∴y=0.56x-16.2,
当x=172时,y=0.56×172-16.2=70.12
考点:线性回归方程
演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
A.中位数 B.平均数
C.方差 D.极差
A
【分析】
可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.
【详解】
设9位评委评分按从小到大排列为.
则①原始中位数为,去掉最低分
,最高分
,后剩余
,
中位数仍为,
A正确.
②原始平均数,后来平均数
平均数受极端值影响较大,与
不一定相同,B不正确
③
由②易知,C不正确.
④原极差,后来极差
可能相等可能变小,D不正确.
【点睛】
本题旨在考查学生对中位数、平均数、方差、极差本质的理解.
某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是
A.8号学生 B.200号学生 C.616号学生 D.815号学生
C
【分析】
等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案.
【详解】
详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,
所以第一组抽到6号,且每组抽到的学生号构成等差数列,公差
,
所以,
若,则
,不合题意;若
,则
,不合题意;
若,则
,符合题意;若
,则
,不合题意.故选C.
【点睛】
本题主要考查系统抽样.
要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的
A.平均数 B.方差 C.众数 D.频率分布
D
【解析】试题分析:频率分步直方图是用来显示样本在某一范围所占的比例大小,故要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的频率分布
考点:本题考查了频率分布直方图的意义和运用
点评:平均数是表示样本的平均水平,方差表示的是学生身高波动的大小,众数则表示哪一个身高的学生最多,只有频率分步直方图可以清晰地揭示各个身高的学生所占的比例.
某校共有学生3 000名,各年级男、女生人数如表所示,已知高一、高二年级共有男生1 120人,现用分层抽样的方法在全校抽取60名学生,则应在高三年级抽取的学生人数为( )
高一年级 | 高二年级 | 高三年级 | |
女生 | 456 | 424 | y |
男生 | 644 | x | z |
A.16 B.18 C.20 D.24
C
【解析】
根据题意得,高一、高二学生总数是1120+(456+424)=2000,∴高三学生总数是3000-2000=1000.
用分层抽样法在高三年级抽取的学生数为×60=20.
故选C.
样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在内的频数为a,样本数据落在
内的频率为b,则a,b分别是( )
A.32,0.4 B.8,0.1 C.32,0.1 D.8,0.4
A
【解析】
∵落在内的频率为
,
∴
∵落在内的频率为
∴
故选A.
点睛:此题主要考查了频率分布直方图在实际问题中的应用,在解决此类问题时,充分利用频率分布直方图的纵坐标的意义,其纵坐标值为:频率/组距,由此各组数据的频率=其纵坐标×组距,各组频数=频率×总体,从而可估计出所求数据段的频数(即人数).
传承传统文化再掀热潮,我校举行传统文化知识竞赛.其中两位选手在个人追逐赛中的比赛得分如茎叶图所示,则下列说法正确的是( )
A.甲的平均数大于乙的平均数
B.甲的中位数大于乙的中位数
C.甲的方差大于乙的方差
D.甲的平均数等于乙的中位数
C
【解析】
由茎叶图知:(59+45+32+38+24+26+11+12+14)=29,
(51+43+30+34+20+25+27+28+12)=30,
甲的中位数为26,乙的中位数为28.
故选C.
点睛:本题考查一组数据的均值和方差求解及应用.均值公式为.均值体现数据的平均水平,均值越大,平均水平越高;方差题型数据的稳定水平,方差越小,越稳定,中位数是一组数据按着从小到大的顺序排列,位于中间的数或者是两个数的平均数.
某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B.
C. D.
D
【分析】
根据散点图的分布可选择合适的函数模型.
【详解】
由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率和温度
的回归方程类型的是
.
故选:D.
【点睛】
本题考查函数模型的选择,主要观察散点图的分布,属于基础题.
为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
B
【解析】
评估这种农作物亩产量稳定程度的指标是标准差或方差,故选B.
点睛:众数:一组数据出现次数最多的数叫众数,众数反映一组数据的多数水平;
中位数:一组数据中间的数(起到分水岭的作用),中位数反映一组数据的中间水平;
平均数:反映一组数据的平均水平;
方差:反映一组数据偏离平均数的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
标准差是方差的算术平方根,意义在于反映一组数据的离散程度.
根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
D
【解析】
由柱形图可知2006年以来,我国二氧化碳排放量基本成递减趋势,所以二氧化碳排放量与年份负相关,故选D.
考点:本题主要考查统计知识及对学生柱形图的理解
已知某地区中小学生人数和近视情况分别如图1和如图2所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.,
B.
,
C.
,
D.
,
B
【详解】
试题分析:由题意知,样本容量为,其中高中生人数为
,
高中生的近视人数为,故选B.
【考点定位】
本题考查分层抽样与统计图,属于中等题.
某公司位员工的月工资(单位:元)为
,
,…,
,其均值和方差分别为
和
,若从下月起每位员工的月工资增加
元,则这
位员工下月工资的均值和方差分别为( )
A.,
B.
,
C.,
D.
,
D
【解析】
试题分析:均值为;
方差为
,故选D.
考点:数据样本的均值与方差.
为了研究某班学生的脚长(单位厘米)和身高
(单位厘米)的关系,从该班随机抽取
名学生,根据测量数据的散点图可以看出
与
之间有线性相关关系,设其回归直线方程为
.已知
,
,
.该班某学生的脚长为
,据此估计其身高为( )
A. B.
C.
D.
C
【详解】
由已知,
, 故选C.
如图是某工厂对一批新产品长度(单位: )检测结果的频率分布直方图.估计这批产品的平均数与中位数分别为( )
A.22.5 20 B.22.5 22.75 C.22.75 22.5 D.22.75 25
C
【解析】
由题意,这批产品的平均数为,
其中位数为.故选C.
已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x | 2 | 4 | 5 | 6 | 8 |
y | 30 | 40 | 50 | 60 | 70 |
根据上表可得回归方程,计算得
,则当投入10万元广告费时,销售额的预报值为
A.75万元 B.85万元
C.99万元 D.105万元
B
【解析】
分析:根据表中数据求得样本中心,代入回归方程
后求得
,然后再求当
的函数值即可.
详解:由题意得,
∴样本中心为.
∵回归直线过样本中心
,
∴,解得
,
∴回归直线方程为.
当时,
,
故当投入10万元广告费时,销售额的预报值为85万元.
故选B.
点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.
相关变量的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程
,相关系数为
;方案二:剔除点
,根据剩下数据得到线性回归直线方程:
,相关系数为
.则( )
A.
B.
C.
D.
D
【分析】
根据相关系数的意义:其绝对值越接近,说明两个变量越具有线性相关,以及负相关的意义作判断.
【详解】
由散点图得负相关,所以,因为剔除点
后,剩下点数据更具有线性相关性,
更接近
,所以
.选D.
【点睛】
本题考查线性回归分析,重点考查散点图、相关系数,突显了数据分析、直观想象的考查.属基础题.
如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )
A.2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件
B.2019年1~4月的业务量同比增长率超过50%,在3月最高
C.从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致
D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长
D
【分析】
由题意结合所给的统计图确定选项中的说法是否正确即可.
【详解】
对于选项A: 2018年1~4月的业务量,3月最高,2月最低,
差值为,接近2000万件,所以A是正确的;
对于选项B: 2018年1~4月的业务量同比增长率分别为,均超过
,在3月最高,所以B是正确的;
对于选项C:2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C是正确的;
对于选项D,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D错误.
本题选择D选项.
【点睛】
本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.
汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )
A.消耗1升汽油,乙车最多可行驶5千米
B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多
C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油
D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油
D
【详解】
解:对于A,由图象可知当速度大于40km/h时,乙车的燃油效率大于5km/L,
∴当速度大于40km/h时,消耗1升汽油,乙车的行驶距离大于5km,故A错误;
对于B,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,
∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B错误;
对于C,由图象可知当速度为80km/h时,甲车的燃油效率为10km/L,
即甲车行驶10km时,耗油1升,故行驶1小时,路程为80km,燃油为8升,故C错误;
对于D,由图象可知当速度小于80km/h时,丙车的燃油效率大于乙车的燃油效率,
∴用丙车比用乙车更省油,故D正确
故选D.
考点:1、数学建模能力;2、阅读能力及化归思想.
已知变量与
负相关,且由观测数据算得样本平均数
,则由该观测的数据算得的线性回归方程可能是
A. B.
C. D.
C
【分析】
根据与
负相关可知b为负数,将样本平均数点带入选项检验,可求得回归直线方程.
【详解】
因为变量与
负相关,所以
,排除A、B选项;
因为,代入检验即可得到C是正确选项
所以选C
【点睛】
本题考查了回归直线方程的简单应用,属于基础题.
某学校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60 C.140 D.120
C
【详解】
试题分析:由题意得,自习时间不少于小时的频率为
,故自习时间不少于
小时的频率为
,故选C.
考点:频率分布直方图及其应用.
某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:
若线性相关,线性回归方程为
,估计该制药厂6月份生产甲胶囊产量为( )
A.万盒 B.
万盒 C.
万盒 D.
万盒
C
【解析】
分析:由题意,根据表格中的数据求得样本中心为,代入回归直线
,解得
,得到回归直线的方程,即可作出预测.
详解:由题意,根据表格中的数据可知:,
即样本中心为,代入回归直线
,解得
,即
令,解得
万盒,故选C.
点睛:本题主要考查了回归直线分析问题,其中牢记回归直线的特征是解答的关键,着重考查了推理与运算能力.
某公司在甲、乙、丙、丁四个地区分别有150,120,180,150个销售点.公司为了调查产品销售情况,需从这600个销售点中抽取一个容量为100的样本.记这项调查为①;在丙地区有20个大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是( )
A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
B
【解析】
此题为抽样方法的选取问题.当总体中个体较少时宜采用简单随机抽样法;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较多时,宜采用系统抽样.
【详解】
依据题意,第①项调查中,总体中的个体差异较大,应采用分层抽样法;第②项调查总体中个体较少,应采用简单随机抽样法.
故选B.
【点睛】
本题考查随机抽样知识,属基本题型、基本概念的考查.
某产品的广告费用x与销售额y的统计数据如下表:
广告费用 | 4 | 2 | 3 | 5 |
销售额 | 49 | 26 | 39 | 54 |
根据上表可得回归方程中的
为9.4,据此模型预报广告费用为6万元时销售额为
A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元
B
【详解】
试题分析:,
∵数据的样本中心点在线性回归直线上,
回归方程中的
为9.4,
∴42=9.4×3.5+a,
∴=9.1,
∴线性回归方程是y=9.4x+9.1,
∴广告费用为6万元时销售额为9.4×6+9.1=65.5
考点:线性回归方程
“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.如图是2018年9月到2019年2月这半年中,某个关键词的搜索指数变化的走势图.
根据该走势图,下列结论正确的是( )
A.这半年中,网民对该关键词相关的信息关注度呈周期性变化
B.这半年中,网民对该关键词相关的信息关注度不断减弱
C.从网民对该关键词的搜索指数来看,去年10月份的方差小于11月份的方差
D.从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值
D
【详解】
对于A,并无周期变化,故A错,
对于B,并不是不断减弱,中间有增强.故B错,
对于C,10月份的波动大小大于11月份,所以方差要大.故C错,
对于D,由图可知,12月起到1月份有下降的趋势,所以去年12月份的平均值大于今年1月份的平均值.故D正确,
故选:D.
若样本数据的标准差为8,则数据
,
,
,
的标准差为( )
A.8 B.15 C.16 D.32
C
【解析】
试题分析:样本数据,
,
,
的标准差为
,所以方差为64,由
可得数据
,
,
,
的方差为
,所以标准差为
考点:方差与标准差
为了规定工时定额,需要确定加工某种零件所需的时间,为此进行了次试验,得到
组数据:
,由最小二乘法求得回归直线方程为
.若已知
,则
A. B.
C.
D.
C
【分析】
由题意,求出代入公式求值,从而得到
,即可求解
得值.
【详解】
由题意,可得,代入回归直线的方程,可得
,
所以,故选C.
【点睛】
本题主要考查了线性回归方程的求法及其应用,其中解答中熟记回归直线的方程的应用,合理准确计算是解答的关键,着重考查了运算与求解能力,属于基础题.
在一组样本数据中,1,2,3,4出现的频率分别为,且
,则下面四种情形中,对应样本的标准差最大的一组是( )
A. B.
C. D.
B
【分析】
计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组.
【详解】
对于A选项,该组数据的平均数为,
方差为;
对于B选项,该组数据的平均数为,
方差为;
对于C选项,该组数据的平均数为,
方差为;
对于D选项,该组数据的平均数为,
方差为.
因此,B选项这一组的标准差最大.
故选:B.
【点睛】
本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.
某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.253 D.007
A
【解析】
分析:从第五行第六列开始向右读,依次读取,将其中不符合要求的也就是超范围的数据去掉,再将重复的去掉,最后找到满足条件的数据.
详解:从第5行第6列开始向又读取数据,
第一个数为253,第二个数是313,第三个数是457,
下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,
第四个是007,第五个是328,第六个是623,故选A.
点睛:这是一道有关随机数表的题目,明确随机数的含义是关键,在读取数据的过程中,需要把超范围的数据和重复的数据都去掉,接着往下读就行了.
为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样
C.按学段分层抽样 D.系统抽样
C
【解析】
试题分析:符合分层抽样法的定义,故选C.
考点:分层抽样.
给出以下四个说法:
①残差点分布的带状区域的宽度越窄相关指数越小
②在刻画回归模型的拟合效果时,相关指数的值越大,说明拟合的效果越好;
③在回归直线方程中,当解释变量
每增加一个单位时,预报变量
平均增加
个单位;
④对分类变量与
,若它们的随机变量
的观测值
越小,则判断“
与
有关系”的把握程度越大.
其中正确的说法是
A.①④ B.②④ C.①③ D.②③
D
【分析】
根据残差点分布和相关指数的关系判断①是否正确,根据相关指数判断②是否正确,根据回归直线的知识判断③是否正确,根据
联表独立性检验的知识判断④是否正确.
【详解】
残差点分布宽度越窄,相关指数越大,故①错误.相关指数越大,拟合效果越好,故②正确.回归直线方程斜率为故解释变量
每增加一个单位时,预报变量
平均增加
个单位,即③正确.
越大,有把握程度越大,故④错误.故正确的是②③,故选D.
【点睛】
本小题主要考查残差分析、相关指数、回归直线方程和独立性检验等知识,属于基础题.
为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入 | 8.2 | 8.6 | 10.0 | 11.3 | 11.9 |
支出 | 6.2 | 7.5 | 8.0 | 8.5 | 9.8 |
根据上表可得回归直线方程,其中
,据此估计,该社区一户收入为15万元家庭年支出为( )
A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元
B
【解析】
试题分析:由题,
,所以
.
试题解析:由已知,
又因为,
所以,即该家庭支出为
万元.
考点:线性回归与变量间的关系.
某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
A
【解析】
试题分析:根据已知可得:,故选择A
考点:分层抽样
某单位青年、中年、老年职员的人数之比为10∶8∶7,从中抽取200名职员作为样本,若每人被抽取的概率是0.2,则该单位青年职员的人数为( )
A.280 B.320 C.400 D.1000
C
【分析】
由题意知这是一个分层抽样问题,根据青年、中年、老年职员的人数之比为,从中抽取
名职员作为样本,得到要从该单位青年职员中抽取的人数,根据每人被抽取的概率为
,得到要求的结果
【详解】
由题意知这是一个分层抽样问题,
青年、中年、老年职员的人数之比为
,从中抽取
名职员作为样本,
要从该单位青年职员中抽取的人数为:
每人被抽取的概率为
,
该单位青年职员共有
故选
【点睛】
本题主要考查了分层抽样问题,运用计算方法求出结果即可,较为简单,属于基础题.
某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为若低于60分的人数是15人,则该班的学生人数是( )
A. B.
C.
D.
B
【解析】
根据频率分布直方可知成绩低于60分的有第一、二组数据,
在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,
则成绩低于60分的频率P=(0.005+0.010)×20=0.3.
又因为低于60分的人数是15人,
所以该班的学生人数是15÷0.3=50.
本题选择B选项.
甲乙两名同学6次考试的成绩统计如图,甲乙两组数据的平均数分别为、
标准差分别为
、
,则
A.,
B.
,
C.,
D.
,
C
【解析】
通过读图可知甲同学除第二次考试成绩略低与乙同学,其他次考试都远高于乙同学,可知图中数据显示甲同学的成绩比乙同学稳定,故
.
【详解】
由图可知,甲同学除第二次考试成绩略低与乙同学,其他次考试都远高于乙同学,可知图中数据显示甲同学的成绩比乙同学稳定,故
.故选
.
【点睛】
本题考查平均数及标准差的实际意义,是基础题.
如果数据x1,x2,…,xn的平均数是,方差是s2,则3x1+2,3x2+2,…,3xn+2的平均数和方差分别是 ( )
A.和s2 B.3
和9s2
C.3+2和9s2 D.3
+2和12s2+4
C
【解析】
3x1+2,3x2+2,…,3xn+2的平均数是3+2,由于数据x1,x2,…,xn的方差为s2,所以3x1+2,3x2+2,…,3xn+2的方差为9s2,所以选择C.
【点睛】利用样本的平均数公式及方差公式可推导出如下结论:如果数据x1,x2,…,xn的平均数是,方差是s2,则
的平均数和方差分别是
和
,请同学们记住这个结论.
记住如下结论
某学校老师中,型血有36人、
型血有24人、
型血有12人,现需要从这些老师中抽取一个容量为
的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量减少一个,则在采用系统抽样时,需要在总体中剔除2个个体,则样本容量
可能为(
)
A. B.
C.
D.
C
【解析】
根据系统抽样和分层抽样方法特点确定样本容量需满足条件,再比较选项确定结果.
【详解】
因为采用系统抽样和分层抽样方法抽取,都不用剔除个体;所以样本容量为
的约数,因为
,所以样本容量
为
的倍数,因此舍去B,D;
因为如果样本容量减少一个,则在采用系统抽样时,需要在总体中剔除2个个体,所以样本容量为
的约数加1,因此选C.
【点睛】
本题考查系统抽样和分层抽样方法,考查基本求解能力.
为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据:
天数 | 3 | 4 | 5 | 6 |
繁殖个数 | 2.5 | 3 | | 4.5 |
由最小二乘法得与
的线性回归方程为
,则当
时,繁殖个数
的预测值为( )
A.4.9 B.5.25
C.5.95 D.6.15
B
【分析】
根据表格中的数据,求得样本中心为,代入回归直线方程,求得
,得到回归直线的方程为
,即可作出预测,得到答案.
【详解】
由题意,根据表格中的数据,可得,
即样本中心为,代入回归直线方程
,即
,
解得,即回归直线的方程为
,
当时,
,故选B.
【点睛】
本题主要考查了回归直线方程的应用,其中解答中熟记回归直线方程的特征,求得回归直线的方程是解答的关键,着重考查了运算与求解能力,属于基础题.
总体由编号为01,02,…,39,40的40个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
50 44 66 44 21 66 06 58 05 62 61 65 54 35 02 42 35 48 96 32 14 52 41 52 48 |
22 66 22 15 86 26 63 75 41 99 58 42 36 72 24 58 37 52 18 51 03 37 18 39 11 |
A.23 B.21 C.35 D.32
B
【分析】
从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,于是将两个数字构成的编号依次写出,然后读取出在01,02,…,39,40编号内编号(重复的算一次),依次选取5个不重复的即可得到.
【详解】
解随机数表第1行的第6列和第7列数字为6,4
所以从这两个数字开始,由左向右依次选取两个数字如下
64,42,16,60,65,80,56,26,16,55,43,50,24,23,54,89,63,21,45,…
其中落在编号01,02,…,39,40内的有:16,26,24,23,21, …
故第5个编号为21.
故选B.
【点睛】
本题考查了抽样中的随机抽样法,理清本题中随机抽样的规则是解题的关键,依次写出落在规定范围内的不重复的编号,从而解决问题.
设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1 C.1 D.10
C
【分析】
根据新数据与原数据关系确定方差关系,即得结果.
【详解】
因为数据的方差是数据
的方差的
倍,
所以所求数据方差为
故选:C
【点睛】
本题考查方差,考查基本分析求解能力,属基础题.
某中学2018年的高考考生人数是2015年高考考生人数的1.5倍,为了更好地对比该校考生的升学情况,统计了该校2015年和2018年的高考情况,得到如图柱状图:
则下列结论正确的是( )
A.与2015年相比,2018年一本达线人数减少
B.与2015年相比,2018二本达线人数增加了0.5倍
C.2015年与2018年艺体达线人数相同
D.与2015年相比,2018年不上线的人数有所增加
D
【分析】
设2015年该校参加高考的人数为,则2018年该校参加高考的人数为
.
观察柱状统计图,找出各数据,再利用各数量间的关系列式计算得到答案.
【详解】
设2015年该校参加高考的人数为,则2018年该校参加高考的人数为
.
对于选项A.2015年一本达线人数为.2018年一本达线人数为
,可见一本达线人数增加了,故选项A错误;
对于选项B,2015年二本达线人数为,2018年二本达线人数为
,显然2018年二本达线人数不是增加了0.5倍,故选项B错误;
对于选项C,2015年和2018年.艺体达线率没变,但是人数是不相同的,故选项C错误;
对于选项D,2015年不上线人数为.2018年不上线人数为
.不达线人数有所增加.故选D.
【点睛】
本题考查了柱状统计图以及用样本估计总体,观察柱状统计图,找出各数据,再利用各数量间的关系列式计算是解题的关键.
以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5 B.5,5 C.5,8 D.8,8
C
【解析】
试题分析:由题意得,
,选C.
考点:茎叶图
AQI是表示空气质量的指数,AQI指数值越小,表明空气质量越好,当AQI指数值不大于100时称空气质量为“优良”.如图是某地4月1日到12日AQI指数值的统计数据,图中点A表示4月1日的AQI指数值为201,则下列叙述不正确的是( )
A.这12天中有6天空气质量为“优良”
B.这12天中空气质量最好的是4月9日
C.这12天的AQI指数值的中位数是90
D.从4日到9日,空气质量越来越好
C
【解析】
由图可知,不大于100天有6日到11日,共6天,所以A对,不选.
最小的一天为10日,所以B对,不选.中位为是
,C错.从图中可以4日到9日
越来越小,D对.所以选C.
“关注夕阳、爱老敬老”—某马拉松协会从年开始每年向敬老院捐赠物资和现金.下表记录了第
年(
年是第一年)与捐赠的现金
(万元)的对应数据,由此表中的数据得到了
关于
的线性回归方程
,则预测
年捐赠的现金大约是( )
| | | | |
| | | | |
A.万元 B.
万元 C.
万元 D.
万元
C
【分析】
由已知求出,代入回归直线的方程,求得
,然后取
,求得
的值,即可得到答案.
【详解】
由已知得,,
所以样本点的中心点的坐标为,代入
,
得,即
,所以
,
取,得
,
预测2019年捐赠的现金大约是万元.
【点睛】
本题主要考查了线性回归方程以及应用,其中解答中熟记回归直线的方程经过样本中心点是解答的关键,着重考查了推理与计算能力,属于基础题.
下图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则和
的值分别为
A.5,5 B.3,5 C.3,7 D.5,7
B
【分析】
利用茎叶图、中位数、平均数的性质直接求解.
【详解】
由茎叶图得:
∵甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,
∴65=60+y,解得y=5,
∵平均值也相等,
∴,
解得x=3.
故选B.
【点睛】
本题考查实数值的求法,考查茎叶图、中位数、平均数的性质等基础知识,考查运算求解能力,是基础题.
已知某种细菌的适宜生长温度为10℃~25℃,为了研究该种细菌的繁殖数量(单位:个)随温度
(单位:℃)变化的规律,收集数据如下:
温度 | 12 | 14 | 16 | 18 | 20 | 22 | 24 |
繁殖数量 | 20 | 25 | 33 | 27 | 51 | 112 | 194 |
对数据进行初步处理后,得到了一些统计量的值,如下表所示:
| | | | | | |
18 | 66 | 3.8 | 112 | 4.3 | 1428 | 20.5 |
其中,
.
(1)请绘出关于
的散点图,并根据散点图判断
与
哪一个更适合作为该种细菌的繁殖数量
关于温度
的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表格数据,建立关于
的回归方程(结果精确到0.1);
(3)当温度为25℃时,该种细菌的繁殖数量的预报值为多少?
参考公式:对于一组数据,其回归直线
的斜率和截距的最小二成估计分别为
,
.
参考数据:.
(1) 更适合作为
关于
的回归方程.(2)
.(3)245.
【分析】
(1)画出关于
的散点图,即可作出判定,得到结论.
(2)由(1)因为,得
,利用公式求得
和
的值,即可求得回归方程;
(3)令,求得
,即可得到结论.
【详解】
(1)由题意,关于
的散点图如下图所示.
更适合作为
关于
的回归方程.
(2)由(1)因为,则
,
∴,
∴,
∴关于
的回归方程为
.
(3)由(2)中的回归方程,令,求得
,
所以当温度为时,预报值为
.
【点睛】
本题主要考查了数据的散点图的应用,回归方程的求解及应用,其中解答中正确理解题意,合理利用散点图作出判断,准确利用公式求解是解答的关键,着重考查了推理与运算能力,属于中档试题.
2019年“非洲猪瘟”过后,全国生猪价格逐步上涨,某大型养猪企业,欲将达到养殖周期的生猪全部出售,根据去年的销售记录,得到销售生猪的重量的频率分布直方图(如图所示).
(1)根据去年生猪重量的频率分布直方图,估计今年生猪出栏(达到养殖周期)时,生猪重量达不到270斤的概率(以频率代替概率);
(2)若假设该企业今年达到养殖周期的生猪出栏量为5000头,生猪市场价格是8元/斤,试估计该企业本养殖周期的销售收入是多少万元;
(3)若从本养殖周期的生猪中,任意选两头生猪,其重量达到270斤及以上的生猪数为随机变量,试求随机变量
的分布列及方差.
(1)0.25 (2)1222.4万元(3)见解析
【分析】
(1)根据频率分布直方图,求对应条形的面积,可得生猪重量达不到270斤概率;
(2)利用组中值乘以频率再作和,求得生猪重量的平均数,再用重量乘以单价乘以头数得到销售收入;
(3)由(1)可得随机选一头生猪,其重量达到270斤及以上的概率为,利用二项分布的特征求得其分布列,利用公式求得其方差.
【详解】
(1)估计生猪重量达不到270斤的概率为
.
(2)生猪重量的平均数为(斤).
所以估计该企业本养殖周期的销售收入是(万元).
(3)由(1)可得随机选一头生猪,其重量达到270斤及以上的概率为,
由题意可得随机变量的所有可能取值为
,则
,
∴,
,
,
∴随机变量的分布列为
Y | 0 | 1 | 2 |
P | | | |
∴随机变量的方差
.
【点睛】
该题主要考查了概率与统计的问题,涉及到的知识点有频率分布直方图的应用,利用频率分布直方图求平均数,二项分布的分布列以及其方差,从频率分布直方图中获取信息是解题的关键,属于简单题目.
为推行“新课堂”教学法,某老师分别用传统教学和“新课堂”两种不同的教学方式在甲、乙两个平行班进行教学实验,为了解教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,作出如图所示的茎叶图,若成绩大于70分为“成绩优良”.
(1)分别计算甲、乙两班的样本中,前10名成绩的平均分,并据此判断哪种教学方式的教学效果更佳;
(2)由以上统计数据填写下面2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”?
甲班 | 乙班 | 总计 | |
成绩优良 | |||
成绩不优良 | |||
总计 |
(3)从甲、乙两班40个样本中,成绩在60分以下(不含60分)的学生中任意选取2人,记ξ为所抽取的2人中来自乙班的人数,求ξ的分布列及数学期望.
附:K2=(n=a+b+c+d),
P(K2≥k0) | 0.10 | 0.05 | 0.025 | 0.010 |
k0 | 2.706 | 3.841 | 5.024 | 6.635 |
(1)见解析;(2)见解析;(3)见解析
【分析】
(1)由平均数是的计算公式,分布求得甲班样本前10名成绩和乙班样本前10名成绩的平均分,比较即可得到结论.
(2)根据茎叶图中的数据作出列联表,利用公式计算
的值,即可得到结论.
(3)求得随机变量的所有可能取值为,求出随机变量取值的概率,列出随机变量的分布列,利用公式,即可求解数学期望.
【详解】
(1)由数据的平均数是的计算公式,可得甲班样本前10名成绩的平均分为
=
;
乙班样本前10名成绩的平均分为
=
;
因为甲班样本前10名成绩的平均分低于乙班样本前10名成绩的平均分,
所以据此判断“新课堂”教学方式的教学效果更佳.
(2)根据茎叶图中的数据作出列联表如表所示:
甲班 | 乙班 | 总计 | |
成绩优良 | 10 | 16 | 26 |
成绩不优良 | 10 | 4 | 14 |
总计 | 20 | 20 | 40 |
根据列联表中的数据,得
的观测值为
,
所以能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.
(3)样本中成绩在60分以下的学生中甲班有4人,乙班有2人,
所以的所有可能取值为
,
则=
,
,
=
,
则随机变量的分布列为:
| 0 | 1 | 2 |
P | | | |
则数学期望.
【点睛】
本题主要考查了数据的平均数和独立性检验的应用,以及随机变量的分布列与数学期望的计算,其中解答中认真审题,合理利用平均数、独立性检验的公式准确计算,以及正确得出随机变量的取值及概率,列出相应的分布列是解答的关键,着重考查了分析问题和解答问题的能力,属于中档试题.
蔬菜批发市场销售某种蔬菜,在一个销售周期内,每售出1吨该蔬菜获利500元,未售出的蔬菜低价处理,每吨亏损100元.统计该蔬菜以往100个销售周期的市场需求量,绘制下图所示频率分布直方图.
(Ⅰ)求的值,并求100个销售周期的平均市场需求量(以各组的区间中点值代表该组的数值);
(Ⅱ)若经销商在下个销售周期购进了190吨该蔬菜,设为该销售周期的利润(单位:元),
为该销售周期的市场需求量(单位:吨).求
与
的函数解析式,并估计销售的利润不少于86000元的概率.
(1) ,181.4;(2)
;0.66.
【分析】
(1)根据频率和为1,求得,利用频率直方图中平均数的计算公式,求得平均值,即可得到结论.
(1)根据题意求得与
的函数关系式
,当
时,求得
,当
,
,得到
,即可求解销售的利润不少于
的概率.
【详解】
(Ⅰ)由频率分布直方图中各个小长方形的面积和为1,
可得,解得
,
.
(Ⅱ)由题意可知,当;
当,
,
所以与
的函数解析式为
.
设销售的利润不少于86000元的事件记为.
当,
,
当,
,所以
,
所以.
【点睛】
本题主要考查了频率分布直方图的应用,以及频率分布直方图中概率的计算问题,其中解答中熟记频率分布直方图的性质,合理列出与
的函数关系式是解答本题的关键,着重考查了分析问题和解答问题的能力,属于基础题.
某种工程车随着使用年限的增加,每年的维修费用也相应增加.根据相关资料可知该种工程车自购入使用之日起,前年中每年的维修费用如下表所示:
(Ⅰ)从这年中随机抽取
年,求至少有
年维修费用高于
万元的概率;
(Ⅱ)求关于
的线性回归方程;
(Ⅲ)由于成本因素,若年维修费用高于万元,则该种工程车需强制报废,根据(Ⅱ)中求得的线性回归方程,预测该种工程车最多可以使用多少年?
参考公式:,
.
(Ⅰ);(Ⅱ)
;(Ⅲ)
年.
【分析】
(Ⅰ)根据古典概型概率计算公式可得;(Ⅱ)将表中数据与公式相结合可得
;(Ⅲ)令
,可得结果.
【详解】
(Ⅰ)由题可得第年与第
年的维修费用高于
万元,
则至少有年维修费用高于
万元的概率
.
(Ⅱ)由题可得,
,
,
,
所以,
,
所以关于
的线性回归方程为
.
(Ⅲ)令,可得
,又
,所以
,
故该种工程车最多可以使用年.
【点睛】
本题主要考查了古典概型概率计算公式的应用以及线性回归方程的求法及应用,属于中档题.
某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过
和不超过
的工人数填入下面的列联表:
超过 | 不超过 | |
第一种生产方式 | ||
第二种生产方式 |
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:,
| | | |
| | | |
(1)第二种生产方式的效率更高. 理由见解析
(2)80
(3)能
【详解】
分析:(1)计算两种生产方式的平均时间即可.
(2)计算出中位数,再由茎叶图数据完成列联表.
(3)由公式计算出,再与6.635比较可得结果.
详解:(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知.
列联表如下:
超过 | 不超过 | |
第一种生产方式 | 15 | 5 |
第二种生产方式 | 5 | 15 |
(3)由于,所以有99%的把握认为两种生产方式的效率有差异.
点睛:本题主要考查了茎叶图和独立性检验,考察学生的计算能力和分析问题的能力,贴近生活.
下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了与时间变量
的两个线性回归模型.根据2000年至2016年的数据(时间变量
的值依次为
)建立模型①:
;根据2010年至2016年的数据(时间变量
的值依次为
)建立模型②:
.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
(1)利用模型①预测值为226.1,利用模型②预测值为256.5,(2)利用模型②得到的预测值更可靠.
【详解】
分析:(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果;(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.
详解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=–30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点求参数.
为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中
组小鼠给服甲离子溶液,
组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于
”,根据直方图得到
的估计值为
.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
(1) ,
;(2)
,
.
【分析】
(1)由及频率和为1可解得
和
的值;(2)根据公式求平均数.
【详解】
(1)由题得,解得
,由
,解得
.
(2)由甲离子的直方图可得,甲离子残留百分比的平均值为,
乙离子残留百分比的平均值为
【点睛】
本题考查频率分布直方图和平均数,属于基础题.
某家庭记录了未使用节水龙头天的日用水量数据(单位:
)和使用了节水龙头
天的日用水量数据,得到频数分布表如下:
未使用节水龙头天的日用水量频数分布表
日用水量 | | | | | | | |
频数 | | | | | | | |
使用了节水龙头天的日用水量频数分布表
日用水量 | | | | | | |
频数 | | | | | | |
(1)在答题卡上作出使用了节水龙头天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
(1)直方图见解析;(2);(3)
.
【分析】
(1)根据题中所给的使用了节水龙头天的日用水量频数分布表,算出落在相应区间上的频率,借助于直方图中长方形的面积表示的就是落在相应区间上的频率,从而确定出对应矩形的高,从而得到直方图;
(2)结合直方图,算出日用水量小于的矩形的面积总和,即为所求的频率;
(3)根据组中值乘以相应的频率作和求得天日用水量的平均值,作差乘以
天得到一年能节约用水多少
,从而求得结果.
【详解】
(1)频率分布直方图如下图所示:
(2)根据以上数据,该家庭使用节水龙头后天日用水量小于
的频率为
;
因此该家庭使用节水龙头后日用水量小于的概率的估计值为
;
(3)该家庭未使用节水龙头天日用水量的平均数为
.
该家庭使用了节水龙头后50天日用水量的平均数为.
估计使用节水龙头后,一年可节省水.
【点睛】
该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果.
下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:,
,
,
≈2.646.
参考公式:相关系数
回归方程中斜率和截距的最小二乘估计公式分别为:
(Ⅰ)答案见解析;(Ⅱ)答案见解析.
【解析】
试题分析:(Ⅰ)根据相关系数的公式求出相关数据后,代入公式即可求得
的值,最后根据
值的大小回答即可;(Ⅱ)准确求得相关数据,利用最小二乘法建立y关于t的回归方程,然后预测.
试题解析:(Ⅰ)由折线图中数据和附注中参考数据得
,
,
,
,
.
因为与
的相关系数近似为0.99,说明
与
的线性相关相当高,从而可以用线性回归模型拟合
与
的关系.
(Ⅱ)由及(Ⅰ)得
,
.
所以,关于
的回归方程为:
.
将2016年对应的代入回归方程得:
.
所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.
【考点】线性相关系数与线性回归方程的求法与应用.
【方法点拨】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出
,然后根据
的大小进行判断.求线性回归方程时要严格按照公式求解,并一定要注意计算的准确性.
某城市户居民的月平均用电量(单位:度),以
,
,
,
,
,
,
分组的频率分布直方图如图.
(1)求直方图中的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为,
,
,
的四组用户中,用分层抽样的方法抽取
户居民,则月平均用电量在
的用户中应抽取多少户?
(1);(2)
,
;(3)
.
【详解】
试题分析:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解方程可得;(2)由直方图中众数为最高矩形上端的中点可得,可得中位数在内,设中位数为a,解方程(0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5可得;(3)可得各段的用户分别为25,15,10,5,可得抽取比例,可得要抽取的户数
试题解析:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1得:
x=0.0075,所以直方图中x的值是0.0075. ------------- 3分
(2)月平均用电量的众数是=230. ------------- 5分
因为(0.002+0.0095+0.011)×20=0.45<0.5,所以月平均用电量的中位数在内,
设中位数为a,
由(0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5
得:a=224,所以月平均用电量的中位数是224. ------------ 8分
(3)月平均用电量为的用户有0.0125×20×100=25户,
月平均用电量为的用户有0.0075×20×100=15户,
月平均用电量为的用户有0. 005×20×100=10户,
月平均用电量为的用户有0.0025×20×100=5户, -------------10分
抽取比例==
,所以月平均用电量在
的用户中应抽取25×
=5户.-- 12分
考点:频率分布直方图及分层抽样
海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:
(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg | 箱产量≥50kg | |
旧养殖法 | ||
新养殖法 |
(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较.
附:
P(K2≥k) | 0.050 | 0.010 | 0.001 |
k | 3.841 | 6.635 | 10.828 |
(1)0.62(2)有99%的把握 (3)新养殖法优于旧养殖法
【详解】
试题分析:
(1)由频率近似概率值,计算可得旧养殖法的箱产量低于50kg的频率为0.62.据此,事件A的概率估计值为0.62.
(2)由题意完成列联表,计算K2的观测值k=≈15.705>6.635,则有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
试题解析:
(1)旧养殖法的箱产量低于50kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件A的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50kg | 箱产量≥50kg | |
旧养殖法 | 62 | 38 |
新养殖法 | 34 | 66 |
K2的观测值k=≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3) 由频率分布直方图可得:
旧养殖法100个网箱产量的平均数1=(27.5×0.012+32.5×0.014+37.5×0.024+42.5×0.034+47.5×0.040+52.5×0.032+57.5×0.032+62.5×0.012+67.5×0.012)×5
=5×9.42=47.1;
新养殖法100个网箱产量的平均数2=(37.5×0.004+42.5×0.020+47.5×0.044+52.5×0.054+57.5×0.046+62.5×0.010+67.5×0.008)×5=5×10.47=52.35;
比较可得:1
2,
故新养殖法更加优于旧养殖法.
点睛:利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.
某百货公司1~6月份的销售量与利润的统计数据如表:
月份 | 1 | 2 | 3 | 4 | 5 | 6 |
销售量x/万件 | 10 | 11 | 13 | 12 | 8 | 6 |
利润y/万元 | 22 | 25 | 29 | 26 | 16 | 12 |
(1)根据2~5月份的统计数据,求出y关于x的回归直线方程x+
;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的回归直线方程是理想的,试问所得回归直线方程是否理想?
附:
(1)x-
(2) 该小组所得线性回归方程是理想的.
【详解】
试题分析:(1)直接根据线性回归方程的公式进行计算.(2)利用求出的线性回归方程检验预测值与实际值的差是否不超过2万元.
解析:(1)根据表中2~5月份的数据,计算得,
,
,所以
,
.故
关于
的回归直线方程为:
.
(2)当时,
,此时
;当
时,
,此时
.故所得的回归直线方程是理想的.
为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:
).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
零件尺寸 | 9.95 | 10.12 | 9.96 | 9.96 | 10.01 | 9.92 | 9.98 | 10.04 |
抽取次序 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
零件尺寸 | 10.26 | 9.91 | 10.13 | 10.02 | 9.22 | 10.04 | 10.05 | 9.95 |
经计算得,
,
,其中
为抽取的第
个零件的尺寸,
.
(1)求的相关系数
,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若
,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到
)附:样本
的相关系数
,
.
(1)可以;(2)(ⅰ)需要;(ⅱ),
.
【分析】
(1)依公式求;
(2)(i)由,得抽取的第13个零件的尺寸在
以外,因此需对当天的生产过程进行检查;(ii)剔除第13个数据,则均值的估计值为10.02,方差为0.09.
【详解】
(1)由样本数据得的相关系数为
.
由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)(i)由于,
由样本数据可以看出抽取的第13个零件的尺寸在以外,
因此需对当天的生产过程进行检查.
(ii)剔除离群值,即第13个数据,
剩下数据的平均数为,
这条生产线当天生产的零件尺寸的均值的估计值为10.02.
,
剔除第13个数据,剩下数据的样本方差为
,
这条生产线当天生产的零件尺寸的标准差的估计值为.
【点睛】
解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.
从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下图频率分布直方图:
(I)求这500件产品质量指标值的样本平均值和样本方差
(同一组的数据用该组区间的中点值作代表);
(II)由直方图可以认为,这种产品的质量指标服从正态分布
,其中
近似为样本平均数
,
近似为样本方差
.
(i)利用该正态分布,求;
(ii)某用户从该企业购买了100件这种产品,记表示这100件产品中质量指标值位于区间
的产品件数.利用(i)的结果,求
.
附:
若则
,
.
(I);(II)(i)
;(ii)
.
【解析】
试题分析:(I)由频率分布直方图可估计样本特征数众数、中位数、均值、方差.若同一组的数据用该组区间的中点值作代表,则众数为最高矩形中点横坐标.中位数为面积等分为的点.均值为每个矩形中点横坐标与该矩形面积积的累加值.方差是矩形横坐标与均值差的平方的加权平均值.(II)(i)由已知得,
,故
;(ii)某用户从该企业购买了100件这种产品,相当于100次独立重复试验,则这100件产品中质量指标值位于区间
的产品件数
,故期望
.
试题分析:(I)抽取产品的质量指标值的样本平均值和样本方差
分别为
,
.
(II)(i)由(I)知,服从正态分布
,从而
.
(ii)由(i)可知,一件产品的质量指标值位于区间的概率为
,依题意知
,所以
.
【考点定位】1、频率分布直方图;2、正态分布的原则;3、二项分布的期望.
某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量
(
=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
|
|
|
|
|
|
|
46.6 | 563 | 6.8 | 289.8 | 1.6 | 1469 | 108.8 |
表中,
=
(Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题:
(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据,
,……,
,其回归线
的斜率和截距的最小二乘估计分别为:
(Ⅰ);(Ⅱ)
;(Ⅲ)(ⅰ)
;(ⅱ)46.24
【详解】
(Ⅰ)由散点图可以判断,适合作为年销售
关于年宣传费用
的回归方程类型.
(Ⅱ)令,先建立
关于
的线性回归方程,由于
=
,
∴=563-68×6.8=100.6.
∴关于
的线性回归方程为
,
∴关于
的回归方程为
.
(Ⅲ)(ⅰ)由(Ⅱ)知,当=49时,年销售量
的预报值
=576.6,
.
(ⅱ)根据(Ⅱ)的结果知,年利润z的预报值
,
∴当=
,即
时,
取得最大值.
故宣传费用为46.24千元时,年利润的预报值最大.
《中华人民共和国道路交通安全法》第条的相关规定:机动车行经人行道时,应当减速慢行;遇行人正在通过人行道,应当停车让行,俗称“礼让斑马线”, 《中华人民共和国道路交通安全法》第
条规定:对不礼让行人的驾驶员处以扣
分,罚款
元的处罚.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员“礼让斑马线”行为统计数据:
月份 | | | | | |
违章驾驶员人数 | | | | | |
(1)请利用所给数据求违章人数与月份
之间的回归直线方程
;
(2)预测该路口月份的不“礼让斑马线”违章驾驶员人数.
参考公式: ,参考数据:
.
(1);(2)49.
【分析】
(1)由表中的数据,根据最小二乘法和公式,求得的值,得到回归直线方程;
(2)令,代入回归直线的方程,即可得到该路口9月份的不“礼让斑马线”违章驾驶员人数.
【详解】
(1)由表中数据知, ,
∴,
,
∴所求回归直线方程为.
(2)令,则
人.
【点睛】
本题主要考查了回归直线方程的求解及其应用,其中解答中认真审题,根据最小二乘法的公式准确计算,求得的值是解答的关键和解答的难点,着重考查了推理与运算能力,属于基础题.
2018年8月8日是我国第十个全民健身日,其主题是:新时代全民健身动起来.某市为了解全民健身情况,随机从某小区居民中抽取了40人,将他们的年龄分成7段:
后得到如图所示的频率分布直方图.
(1)试求这40人年龄的平均数、中位数的估计值;
(2)(i)若从样本中年龄在的居民中任取2人赠送健身卡,求这2人中至少有1人年龄不低于60岁的概率;
(ⅱ)已知该小区年龄在内的总人数为2000,若18岁以上(含18岁)为成年人,试估计该小区年龄不超过80岁的成年人人数.
(1) 平均数37,中位数为35;(2) (ⅰ);(ⅱ)该小区年龄不超过80岁的成年人人数约为2000×0.88=1760.
【分析】
(1)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;直方图左右两边面积相等处横坐标表示中位数;(2)(ⅰ)从6人中任选2人共有15个基本事件,至少有1人年龄不低于60岁的共有9个基本事件,由古典概型概率公式可得结果;(ⅱ)样本中年龄在18岁以上的居民所占频率为1-(18-10)×0.015=0.88.
【详解】
(1)平均数.
前三组的频率之和为0.15+0.2+0.3=0.65,故中位数落在第3组,设中位数为x,
则(x-30)×0.03+0.15+0.2=0.5,解得x=35,即中位数为35.
(2)(ⅰ)样本中,年龄在的人共有40×0.15=6人,其中年龄在
的有4人,设为a,b,c,d,年龄在
的有2人,设为x,y.
则从中任选2人共有如下15个基本事件:(a,b),(a,c),(a,d),(a,x),(a,y),(b,c),(b,d),(b,x),(b,y),(c,d),(c,x),(c,y),(d,x),(d,y),(x,y).
至少有1人年龄不低于60岁的共有如下9个基本事件:
(a,x),(a,y),(b,x),(b,y),(c,x),(c,y),(d,x),(d,y),(x,y).
记“这2人中至少有1人年龄不低于60岁”为事件A,
故所求概率.
(ⅱ)样本中年龄在18岁以上的居民所占频率为1-(18-10)×0.015=0.88,
故可以估计,该小区年龄不超过80岁的成年人人数约为2000×0.88=1760.
【点睛】
本题主要考查直方图以及古典概型概率公式的应用,属于中档题,利用古典概型概率公式求概率时,找准基本事件个数是解题的关键,基本亊件的探求方法有 (1)枚举法:适合给定的基本事件个数较少且易一一列举出的;(2)树状图法:适合于较为复杂的问题中的基本亊件的探求.在找基本事件个数时,一定要按顺序逐个写出:先,
….
,再
,
…..
依次
….
… 这样才能避免多写、漏写现象的发生.
某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),表示购机的同时购买的易损零件数.
(Ⅰ)若=19,求y与x的函数解析式;
(Ⅱ)若要求“需更换的易损零件数不大于”的频率不小于0.5,求
的最小值;
(Ⅲ)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
(1);(2)19;(3) 购买1台机器的同时应购买19个易损零件.
【解析】
试题分析:(Ⅰ)分x19及x>19,分别求解析式;(Ⅱ)通过频率大小进行比较;(Ⅲ)分别求出n=19,n=20时所需费用的平均数来确定.
试题解析:(Ⅰ)当时,
;当
时,
,所以
与
的函数解析式为
.
(Ⅱ)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故的最小值为19.
(Ⅲ)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为.
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为.
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
【考点】函数解析式、概率与统计
【名师点睛】本题把统计与函数结合在一起进行考查,有综合性但难度不大,求解的关键是读懂题意,所以提醒考生要重视数学中的阅读理解问题.
某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数 | 0 | 1 | 2 | 3 | 4 | |
保费 | | | | | | |
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
出险次数 | 0 | 1 | 2 | 3 | 4 | |
频数 | 60 | 50 | 30 | 30 | 20 | 10 |
(I)记A为事件:“一续保人本年度的保费不高于基本保费”.求P(A)的估计值;
(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;
(Ⅲ)求续保人本年度的平均保费估计值.
(I);(Ⅱ)
;(Ⅲ)1.1925a.
【分析】
(I)求出A为事件:“一续保人本年度的保费不高于基本保费”的人数.总事件人数,即可求P(A)的估计值;
(Ⅱ)求出B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”的人数.然后求P(B)的估计值;
(Ⅲ)利用人数与保费乘积的和除以总续保人数,可得本年度的平均保费估计值.
【详解】
解:(I)记A为事件:“一续保人本年度的保费不高于基本保费”.事件A的人数为:60+50=110,该险种的200名续保,
P(A)的估计值为:;
(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.事件B的人数为:30+30=60,P(B)的估计值为:;
(Ⅲ)续保人本年度的平均保费估计值为1.1925a.
【点睛】
本题考查样本估计总体的实际应用,考查计算能力.
某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:
年份 | 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 |
年份代号t | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
人均纯收入y | 2.9 | 3.3 | 3.6 | 4.4 | 4.8 | 5.2 | 5.9 |
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
,
(1);(2)在2007至2013年该地区农村居民家庭人均纯收入在逐年增加,平均每年增加
千元;
元.
【解析】
试题分析:本题主要考查线性回归方程、平均数等基础知识,考查学生的分析问题解决问题的能力、转化能力、计算能力.第一问,先利用平均数的计算公式,由所给数据计算和
,代入公式中求出
和
,从而得到线性回归方程;第二问,利用第一问的结论,将
代入即可求出所求的收入.
试题解析:(1)由所给数据计算得=
(1+2+3+4+5+6+7)=4,
=
(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
,
,
所求回归方程为.
(2)由(1)知,,故2009年至2015年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2017年的年份代号t=9,代入(1)中的回归方程,得,
故预测该地区2017年农村居民家庭人均纯收入为6.8千元.
考点:线性回归方程、平均数.
从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组 |
|
|
|
|
|
频数 | 6 | 26 | 38 | 22 | 8 |
(I)在答题卡上作出这些数据的频率分布直方图:
(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
(1)见解析;(2)平均数100,方差为104;(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
【详解】
(1)直方图如图,
(2)质量指标值的样本平均数为
.
质量指标值的样本方差为
.
(3)质量指标值不低于95的产品所占比例的估计值为
,
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
在某市高中某学科竞赛中,某一个区名考生的参赛成绩统计如图所示.
(1)求这名考生的竞赛平均成绩
(同一组中数据用该组区间中点作代表);
(2)由直方图可认为考生竞赛成绩服正态分布
,其中
,
分别取考生的平均成绩
和考生成绩的方差
,那么该区
名考生成绩超过
分(含
分)的人数估计有多少人?
(3)如果用该区参赛考生成绩的情况来估计全市的参赛考生的成绩情况,现从全市参赛考生中随机抽取名考生,记成绩不超过
分的考生人数为
,求
.(精确到
)
附:①,
;②
,则
,
;③
.
(1)分;(2)634人;(3)0.499
【分析】
(1)根据平均数公式计算;
(2)根据正态分布的对称性计算P(z≥84.81),再估计人数;
(3)根据二项分布的概率公式计算P(ξ≤3).
【详解】
(1)由题意知:
中间值 | | | | | | |
概率 | | | | | | |
∴
,
∴名考生的竞赛平均成绩
为
分.
(2)依题意服从正态分布
,其中
,
,
,∴
服从正态分布
,而
,∴
.∴竞赛成绩超过
分的人数估计为
人
人.
(3)全市竞赛考生成绩不超过分的概率
.而
,∴
.
【点睛】
关于正态曲线在某个区间内取值的概率求法
①熟记P(μ-σ<X≤μ+σ),P(μ-2σ<X≤μ+2σ),P(μ-3σ<X≤μ+3σ)的值.
②充分利用正态曲线的对称性和曲线与x轴之间面积为1.
平顶山市公安局交警支队依据《中华人民共和国道路交通安全法》第条规定:所有主干道路凡机动车途经十字口或斑马线,无论转弯或者直行,遇有行人过马路,必须礼让行人,违反者将被处以
元罚款,记
分的行政处罚.如表是本市一主干路段监控设备所抓拍的
个月内,机动车驾驶员不“礼让斑马线”行为统计数据:
月份 | | | | | |
违章驾驶员人数 | | | | | |
(Ⅰ)请利用所给数据求违章人数与月份
之间的回归直线方程
;
(Ⅱ)预测该路段月份的不“礼让斑马线”违章驾驶员人数.
参考公式:,
.
(Ⅰ);(Ⅱ)
人.
【分析】
(Ⅰ)计算出和
,然后根据公式,求出
和
,得到回归直线方程;(Ⅱ)根据回归直线方程,代入
【详解】
解:(Ⅰ)由表中数据,计算;,
,
,
所以与
之间的回归直线方程为
;
(Ⅱ)时,
,
预测该路段月份的不“礼让斑马线”违章驾驶员人数为
人.
【点睛】
本题考查最小二乘法求回归直线方程,根据回归方程进行预测,属于简单题.
某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
等级 | A | B | C | D |
频数 | 40 | 20 | 20 | 20 |
乙分厂产品等级的频数分布表
等级 | A | B | C | D |
频数 | 28 | 17 | 34 | 21 |
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
(1)甲分厂加工出来的级品的概率为
,乙分厂加工出来的
级品的概率为
;(2)选甲分厂,理由见解析.
【分析】
(1)根据两个频数分布表即可求出;
(2)根据题意分别求出甲乙两厂加工件产品的总利润,即可求出平均利润,由此作出选择.
【详解】
(1)由表可知,甲厂加工出来的一件产品为级品的概率为
,乙厂加工出来的一件产品为
级品的概率为
;
(2)甲分厂加工件产品的总利润为
元,
所以甲分厂加工件产品的平均利润为
元每件;
乙分厂加工件产品的总利润为
元,
所以乙分厂加工件产品的平均利润为
元每件.
故厂家选择甲分厂承接加工任务.
【点睛】
本题主要考查古典概型的概率公式的应用,以及平均数的求法,并根据平均值作出决策,属于基础题.
某客户准备在家中安装一套净水系统,该系统为三级过滤,使用寿命为十年.如图所示,两个一级过滤器采用并联安装,二级过滤器与三级过滤器为串联安装.其中每一级过滤都由核心部件滤芯来实现,在使用过程中,一级滤芯和二级滤芯都需要不定期更换(每个滤芯是否需要更换相互独立),三级滤芯无需更换,若客户在安装净水系统的同时购买滤芯,则一级滤芯每个80元,二级滤芯每个160元.若客户在使用过程中单独购买滤芯,则一级滤芯每个200元,二级滤芯每个400元,现需决策安装净水系统的同时购滤芯的数量,为此参考了根据100套该款净水系统在十年使用期内更换滤芯的相关数据制成的图表,其中图是根据200个一级过滤器更换的滤芯个数制成的柱状图,表是根据100个二级过滤器更换的滤芯个数制成的频数分布表:
二级滤芯更换频数分布表:
二级滤芯更换的个数 | 5 | 6 |
频数 | 60 | 40 |
以200个一级过滤器更换滤芯的频率代替1个一级过滤器更换滤芯发生的概率,以100个二级过滤器更换滤芯的频率代替1个二级过滤器更换滤芯发生的概率.
(1)求一套净水系统在使用期内需要更换的各级滤芯总个数恰好为30的概率;
(2)记表示该客户的净水系统在使用期内需要更换的一级滤芯总数,求
的分布列及数学期望;
(3)记,
分别表示该客户在安装净水系统的同时购买的一级滤芯和二级滤芯的个数.若
,且
,以该客户的净水系统在使用期内购买各级滤芯所需总费用的期望值为决策依据,试确定
,
的值.
(1);(2)见解析;(3)
=23,
=5.
【分析】
(1)根据图表,若一套净水系统在使用期内需要更换的各级滤芯总个数恰好为,则一级
个滤芯,二级
个滤芯,分别算出相应的概率,一次更换为2个一级滤芯和1个二级滤芯,从而得到概率.
(2)由柱状图,一级过滤器需要更换的滤芯个数,分别得到概率,然后得到可能取的值,算出每种情况的概率,写出分布列及数学期望.
(3)因为且
,则可分为两类,即
和
,分别计算他们的数学期望,然后进行比较,选取较小的一组.
【详解】
(1)由题意可知,若一套净水系统在使用期内需要更换的各级滤芯总个数恰好为,则该套净水系统中的两个一级过滤器均需更换
个滤芯,二级过滤器需要更换
个滤芯.设“一套净水系统在使用期内需要更换的各级滤芯总个数恰好为
”为事件
.
因为一个一级过滤器需要更换个滤芯的概率为
,二级过滤器需要更换
个滤芯的概率为
,
所以.
(2)由柱状图可知,
一个一级过滤器需要更换的滤芯个数为,
,
的概率分别为
,
,
.
由题意,可能的取值为
,
,
,
,
,并且
,
,
,
,
.
所以的分布列为
| | | | | |
| | | | | |
.
(3)【解法一】
因为,
,若
,
,
则该客户在十年使用期内购买各级滤芯所需总费用的期望值为;
若,
,
则该客户在十年使用期内购买各级滤芯所需总费用的期望值为
.
故,
的值分别为
,
.
【解法二】
因为,
,若
,
,
设该客户在十年使用期内购买一级滤芯所需总费用为(单位:元),则
| | | |
| | | |
.
设该客户在十年使用期内购买二级滤芯所需总费用为(单位:元),则
,
.
所以该客户在十年使用期内购买各级滤芯所需总费用的期望值为
.
若,
,
设该客户在十年使用期内购买一级滤芯所需总费用为(单位:元),则
| | |
| | |
.
设该客户在十年使用期内购买二级滤芯所需总费用为(单位:元),则
| | |
| | |
.
所以该客户在十年使用期内购买各级滤芯所需总费用的期望值为
.
故,
的值分别为
,
.
【点睛】
本题题目较长,信息量比较大,需要对条件中的信息重新整理分类,考查了直方图和表格求概率,独立重复试验的概率和分布列,以及利用数学期望解决实际问题.属于中档题.
我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨)、一位居民的月用水量不超过
的部分按平价收费,超出
的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照
,
分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使的居民每月的用水量不超过标准
(吨),估计
的值,并说明理由.
(1);(2)
万;(3)
.
【详解】
试题分析:本题主要考查频率分布直方图、频率、频数的计算等基础知识,考查学生的分析问题、解决问题的能力. 第(1)问,由高×组距=频率,计算每组的频率,根据所有频率之和为1,计算出a的值;第(2)问,利用高×组距=频率,先计算出每人月均用水量不低于3吨的频率,再利用频率×样本容量=频数,计算所求人数;第(3)问,将前6组的频率之和与前5组的频率之和进行比较,得出2.5≤x<3,再估计x的值.
试题解析:(1)由频率分布直方图知,月均用水量在中的频率为0.08×0.5=0.04,
同理,在中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,
解得a=0.30.
(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为
300 000×0.12="36" 000.
(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,
而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,
所以2.5≤x<3.
由0.3×(x–2.5)=0.85–0.73,
解得x=2.9.
所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
【考点】
频率分布直方图
【名师点睛】
本题主要考查频率分布直方图、频率、频数的计算公式等基础知识,考查学生的分析问题、解决问题的能力.在频率分布直方图中,第n个小矩形的面积就是相应组的频率,所有小矩形的面积之和为1,这是解题的关键,也是识图的基础.
某市为了考核甲,乙两部门的工作情况,随机访问了50位市民,根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲,乙两部门评分的中位数;
(2)分别估计该市的市民对甲,乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲,乙两部门的评价.
(1)该市的市民对甲、乙两部门评分的中位数的估计值分别为75,67;(2);(3)详见解析.
【解析】
试题分析:(1)50名市民对甲部门的评分由小到大排序,排在第25,26位的平均数即为甲部门评分的中位数.同理可得乙部门评分的中位数.(2)甲部门的评分高于90的共有5个,所以所求概率为;乙部门的评分高于90的共8个,所以所求概率为
.(3)市民对甲部门的评分的中位数高于乙部门的评分的中位数,且甲部门的评分较集中,乙部门的评分相对分散,即甲部门的评分的方差比乙部门的评分的方差小.
试题解析:解:(1)由所给茎叶图知,将50名市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故甲样本的中位数为75,所以该市的市民对甲部门评分的中位数估计值是75.
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为,所以该市的市民对乙部门评分的中位数的估计值是67.
(2)由所给茎叶图知,50位市民对甲,乙部门的评分高于90的比率为,故该市的市民对甲,乙部门的评分高于90的概率的估计分别为
;
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于乙部门的评分的标准差,说明该市市民对甲部门的评价较高,评价较为一致,对乙部门的评价较低,评价差异较大.(注:考生利用其它统计量进行分析,结论合理的同样给分).
考点:1平均数,古典概型概率;2统计.
某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:
(1)求图中的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分,众数,中位数;
(3)若这100名学生语文成绩某些分数段的人数()与数学成绩相应分数段的人数(
)之比如下表所示,求数学成绩在
之外的人数.
分数段 | | | | |
| 1:1 | 2:1 | 3:4 | 4:5 |
(1)0.005;(2)平均分为73,众数为65,中位数为 ;(3)10
【分析】
(1)根据频率之和为1,直接列式计算即可;
(2)平均数等于每组的中间值乘以该组频率,再求和;众数指频率最大的一组的中间值;中位数两端的小长方形面积之和均为0.5;
(3)根据题意分别求出,
,
,
的人数,即可得出结果.
【详解】
(1)由频率分布直方图可得:,
(2)平均分为众数为65分.
中位数为
(3)数学成绩在的人数为
,
在的人数为
,
在的人数为
,
在的人数为
,
在的人数为
,
所以数学成绩在之外的人数为100-5-20-40-25=10.
【点睛】
本题主要考查样本估计总体,由题中频率分布直方图,结合平均数、中位数等概念,即可求解,属于基础题型.
某公司为了了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对其产品的满意度的评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.
A地区用户满意度评分的频率分布直方图
B地区用户满意度评分的频率分布表
满意度评分分组 |
|
|
|
|
|
频数 | 2 | 8 | 14 | 10 | 6 |
(Ⅰ)在答题卡上作出B地区用户满意度评分的频率分布直方图,并通过此图比较两地区满意度评分的平均值及分散程度.(不要求计算出具体值,给出结论即可)
B地区用户满意度评分的频率分布直方图
(Ⅱ)根据用户满意度评分,将用户的满意度评分分为三个等级:
满意度评分 | 低于70分 | 70分到89分 | 不低于90分 |
满意度等级 | 不满意 | 满意 | 非常满意 |
估计哪个地区的用户的满意度等级为不满意的概率大,说明理由.
(Ⅰ)见试题解析(Ⅱ)A地区的用户的满意度等级为不满意的概率大.
【解析】
试题分析:(Ⅰ)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值,B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(II)由直方图得的估计值为
,
的估计值为
,所以A地区的用户的满意度等级为不满意的概率大.
试题解析:(Ⅰ)
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值,B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(Ⅱ)A地区的用户的满意度等级为不满意的概率大.
记 表示事件“A地区的用户的满意度等级为不满意”;
表示事件“B地区的用户的满意度等级为不满意”.
由直方图得的估计值为
,
的估计值为
,
所以A地区的用户的满意度等级为不满意的概率大.
考点:本题主要考查频率分布直方图及概率估计.
足球是世界普及率最高的运动,我国大力发展校园足球.为了解本地区足球特色学校的发展状况,社会调查小组得到如下统计数据:
年份x | 2014 | 2015 | 2016 | 2017 | 2018 |
足球特色学校y(百个) | 0.30 | 0.60 | 1.00 | 1.40 | 1.70 |
(1)根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱.
(已知:,则认为y与x线性相关性很强;
,则认为y与x线性相关性一般;
,则认为y与x线性相关性较):
(2)求y关于x的线性回归方程,并预测A地区2020年足球特色学校的个数(精确到个).
参考公式和数据:,
,
.
(1) ,y与x线性相关性很强
(2),244
【分析】
(1)根据题意计算出r,再比较即得解;(2)根据已知求出线性回归方程,再令x=2020即得解.
【详解】
(1)由题得
所以,
y与x线性相关性很强.
(2)
,
,
关于
的线性回归方程是
.
当时,
,
即该地区2020年足球特色学校有244个.
【点睛】
本题主要考查相关系数的应用,考查线性回归方程的求法和应用,意在考查学生对这些知识的理解掌握水平.
随着经济的发展,个人收入的提高,自2019年1月1日起,个人所得税起征点和税率的调整,调整如下:纳税人的工资、薪金所得,以每月全部收入额减除5000元后的余额为应纳税所得额,依照个人所得税税率表,调整前后的计算方法如下表:
(1)假如小红某月的工资、薪金等所得税前收入总和不高于8000元,记表示总收入,
表示应纳的税,试写出调整前后
关于
的函数表达式;
(2)某税务部门在小红所在公司利用分层抽样方法抽取某月100个不同层次员工的税前收入,并制成下面的频数分布表:
①先从收入在及
的人群中按分层抽样抽取7人,再从中选4人作为新纳税法知识宣讲员,用
表示抽到作为宣讲员的收入在
元的人数,
表示抽到作为宣讲员的收入在
元的人数,随机变量
,求
的分布列与数学期望;
②小红该月的工资、薪金等税前收入为7500元时,请你帮小红算一下调整后小红的实际收入比调整前增加了多少?
(1)见解析;(2)见解析
【分析】
(1) 依照个人所得税税率表,调整前后的计算方法表示调整前后y关于的函数表达式;
(2) ①由频数分布表可知Z的取值可能为0,2,4,求出相应的概率值得到分布列与期望值,②由于小李的工资、薪金等收入为7500元,按调整前起征点应纳个税为295元,按调整后起征点应纳个税为75元,从而得到结果.
【详解】
(1)调整前y关于x的表达式为
.
调整后y关于x的表达式为
,
(2)①由频数分布表可知从及
的人群中抽取7人,其中
中占3人,
的人中占4人,再从这7人中选4人,所以Z的取值可能为0,2,4,(5分)
,
,
,
所以其分布列为
Z | 0 | 2 | 4 |
P | | | |
所以
②由于小李的工资、薪金等收入为7500元,按调整前起征点应纳个税为1500×3%+2500×10%=295元;
按调整后起征点应纳个税为2500×3%=75元,
比较两个纳税方案可知,按调整后起征点应纳个税少交220元,
即个人的实际收入增加了220元,所以小李的实际收入增加了220元.
【点睛】
求解离散型随机变量的数学期望的一般步骤为:
第一步是“判断取值”,即判断随机变量的所有可能取值,以及取每个值所表示的意义;
第二步是:“探求概率”,即利用排列组合、枚举法、概率公式(常见的有古典概型公式、几何概型公式、互斥事件的概率和公式、独立事件的概率积公式,以及对立事件的概率公式等),求出随机变量取每个值时的概率;第三步是“写分布列”,即按规范形式写出分布列,并注意用分布列的性质检验所求的分布列或事件的概率是否正确;第四步是“求期望值”,一般利用离散型随机变量的数学期望的定义求期望的值,对于有些实际问题中的随机变量,如果能够断定它服从某常见的典型分布(如二项分布X~B(n,p)),则此随机变量的期望可直接利用这种典型分布的期望公式(E(X)=np)求得.
某种产品的广告费支出与销售额
(单位:万元)具有较强的相关性,且两者之间有如下对应数据:
| 2 | 4 | 5 | 6 | 8 |
| 28 | 36 | 52 | 56 | 78 |
(1)求关于
的线性回归方程
;
(2)根据(1)中的线性回归方程,当广告费支出为10万元时,预测销售额是多少?
参考数据: ,
,
.
附:回归方程中斜率和截距的最小二乘估计公式分别为:
,
.
(1)(2)当广告费支出为10万元时,预测销售额大约为
.
【分析】
(1)利用公式和题目中的数据,先求样本中心,代入方程直接求解.
(2)根据第一问的方程,当时代入求解.
【详解】
:(1),
,
因此所求回归直线方程为
(法二:利用前半个公式求解相应给分)
(2)当时,
答:当广告费支出为10万元时,预测销售额大约为.
【说明:没有答题和估计的扣两分】
【点睛】
:回归直线方程必过样本中心.回归直线
及回归系数
是一个近似值,只能大致的(不能精确)反映变量的取值和变化趋势.
一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.
将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.
(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;
(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望E(X)及方差D(X).
(1)0.108.(2) 1.8,0.72.
【解析】
试题分析:(1)设表示事件“日销售量不低于100个”,
表示事件“日销售量低于50个”,B表示事件“在未来连续3天里有连续2天日销售量不低于100个且另一天的日销售量低于50个”.因此
可求出,
,利用事件的独立性即可求出
;(2)由题意可知X~B(3,0.6),所以即可列出分布列,求出期望为E(X)和方差D(X)的值.
(1)设表示事件“日销售量不低于100个”,
表示事件“日销售量低于50个”,B表示事件“在未来连续3天里有连续2天日销售量不低于100个且另一天的日销售量低于50个”.因此
.
.
.
(2)X的可能取值为0,1,2,3.相应的概率为
,
,
,
,
分布列为
X | 0 | 1 | 2 | 3 |
P | 0.064 | 0.288 | 0.432 | 0.216 |
因为X~B(3,0.6),所以期望为E(X)=3×0.6=1.8,方差D(X)=3×0.6×(1-0.6)=0.72
考点:1.频率分布直方图;2.二项分布.
某学校为担任班主任的教师办理手机语音月卡套餐,为了解通话时长,采用随机抽样的方法,得到该校100位班主任每人的月平均通话时长(单位:分钟)的数据,其频率分布直方图如图所示,将频率视为概率.
(1)求图中的值;
(2)估计该校担任班主任的教师月平均通话时长的中位数;
(3)在,
这两组中采用分层抽样的方法抽取6人,再从这6人中随机抽取2人,求抽取的2人恰在同一组的概率.
(1) (2)390分钟. (3)
【分析】
(1)根据频率分布直方图中所有矩形的面积和为1,列出方程,即可求解;
(2)设该校担任班主任的教师月平均通话时长的中位数为,根据频率分布直方图的中位数的计算方法,即可求解.
(3)根据分层抽样,可得在内抽取
人,分别记为
,在
内抽取2人,记为
,利用古典概型及其概率的计算公式,即可求解.
【详解】
(1)依题意,根据频率分布直方图的性质,可得:
,解得
.
(2)设该校担任班主任的教师月平均通话时长的中位数为.
因为前2组的频率之和为,
前3组的频率之和为,
所以,由
,得
.
所以该校担任班主任的教师月平均通话时长的中位数为390分钟.
(3)由题意,可得在内抽取
人,分别记为
,
在内抽取2人,记为
,
则6人中抽取2人的取法有:,
,
,
,
,
,
,
,
,
,
,
,
,
,
,共15种等可能的取法.
其中抽取的2人恰在同一组的有,
,
,
,
,
,
,共7种取法,
所以从这6人中随机抽取的2人恰在同一组的概率.
【点睛】
本题主要考查了频率分布直方图的应用,以及古典概型及其概率的计算,其中解答中熟记频率分布直方图的相关性质,合理利用古典概型及其概率的计算公式,准确计算是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.
某网购平台为了解某市居民在该平台的消费情况,从该市使用其平台且每周平均消费额超过100元的人员中随机抽取了100名,并绘制如图所示频率分布直方图,已知中间三组的人数可构成等差数列.
(1)求的值;
(2)分析人员对100名调查对象的性别进行统计发现,消费金额不低于300元的男性有20人,低于300元的男性有25人,根据统计数据完成下列列联表,并判断是否有
的把握认为消费金额与性别有关?
(3)分析人员对抽取对象每周的消费金额与年龄
进一步分析,发现他们线性相关,得到回归方程
.已知100名使用者的平均年龄为38岁,试判断一名年龄为25岁的年轻人每周的平均消费金额为多少.(同一组数据用该区间的中点值代替)
列联表
男性 | 女性 | 合计 | |
消费金额 | |||
消费金额 | |||
合计 |
临界值表:
| 0.050 | 0.010 | 0.001 |
| 3.841 | 6.635 | 10.828 |
,其中
(1),
(2)详见解析(3)395元
【分析】
(1)根据频率分布直方图可得,结合
可得
的值.
(2)根据表格数据可得,再根据临界值表可得有
的把握认为消费金额与性别有关.
(3)由频率分布直方图可得调查对象的周平均消费,从而得到,利用线性回归方程可计算年龄为25岁的年轻人每周的平均消费金额.
【详解】
(1)由频率分布直方图可知,,
由中间三组的人数成等差数列可知,
可解得,
(2)周平均消费不低于300元的频率为,因此100人中,周平均消费不低于300元的人数为
人.
所以列联表为
男性 | 女性 | 合计 | |
消费金额 | 20 | 40 | 60 |
消费金额 | 25 | 15 | 40 |
合计 | 45 | 55 | 100 |
所以有的把握认为消费金额与性别有关.
(3)调查对象的周平均消费为
,
由题意,∴
.
∴该名年龄为25岁的年轻人每周的平均消费金额为395元.
【点睛】
(1)频率分布直方图中,各矩形的面积之和为1,注意直方图中,各矩形的高是;
(2)两类变量是否相关,应先计算的值,再与临界值比较后可判断是否相关.
(3)线性回归方程对应的直线必经过.
某同学在研究性学习中,收集到某工厂今年前5个月某种产品的产量(单位:万件)的数据如下表:
x(月份) | 1 | 2 | 3 | 4 | 5 |
y(产量) | 4 | 4 | 5 | 6 | 6 |
(1)若从这5组数据中随机抽出2组,求抽出的2组数据恰好是相邻两个月的数据的概率;
(2)求出y关于x的线性回归方程,并估计今年6月份该种产品的产量.
参考公式:,
.
(1)(2)
;0.75.
【分析】
(1)设事件A为“抽出的2组数据恰好是相邻两个月的数据”,利用列举法求得基本事件的总数,利用古典概型的概率计算公式,即可求解.
(2) 利用公式,求得的值,得出回归直线的方程,代入
时,即可作出结论.
【详解】
(1)设事件A为“抽出的2组数据恰好是相邻两个月的数据”,
所有的基本事件(其中m,n表示月份)有
,
,
,
,
,
,
,
,
,
,共10种,
其中事件A包含的基本事件有,
,
,
,共4种,
∴.
(2) 由题意,可得,
,
,
,
所以,则
,
所以回归直线的方程为.
当时,
.
故今年6月份该种产品的产量大约为6.8万件.
【点睛】
本题主要考查了古典概型及其概率的计算,以及回归直线方程的应用,其中解答中认真审题,合理利用列举法求得基本事件的总数,以及利用公式准确计算是解答的关键,着重考查了推理与运算能力,属于中档试题.
为更好地落实农民工工资保证金制度,南方某市劳动保障部门调查了年下半年该市
名农民工(其中技术工、非技术工各
名)的月工资,得到这
名农民工月工资的中位数为
百元(假设这
名农民工的月工资均在
(百元)内)且月工资收入在
(百元)内的人数为
,并根据调查结果画出如图所示的频率分布直方图:
(Ⅰ)求,
的值;
(Ⅱ)已知这名农民工中月工资高于平均数的技术工有
名,非技术工有
名,则能否在犯错误的概率不超过
的前提下认为是不是技术工与月工资是否高于平均数有关系?
参考公式及数据:,其中
.
| | | | |
| | | | |
(Ⅰ),
;(Ⅱ)不能在犯错误的概率不超过
的前提下,认为是不是技术工与月工资是否高于平均数有关
【解析】
(Ⅰ)根据频数计算出月工资收入在(百元)内的频率,利用频率总和为
和频率分布直方图估计中位数的方法可构造出关于
的方程组,解方程组求得结果;(Ⅱ)根据题意得到列联表,从而计算出
,从而得到结论.
【详解】
(Ⅰ)月工资收入在
(百元)内的人数为
月工资收入在
(百元)内的频率为:
;
由频率分布直方图得:
化简得:……①
由中位数可得:
化简得:……②
由①②解得:,
(Ⅱ)根据题意得到列联表:
技术工 | 非技术工 | 总计 | |
月工资不高于平均数 | | | |
月工资高于平均数 | | | |
总计 | | | |
不能在犯错误的概率不超过
的前提下,认为是不是技术工与月工资是否高于平均数有关
【点睛】
本题考查频率分布直方图中的频率和中位数的计算、独立性检验解决实际问题,考查基础运算能力,属于常规题型.
近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表l所示:
表1
根据以上数据,绘制了如右图所示的散点图.
(1)根据散点图判断,在推广期内,(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表1中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次;
参考数据:
其中
参考公式:
对于一组数据,其回归直线
的斜率和截距的最小二乘估计公式分别为:
.
(1)(2)
【分析】
(1)根据散点图判断,适宜;(2)
,两边同时取常用对数得:
,根据公式得到均值和系数即可得到公式,再代入x=8可得到估计值.
【详解】
(1)根据散点图判断,适宜作为扫码支付的人数
关于活动推出天数
的回归方程类型;
(2),两边同时取常用对数得:
;
设
,
,
把样本中心点代入
,得:
,
,
,
关于
的回归方程式:
;
把代入上式,
;
活动推出第天使用扫码支付的人次为
;
【点睛】
本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x与Y之间的关系,这条直线过样本中心点.线性回归方程适用于具有相关关系的两个变量,对于具有确定关系的两个变量是不适用的,线性回归方程得到的预测值是预测变量的估计值,不是准确值.
随着国内电商的不断发展,快递业也进入了高速发展时期,按照国务院的发展战略布局,以及国家邮政管理总局对快递业的宏观调控,SF快递收取快递费的标准是:重量不超过1kg的包裹收费10元;重量超过1kg的包裹,在收费10元的基础上,每超过1kg(不足1kg,按1kg计算)需再收5元.某县SF分代办点将最近承揽的100件包裹的重量统计如下:
重量(单位:kg) | | | | | |
件数 | 43 | 30 | 15 | 8 | 4 |
对近60天,每天揽件数量统计如下表:
件数范围 | 0~100 | 101~200 | 201~300 | 301~400 | 401~500 |
件数 | 50 | 150 | 250 | 350 | 450 |
天数 | 6 | 6 | 30 | 1 | 6 |
以上数据已做近似处理,将频率视为概率.
(1)计算该代办点未来5天内不少于2天揽件数在101~300之间的概率;
(2)①估计该代办点对每件包裹收取的快递费的平均值;
②根据以往的经验,该代办点将快递费的三分之一作为前台工作人员的工资和公司利润,其余的用作其他费用.目前该代办点前台有工作人员3人,每人每天揽件不超过150件,日工资110元.代办点正在考虑是否将前台工作人员裁减1人,试计算裁员前后代办点每日利润的数学期望,若你是决策者,是否裁减工作人员1人?
(1)(2)①15,②代办点不应将前台工作人员裁员1人
【分析】
(1)由题意得到样本中包裹件数在101~300之间的概率为,进而得到包裹件数在101~300之间的天数服从二项分布
,即可求解相应的概率;
(2)①利用平均数的计算公式,求得样本中每件快递收取的费用的平均值,即可得到结论;
②根据题意及①,分别计算出不裁员和裁员,代办点平均每日利润的期望值,比较即可得到结论.
【详解】
(1)由题意,可得样本中包裹件数在101~300之间的天数为36,频率,
故可估计概率为,
显然未来5天中,包裹件数在101~300之间的天数服从二项分布,即,
故所求概率为.
(2)①样本中快递费用及包裹件数如下表:
包裹重量(单位:kg) | 1 | 2 | 3 | 4 | 5 |
快递费(单位:元) | 10 | 15 | 20 | 25 | 30 |
包裹件数 | 43 | 30 | 15 | 8 | 4 |
故样本中每件快递收取的费用的平均值为,
故估计该代办点对每件快递收取的费用的平均值为15元.
②代办点不应将前台工作人员裁员1人,理由如下:
根据题意及(2)①,搅件数每增加1,代办点快递收入增加15(元),
若不裁员,则每天可揽件的上限为450件,代办点每日揽件数情况如下:
包裹件数范围 | 0~100 | 101~200 | 201~300 | 301~400 | 401~500 |
包裹件数(近似处理) | 50 | 150 | 250 | 350 | 450 |
实际揽件数 | 50 | 150 | 250 | 350 | 450 |
频率 | 0.1 | 0.1 | 0.5 | 0.2 | 0.1 |
EY | |
故代办点平均每日利润的期望值为(元);
若裁员1人,则每天可揽件的上限为300件,代办点每日揽件数情况如下:
包裹件数范围 | 0~100 | 101~200 | 201~300 | 301~400 | 401~500 |
包裹件数(近似处理) | 50 | 150 | 250 | 350 | 450 |
实际揽件数 | 50 | 150 | 250 | 300 | 300 |
频率 | 0.1 | 0.1 | 0.5 | 0.2 | 0.1 |
EY | |
则代办点平均每日利润的期望值为(元),
故代办点不应将前台工作人员裁员1人.
【点睛】
本题主要考查了二项分布的应用,以及期望的求解及应用,其中解答中正确理解题意,熟记利用二项分布的概率计算方法,以及准确计算代办点平均每日利润的期望是解答的关键,着重考查了分析问题和解答问题的能力,属于中档试题.
依据某地某条河流8月份的水文观测点的历史统计数据所绘制的频率分布直方图如图(甲)所示;依据当地的地质构造,得到水位与灾害等级的频率分布条形图如图(乙)所示.
(1)以此频率作为概率,试估计该河流在8月份发生1级灾害的概率;
(2)该河流域某企业,在8月份,若没受1、2级灾害影响,利润为500万元;若受1级灾害影响,则亏损100万元;若受2级灾害影响则亏损1000万元.
现此企业有如下三种应对方案:
方案 | 防控等级 | 费用(单位:万元) |
方案一 | 无措施 | 0 |
方案二 | 防控1级灾害 | 40 |
方案三 | 防控2级灾害 | 100 |
试问,如仅从利润考虑,该企业应选择这三种方案中的哪种方案?说明理由.
(1)(2)应选方案二.
【详解】
(1)依据甲图,记该河流8月份“水位小于40米”为事件,“水位在40米至50米之间”为事件
,“水位大于50米”为事件
,它们发生的概率分别为:
,
.
记该地8月份“水位小于40米且发生1级灾害”为事件,“水位在40米至50米之间且发生1级灾害”为事件
,“水位大于50米且发生1级灾害”为事件
,
所以.
记“该河流在8月份发生1级灾害”为事件.则
.
估计该河流在8月份发生1级灾害的概率为.
(2)以企业利润为随机变量,
选择方案一,则利润(万元)的取值为:
,由(1)知
.
的分布列为
X1 | 500 | -100 | -1000 |
P | 0.81 | 0.155 | 0.035 |
则该企业在8月份的利润期望
(万元).
选择方案二,则(万元)的取值为:
,由(1)知,
,
的分布列为:
X2 | 460 | -1040 |
P | 0.965 | 0.035 |
则该企业在8月份的平均利润期望(万元)
选择方案三,则该企业在8月份的利润为:(万元)由于
,因此企业应选方案二.
随着智能手机的普及,使用手机上网成为了人们日常生活的一部分,很多消费者对手机流量的需求越来越大.长沙某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价:(单位:元/月)和购买人数
(单位:万人)的关系如表:
流量包的定价(元/月) | 30 | 35 | 40 | 45 | 50 |
购买人数(万人) | 18 | 14 | 10 | 8 | 5 |
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合与
的关系?并指出是正相关还是负相关;
(2)①求出关于
的回归方程;
②若该通信公司在一个类似于试点的城市中将这款流量包的价格定位25元/ 月,请用所求回归方程预测长沙市一个月内购买该流量包的人数能否超过20 万人.
参考数据:,
,
.
参考公式:相关系数,回归直线方程
,其中
,
.
(1)见解析;(2)①;②一个月内购买该流量包的人数会超过20万人.
【分析】
(1) 根据题意,得,
计算出相关系数
,从而可以作出判断;
(2) ①求出回归直线方程,②由①知,若,则
,从而预测长沙市一个月内购买该流量包的人数会超过20万人
【详解】
(1)根据题意,得,
.
可列表如下
根据表格和参考数据,得,
.
因而相关系数.
由于很接近1,因而可以用线性回归方程模型拟合
与
的关系.
由于,故其关系为负相关.
(2)①,
,
因而关于
的回归方程为
.
②由①知,若,则
,故若将流量包的价格定为25元/月,可预测长沙市一个月内购买该流量包的人数会超过20万人.
【点睛】
本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算的值;③计算回归系数
;④写出回归直线方程为
; 回归直线过样本点中心
是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.
某校从参加某次知识竞赛的同学中,选取60名同学将其成绩(百分制,均为整数)分成,
,
,
,
,
六组后,得到部分频率分布直方图(如图),观察图形中的信息,回答下列问题:
(1)求分数内的频率,并补全这个频率分布直方图;
(2)从频率分布直方图中,估计本次考试成绩的中位数;
(3)若从第1组和第6组两组学生中,随机抽取2人,求所抽取2人成绩之差的绝对值大于10的概率.
(1)见解析(2) (3)
【解析】
分析:(1)利用所有小矩形的面积之和为,求得分数在
内的频率,再根据小矩形的高,即可补全频率分布直方图;
(2)根据中位数的左、右两边的小矩形的面积之和相等,即可求出中位数;
(3)计算从第一组和第六组所有人数中任取人的取法总数,利用古典概型的概率计算公式,即可求解.
详解:(1)设分数在内的频率为
,根据频率分布直方图,
则有,可得
,
所以频率分布直方图为:
(2)以中位数为准做一条垂直于横轴的直线,这条直线把频率分布直方图分成面积相等的两个部分,由频率分布直方图知中位数要把最高的小长方形三等分,
所以中位数是,所以估计本次考试成绩的中位数为
(3)设所抽取2人成绩之差的绝对值大于10为事件,
第1组学生数:人(设为1,2,3,4,5,6)
第6组学生数:人(设为
)
所有基本事件有:12,13,14,15,16,,23,24,25,26,
,
,
,34,35,36,
,
,
,45,46,
,
,
,56,
,
,
,
,
,
,
,
,
共有35种,
事件包括的基本事件有:
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
共有18种
所以.
点睛:本题考查了利用样本估计总体的综合应用问题,以及古典概型及其概率的计算问题,对弈频率分布直方图,应注意:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行调查,通过抽样,获得某年100为居民每人的月均用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图.
(1)求直方图的的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月用水量的中位数.
(1) ; (2)36000;(3)
.
【分析】
本题主要考查频率分布直方图、频率、频数的计算等基础知识,考查学生的分析问题、解决问题的能力. 第(Ⅰ)问,由高×组距=频率,计算每组的频率,根据所有频率之和为1,计算出a的值;第(Ⅱ)问,利用高×组距=频率,先计算出每人月均用水量不低于3吨的频率,再利用频率×样本容量=频数,计算所求人数;第(Ⅲ)问,将前5组的频率之和与前4组的频率之和进行比较,得出2≤x<2.5,再估计月均用水量的中位数.
【详解】
(Ⅰ)由频率分布直方图,可知:月均用水量在的频率为0.08×0.5=0.04.
同理,在等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1–(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得a=0.30.
(Ⅱ)由(Ⅰ)100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36000.
(Ⅲ)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5
所以2≤x<2.5.
由0.50×(x–2)=0.5–0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
【考点】
频率分布直方图
【名师点睛】
本题主要考查频率分布直方图、频率、频数的计算公式等基础知识,考查学生的分析问题、解决问题的能力.在频率分布直方图中,第n个小矩形的面积就是相应组的频率,所有小矩形的面积之和为1,这是解题的关键,也是识图的基础.
已知x,y的取值如下表:
x | 2 | 3 | 4 | 5 |
y | 2.2 | 3.8 | 5.5 | 6.5 |
从散点图分析,y与x线性相关,且回归方程为=1.46x+
,则实数
的值为________.
—0.61
【分析】
根据所给条件求出,
,把样本中心点
代入回归直线方程
,可以得到关于
的方程,解出即可得到答案
【详解】
根据题意可得
则这组数据的样本中心点是
代入到回归直线方程
故答案为
【点睛】
本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.
我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.
0.98.
【分析】
本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.
【详解】
由题意得,经停该高铁站的列车正点数约为,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为
.
【点睛】
本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.
某课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应城市个数分别为4, 12, 8.若用分层抽样法来抽取6个城市,则甲组中应抽取的城市个数为__________.
1
【解析】
每个个体被抽到的概率等于,故甲组中应抽取的城市数为
,故答案为1.
点睛:本题主要考查了分层抽样方法及其应用,分层抽样中各层抽取个数依据各层个体数之比来分配,这是分层抽样的最主要的特点,首先各确定分层抽样的个数,分层后,各层的抽取一定要考虑到个体数目,选取不同的抽样方法,但一定要注意按比例抽取,牢记分层抽样的特点和方法是解答的关键,着重考查了学生的分析问题和解答问题的能力.
图2-1是某高三学生进入高中三年来的数学考试成绩茎叶图,第1次到12次的考试成绩依次记为A1,A2,…,A12.图2-2是统计茎叶图中成绩在一定范围内考试次数的一个算法流程图.那么算法流程图输出的结果是 _______.
9
【解析】分析程序中的语句和变量作用,再根据流程图所示顺序,可知:该程序的作用是累加12次考试成绩超过90分的人数,根据茎叶图含义可得超过90分的人数为9人故答案填9
交通拥堵指数是综合反映道路网畅通或拥堵的概念,记交通拥堵指数为T,其范围为,分别有五个级别;
畅通;
基本畅通;
轻度拥堵;
中度拥堵;
严重拥堵.晚高峰时段(T≥2),从某市交通指挥中心选取了市区20个交通路段,依据其交通拥堵指数数据绘制的直方图如图所示,用分层抽样的方法从交通指数在
的路段中共抽取6个路段,则中度拥堵的路段应抽取_____个.
3
【解析】
由频率分布直方图知,
,
的路段共有
(个),按分层抽样,从
个路段选出
个,抽样比为
.
∵中度拥堵
∴中度拥堵的路段应抽取(个).
故答案为.
点睛:进行分层抽样的相关计算时,常利用以下关系式求解:
(1)抽样比=样本数÷样本总数;
(2).
某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
分层抽样.
【解析】
分析:由题可知满足分层抽样特点
详解:由于从不同龄段客户中抽取,故采用分层抽样
故答案为分层抽样.
点睛:本题主要考查简单随机抽样,属于基础题.
某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________ 件.
18
【解析】
应从丙种型号的产品中抽取件,故答案为18.
点睛:在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N.
已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.
90.
【解析】
分析:先由茎叶图得数据,再根据平均数公式求平均数.
详解:由茎叶图可知,5位裁判打出的分数分别为,故平均数为
.
点睛:的平均数为
.
已知一组数据6,7,8,8,9,10,则该组数据的方差是____.
.
【分析】
由题意首先求得平均数,然后求解方差即可.
【详解】
由题意,该组数据的平均数为,
所以该组数据的方差是.
【点睛】
本题主要考查方差的计算公式,属于基础题.