【步步高 江苏专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题六 第3讲


第3讲





【高考考情解读】 1.该部分常考内容:样本数字特征的计算、各种统计图表,有时也会在 知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为填空题,重在考查 基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题.

1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范 围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几 部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 =频率; 组距

②各小长方形的面积之和等于 1; 频率 1 ③小长方形的高= ,所有小长方形的高的和为 . 组距 组距 (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 众数 样本数据 出现次数最多的数据 频率分布直方图 取最高的小长方形底边中点 的横坐标

将数据按大小依次排列, 处在最 把频率分布直方图划分左右 中位数 中间位置的一个数据(或最中间 两个数据的平均数) 平均数 样本数据的算术平均数 两个面积相等的分界线与 x 轴交点的横坐标 每个小矩形的面积乘以小矩 形底边中点的横坐标之和

1 (2)方差:s2= [(x1- x )2+(x2- x )2+?+(xn- x )2]. n 标准差: s= 1 [?x - x ?2+?x2- x ?2+?+?xn- x ?2]. n 1

考点一 抽样方法 例1 (2012· 山东改编)采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随 机编号为 1,2,?,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到 的 32 人中,编号落入区间[1,450]的人做问卷 A,编号落入区间[451,750]的人做问卷 B, 其余的人做问卷 C.则抽到的人中,做问卷 B 的人数为________. 答案 10 解析 由系统抽样的特点知:抽取号码的间隔为 960 = 30 , 抽 取 的 号 码 依 次 为 32

9,39,69,?,939.落入区间[451,750]的有 459,489,?,729,这些数构成首项为 459, 公差为 30 的等差数列,设有 n 项,显然有 729=459+(n-1)×30,解得 n=10.所以做 问卷 B 的有 10 人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 N 成几个组,则分段间隔即为 (N 为样本容量),首先确定在第一组中抽取的个体的号码 n 数, 再从后面的每组中按规则抽取每个个体. 解决此类题目的关键是深刻理解各种抽样 方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的, 都等于样本容量和总体容量的比值. (1)(2013· 江西改编)总体由编号为 01,02,?,19,20 的 20 个个体组成,利用 下面的随机数表选取 5 个个体, 选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开 始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为________. 7816 3204 6572 9234 0802 4935 6314 8200 0702 3623 4369 4869 9728 6938 0198 7481

(2)某单位 200 名职工的年龄分布情况如图所示,现要从中抽取 40 名职工作样本.用系 统抽样法,将全体职工随机按 1~200 编号,并按编号顺序平均分为 40 组(1~5 号,6~ 10 号,?,196~200 号).若第 5 组抽出的号码为 22,则第 8 组抽出的号码应是 ________.若用分层抽样方法,则 40 岁以下年龄段应抽取________人.

答案 解析

(1)01

(2)37 20

(1)从第 1 行第 5 列、第 6 列组成的数 65 开始由左到右依次选出的数为:

08,02,14,07,01,所以第 5 个个体编号为 01. (2)由分组可知,抽号的间隔为 5,又因为第 5 组抽出的号码为 22,即第 n 组抽取的号 码为 5n-3, 所以第 8 组抽出的号码为 37; 40 岁以下年龄段的职工数为 200×0.5=100, 40 则应抽取的人数为 ×100=20 人. 200 考点二 用样本估计总体 例2 (2012· 广东)某校 100 名学生期中考试语文成绩的频率分布直方图如图所示,其中成

绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].

(1)求图中 a 的值; (2)根据频率分布直方图,估计这 100 名学生语文成绩的平均分; (3)若这 100 名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比 如下表所示,求数学成绩在[50,90)之外的人数. 分数段 x∶y 解 [50,60) 1∶1 [60,70) 2∶1 [70,80) 3∶4 [80,90) 4∶5

(1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得 a=0.005.

(2) 由 频 率 分 布 直 方 图 知 这 100 名 学 生 语 文 成 绩 的 平 均 分 为 55×0.005×10 + 65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分). (3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依 次为 0.005×10×100=5, 0.04×10×100=40,0.03×10×100=30,0.02×10×100=20. 1 4 由题中给出的比例关系知数学成绩在上述各分数段的人数依次为 5,40× =20,30× = 2 3 5 40,20× =25. 4 故数学成绩在[50,90)之外的人数为

100-(5+20+40+25)=10(人). (1)在频率分布直方图中估计中位数和平均数的方法 ①中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. ②平均数: 在频率分布直方图中, 平均数等于图中每个小矩形面积乘以小矩形底边中点 的横坐标之和. (2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标 准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程 度越小,越稳定. (1)(2012· 陕西改编)从甲、乙两个城市分别随机抽 取 16 台自动售货机,对其销售额进行统计,统计数据用茎叶 图表示(如图所示).设甲、乙两组数据的平均数分别为 x 甲、 x 乙,中位数分别为 m 甲、m 乙,则下列结论正确的是 ________.(填序号) ① x 甲< x 乙,m 甲>m 乙 ② x 甲< x 乙,m 甲<m 乙 ③ x 甲> x 乙,m 甲>m 乙 ④ x 甲> x 乙,m 甲<m 乙 (2)(2013· 江苏)抽样统计甲、乙两位射击运动员的 5 次训练成绩(单位:环),结果如下: 运动员 甲 乙 第1次 87 89 第2次 91 90 第3次 90 91 第4次 89 88 第5次 93 92

则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 答案 解析 (1)② (2)2

(1)直接利用公式求解.

1 345 x 甲= (41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)= , 16 16 x 乙= 457 . 16 ∴ x 甲< x
乙.

1 (42 + 43 + 48 +31+ 32+ 34+ 34+ 38 + 20 +22+23 + 23 +27+ 10+ 12+ 18) = 16

又∵m 甲=20,m 乙=29,∴m 甲<m 乙.

1 (2) x 甲= (87+91+90+89+93)=90, 5

1 x 乙= (89+90+91+88+92)=90, 5 1 2 2 2 2 2 s2 甲= [(87-90) +(91-90) +(90-90) +(89-90) +(93-90) ]=4, 5 1 2 2 2 2 2 s2 乙= [(89-90) +(90-90) +(91-90) +(88-90) +(92-90) ]=2. 5 考点三 概率与统计的综合问题 例3 在“2012 魅力新安江”青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率

分布直方图都受到不同程度的破坏,可见部分如图,据此回答以下问题:

(1)求参赛总人数和频率分布直方图中[80,90)之间的矩形的高,并完成直方图; (2)若要从分数在[80,100]之间任取两份进行分析,在抽取的结果中,求至少有一份分数 在[90,100]之间的概率. 解 (1)由茎叶图知,分数在[50,60)之间的频数为 2.

由频率分布直方图知,分数在[50,60)之间的频率为 0.008×10=0.08. 2 所以参赛总人数为 =25(人). 0.08 分数在[80,90)之间的人数为 25-2-7-10-2=4(人), 4 分数在[80,90)之间的频率为 =0.16, 25 0.16 得频率分布直方图中[80,90)间矩形的高为 =0.016. 10 完成直方图,如图.

(2)将[80,90)之间的 4 个分数编号为 1,2,3,4;[90,100]之间的 2 个分数编号为 5 和 6. 则在[80,100]之间任取两份的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4), (2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共 15 个, 其中至少有一个在[90,100]之间的基本事件为(1,5), (1,6), (2,5), (2,6), (3,5), (3,6), (4,5), (4,6),(5,6),共 9 个. 9 3 故至少有一份分数在[90,100]之间的概率是 = . 15 5 本题以概率和统计知识为结合点,以生活中的热点问题为背景,较全面的考 查了学生用概率统计知识解决实际问题的能力.在求解(1)时,充分利用了茎叶图和频 率分布直方图提供数据的互补性, 即切实理解两统计方式提供数据的特征是求解本题的 关键. 右面茎叶图记录了甲组四名同学、乙组六名同学的植树棵 数.乙组记录中有一个数据模糊,无法确认,在图中用 x 表示. (1)如果 x=7,求乙组同学植树棵数的平均数和方差; (2)如果 x=8,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数大 于 17 的概率. 解 7+7+8+10+11+11 (1)平均数为 =9, 6

?7-9?2×2+?8-9?2+?10-9?2+?11-9?2×2 方差为 =3. 6 (2)由题知所有基本事件为(6,7),(6,8),(6,8),(6,10),(6,11),(6,11),(7,7),(7,8),(7,8), (7,10),(7,11),(7,11),(8,7),(8,8),(8,8),(8,10),(8,11),(8,11),(10,7),(10,8),(10,8), (10,10),(10,11),(10,11),共 24 个. 这两名同学的植树总棵数大于 17 的基本事件为(7,11),(7,11),(8,10),(8,11),(8,11), (10,8),(10,8),(10,10),(10,11),(10,11),共 10 个. 10 5 所以这两名同学的植树总棵数大于 17 的概率为 = . 24 12

1. 三种抽样方法的异同点

2. 用样本估计总体 (1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和 为 1. (2)众数、中位数及平均数的异同 众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. (3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当 总体容量很大时, 通常从总体中抽取一个样本, 分析它的频率分布, 以此估计总体分布. 1n ①总体期望的估计,计算样本平均值 x = ∑ x. ni=1 i ②总体方差(标准差)的估计: 1n s2= ∑ (x - x )2,标准差 s= s2, ni=1 i 方差(标准差)较小者较稳定.

1. 经问卷调查,某班学生对摄影分别持“喜欢”、“不喜欢”和“一般”三种态度,其中 持“一般”态度的学生比持“不喜欢”的学生多 12 人, 按分层抽样的方法(抽样过程中 不需要剔除个体)从全班选出部分学生进行关于摄影的座谈.若抽样得出的 9 位同学中 有 5 位持“喜欢”态度的同学,1 位持“不喜欢”态度的同学和 3 位持“一般”态度的 同学,则全班持“喜欢”态度的同学人数为________. 答案 30 解析 由题意设全班学生为 x 人, 持“喜欢”、 “不喜欢”和“一般”态度的学生分别 5 1 1 1 1 占全班人数的 、 、 ,所以 x( - )=12,解得 x=54,所以全班持“喜欢”态度的人 9 9 3 3 9 5 数为 54× =30. 9 2. 某校从参加高三年级期中考试的学生中随机抽取 60 名学生,将其数学成绩(均为整数) 分成六段[40,50),[50,60),…,[90,100]后得到如图的频率分布直方图,请你根据频率 分布直方图中的信息,估计出本次考试数学成绩的平均分为________.

答案 71 解析 由频率分布直方图得每一组的频率依次为 0.1,0.15,0.15,0.3,0.25,0.05, 又由频率分 布直方图,得每一组数据的中点值依次为 45,55,65,75,85,95. 所以本次考试数 学 成绩的平均分为 x = 45×0.1 + 55×0.15 + 65×0.15 + 75×0.3 + 85×0.25+95×0.05=71. 故填 71. 3. 随机抽取某中学甲、 乙两班各 10 名同学, 测量他们的身高(单 位:cm),获得身高数据的茎叶图如图. (1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差; (3)现从乙班这 10 名同学中随机抽取两名身高不低于 173 cm 的同学,求身高为 176 cm 的同学被抽中的概率. 解 (1)由茎叶图可知:甲班身高集中于 160 cm~179 cm 之间,而乙班身高集中于 170

cm~180 cm 之间,因此乙班平均身高高于甲班,其中 158+162+163+168+168+170+171+179+179+182 x 甲= 10 =170, 159+162+165+168+170+173+176+178+179+181 x 乙= 10 =171.1. (2)甲班的样本方差为 1 [(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168 10

- 170)2 + (170 - 170)2 + (171 - 170)2 + (179 - 170)2 + (179 - 170)2 + (182 - 170)2] = 57.2. (3)设身高为 176 cm 的同学被抽中的事件为 A. 从乙班 10 名同学中抽取两名身高不低于 173 cm 的同学有: (181,173)、(181,176)、 (181,178)、(181,179)、(179,173)、(179,176)、(179,178)、(178,173)、(178,176)、(176,173), 共 10 个基本事件,而事件 A 含有 4 个基本事件,

4 2 ∴P(A)= = . 10 5

(推荐时间:45 分钟) 一、填空题 1. 要完成下列两项调查:①从某肉联厂的火腿肠生产线上抽取 1 000 根火腿肠进行“瘦肉 精”检测;②从某中学的 15 名艺术特长生中选出 3 人调查学习负担情况.适合采用的 抽样方法依次为________,________. 答案 系统抽样 简单随机抽样 解析 ①中总体容量较大,且火腿肠之间没有明显差异,故适合采用系统抽样;②中总 体容量偏小,故适合采用简单随机抽样. 2. (2012· 四川改编)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情 况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为 N, 其中甲社区有驾驶员 96 人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为 12,21,25,43,则这四个社区驾驶员的总人数 N 为________. 答案 808 解析 101, 12 101 故有 = ,解得 N=808. 96 N 3. 一个样本容量为 10 的样本数据,它们组成一个公差不为 0 的等差数列{an},若 a3=8, 且 a1,a3,a7 成等比数列,则此样本的平均数和中位数分别是________. 答案 13,13 解析 设等差数列{an}的公差为 d(d≠0),a3=8,a1a7=a2 3=64,(8-2d)(8+4d)=64, (4-d)(2+d)=8,2d-d2=0, 又 d≠0, 故 d=2, 故样本数据为 4,6,8,10,12,14,16,18,20,22, ?4+22?×5 12+14 样本的平均数为 =13,中位数为 =13. 10 2 4. 将某班的 60 名学生编号为:01,02,?,60,采用系统抽样方法抽取一个容量为 5 的样 本,且随机抽得的一个号码为 04,则剩下的四个号码依次是____________. 答案 16,28,40,52 解析 依据系统抽样方法的定义知,将这 60 名学生依次按编号每 12 人作为一组,即 12 由题意知抽样比为 ,而四个社区一共抽取的驾驶员人数为 12+21+25+43= 96

01~12、13~24、?、49~60,当第一组抽得的号码是 04 时,剩下的四个号码依次是 16,28,40,52(即其余每一小组所抽出来的号码都是相应的组中的第四个号码). 8. 某校高三考生参加某高校自主招生面试时,五位评委给分如下: 9.0 9.1 8.9 9.2 8.8 则五位评委给分的方差为________. 答案 0.02 解析 评委给分的平均数为 1 ×(9.0+9.1+8.9+9.2+8.8)=9.0, 5 1 0.1 方差为 ×[(9.0-9.0)2+(9.1-9.0)2+(8.9-9.0)2+(9.2-9.0)2+(8.8-9.0)2]= =0.02. 5 5 6. (2012· 广东)由正整数组成的一组数据 x1,x2,x3,x4,其平均数和中位数都是 2,且标准 差等于 1,则这组数据为________.(从小到大排列) 答案 1,1,3,3 解析 假设这组数据按从小到大的顺序排列为 x1,x2,x3,x4, x +x =2, ?x +x + 4 则? x +x ? 2 =2,
1 2 3 4 2 3

? ?x1+x4=4, ∴? ?x2+x3=4. ?

又 s= = =

1 [?x -2?2+?x2-2?2+?x3-2?2+?x4-2?2] 4 1

1 ?x1-2?2+?x2-2?2+?4-x2-2?2+?4-x1-2?2 2 1 2[?x1-2?2+?x2-2?2]=1, 2

∴(x1-2)2+(x2-2)2=2. 同理可求得(x3-2)2+(x4-2)2=2. 由 x1,x2,x3,x4 均为正整数,且(x1,x2),(x3,x4)均为圆(x-2)2+(y-2)2=2 上的点, 分析知 x1,x2,x3,x4 应为 1,1,3,3. 7. 某校开展“爱我海西、 爱我家乡”摄影比赛, 9 位评委为参赛作品 A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分 后,算得平均分为 91,复核员在复核时,发现有一个数字(茎叶图中的 x)无法看清,若 记分员计算无误,则数字 x 应该是__________. 答案 1 89+89+92+93+92+91+94 640 解析 当 x≥4 时, = ≠91, 7 7

89+89+92+93+92+91+x+90 ∴x<4,∴ =91, 7 ∴x=1. 二、解答题 8. (2013· 陕西)有 7 位歌手(1 至 7 号)参加一场歌唱比赛,由 500 名大众评委现场投票决定 歌手名次,根据年龄将大众评委分为五组,各组的人数如下: 组别 人数 A 50 B 100 C 150 D 150 E 50

(1)为了调查评委对 7 位歌手的支持情况,现用分层抽样方法从各组中抽取若干评委, 其中从 B 组中抽取了 6 人.请将其余各组抽取的人数填入下表. 组别 人数 抽取人数 A 50 B 100 6 C 150 D 150 E 50

(2)在(1)中,若 A,B 两组被抽到的评委中各有 2 人支持 1 号歌手,现从这两组被抽到 的评委中分别任选 1 人,求这 2 人都支持 1 号歌手的概率. 解 (1)由题设知,分层抽样的抽取比例为 6%,所以各组抽取的人数如下表: 组别 人数 抽取人数 A 50 3 B 100 6 C 150 9 D 150 9 E 50 3

(2)记从 A 组抽到的 3 位评委为 a1,a2,a3,其中 a1,a2 支持 1 号歌手;从 B 组抽到的 6 位评委为 b1,b2,b3,b4,b5,b6,其中 b1,b2 支持 1 号歌手.从{a1,a2,a3}和{b1, b2,b3,b4,b5,b6}中各抽取 1 人的所有结果为:

由以上树状图知所有结果共 18 种, 其中 2 人都支持 1 号歌手的有 a1b1, a1b2, a2b1, a2b2 4 2 共 4 种,故所求概率 P= = . 18 9 9. 某工厂有 120 名工人, 且年龄都在 20 岁到 60 岁之间,各年龄段人数按[20,30)、[30,40)、 [40,50)、[50,60)分组,其频率分布直方图如图所示.工厂为了开发新产品,引进了新的 生产设备,要求每名工人都要参加 A、B 两项培训,培训结束后进行结业考试.已知各 年龄段两项培训结业考试成绩优秀的人数如下表所示. 假设两项培训是相互独立的, 结 业考试也互不影响.

年龄分组 [20,30) [30,40) [40,50) [50,60]

A 项培训成绩优秀人数 30 36 12 4

B 项培训成绩优秀人数 18 24 9 3

(1)若用分层抽样法从全厂工人中抽取一个容量为 40 的样本,求各年龄段应分别抽取的 人数; (2)随机从年龄段[20,30)和[30,40)内各抽取 1 人,设这两人中 A、B 两项培训结业考试成 绩都优秀的人数为 X,求 X 的概率分布和数学期望. 解 (1)由频率分布直方图知,在年龄段[20,30)、[30,40)、[40,50)、[50,60]内的人数的

频率分别为 0.35,0.4,0.15,0.10. ∵0.35×40=14,0.4×40=16,0.15×40=6,0.1×40=4, ∴在年龄段[20,30)、[30,40)、[40,50)、[50,60]内应抽取的人数分别为 14,16,6,4. (2)∵在年龄段[20,30)内的工人数为 120×0.35=42(人),从该年龄段任取 1 人,由表知, 30 5 此人 A 项培训结业考试成绩优秀的概率为 = ;B 项培训结业考试成绩优秀的概率为 42 7 18 3 5 3 15 = ,∴此人 A、B 两项培训结业考试成绩都优秀的概率为 × = . 42 7 7 7 49 ∵在年龄段[30,40)内的工人数为 120×0.4=48(人),从该年龄段任取 1 人,由表知,此 36 3 24 人 A 项培训结业考试成绩优秀的概率为 = ;B 项培训结业考试成绩优秀的概率为 48 4 48 1 = , 2 3 1 3 ∴此人 A、B 两项培训结业考试成绩都优秀的概率为 × = . 4 2 8 由题设知,X 的可能取值为 0,1,2, 15 3 85 15 3 15 3 177 15 ∴P(X=0)=(1- )(1- )= , P(X=1)= ×(1- )+(1- )× = , P(X=2)= 49 8 196 49 8 49 8 392 49 3 45 × = , 8 392

∴X 的概率分布为 X P X 的数学期望为 85 177 45 267 E(X)=0× +1× +2× = . 196 392 392 392 0 85 196 1 177 392 2 45 392


相关文档

【步步高 江苏专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题四 第2讲空间中的平行与垂直
【步步高 浙江专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题二 第2讲
【步步高 浙江专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题一 第5讲
【步步高 江苏专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题六 第2讲
【步步高 浙江专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题三 第3讲
【步步高 江苏专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题三 第1讲
【步步高 江苏专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题五 第3讲
【步步高 浙江专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题六 第2讲
【步步高 江苏专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题八 第3讲
【步步高 江苏专用(理)】2014届高三数学《大二轮专题复习与增分策略》专题三 第2讲
电脑版