第十章 第三节 变量间的相关关系与统计案例


第十章 第三节 变量间的相关关系与统计案例
一、选择题 1.设(x1,y1),(x2,y2),?,(xn,yn)是变量 x 和 y 的 n 个样本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正 确的是( )

A.x 和 y 的相关系数为直线 l 的斜率 B.x 和 y 的相关系数在 0 到 1 之间 C.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 D.直线 l 过点( x , y ) 2.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 爱好 不爱好 总计 40 20 60 女 20 30 50 总计 60 50 110

n?ad-bc?2 由K= 算得, ?a+b??c+d??a+c??b+d?
2

110×?40×30-20×20?2 K2= ≈7.8. 60×50×60×50 附表: P(K2≥k) k 0.050 3.841 0.010 6.635 0.001 10.828

参照附表,得到的正确结论是(

)

A.有 99%以上的把握认为“爱好该项运动与性别有关” B.有 99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” 3.一位母亲记录了自己儿子 3~9 岁的身高数据(略),由此建立的身高与年龄的回归模 ^ 型为y=7.19x+73.93,用这个模型预测这个孩子 10 岁时的身高,则正确的叙述是( A.身高一定是 145.83 cm B.身高在 145.83 cm 以上 C.身高在 145.83 cm 左右
1

)

D.身高在 145.83 cm 以下 4.如图 5 个(x,y)数据,去掉 D(3,10)后,下列说法错误的是( )

A.相关系数 r 变大 B.残差平方和变大 C.相关指数 R2 变大 D.解释变量 x 与预报变量 y 的相关性变强 5.某商品销售量 y(件)与销售价格 x(元/件)负相关,则其回归方程可能是( ^ A.y=-10x+200 ^ C.y=-10x-200 6.下列四个命题正确的是( ) ^ B.y=10x+200 ^ D.y=10x-200 )

①线性相关系数 r 越大,两个变量的线性相关性越强;反之,线性相关性越弱; ②残差平方和越小的模型,拟合的效果越好; ③用相关指数 R2 来刻画回归效果,R2 越小,说明模型的拟合效果越好; ④随机误差 e 是衡量预报精确度的一个量,它满足 E(e)=0. A.①③ C.①④ 二、填空题 7.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万元),调查 显示年收入 x 与年饮食支出 y 具有线性相关关系, 并由调查数据得到 y 对 x 的回归直线方程: ^ y=0.254x+0.321.由回归方程可知, 家庭年收入每增加 1 万元, 年饮食支出平均增加________ 万元. 8.某数学老师身高 176 cm,他爷爷、父亲和儿子的身高分别是 173 cm、170 cm 和 182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的 身高为________cm. 9.第二十届世界石油大会将于 2011 年 12 月 4 日~8 日在卡塔尔首都多哈举行,能源 问题已经成为全球关注的焦点.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种 产品的产量 x (单位:吨)与相应的生产能耗 y(单位:吨)有如下几组样本数据: x 3 4 5 6 B.②④ D.②③

2

y

2.5

3

4

4.5

根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线 的斜率为 0.7.已知该产品的年产量为 10 吨,则该工厂每年大约消耗的汽油为________吨. 三、解答题 10.已知 x,y 的一组数据如下表: x y 1 1 3 2 6 3 7 4 8 5

(1)从 x,y 中各取一个数,求 x+y≥10 的概率; 1 1 1 (2)对于表中数据,甲、乙两同学给出的拟合直线分别为 y= x+1 与 y= x+ ,试利用 3 2 2 “最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好.

11.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他 前 7 次考试的数学成绩 x、物理成绩 y 进行分析.下面是该生 7 次考试的成绩. 数学 物理 88 94 83 91 117 108 92 96 108 104 100 101 112 106

(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明; (2)已知该生的物理成绩 y 与数学成绩 x 是线性相关的,若该生的物理成绩达到 115 分, 请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性, 给出该生在 ^ ^ 学习数学、物理上的合理建议.(其中,数据(xi,yi)(i=1,2,?,n)的线性回归方程为y=bx - - ? ?xi- x ??yi- y ? - ? ?xi- x ?2
n n

^ ^ +a,b=

i=1

^ - ^- ,a= y -b x )

i=1

3

12.某学生对其亲属 30 人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示 30 人的饮食指数.(说明:图中饮食指数低于 70 的人,饮食以蔬菜为主;饮食指数高于 70 的 人,饮食以肉类为主.) 甲(50 岁以下) 2 1 5 6 7 8 3 8 4 0 5 3 2 3 4 5 6 7 8 9 (1)根据茎叶图,帮助这位学生说明其亲属 30 人的饮食习惯; (2)根据以上数据完成下列 2×2 的列联表: 主食蔬菜 50 岁以下 50 岁以上 合计 主食肉类 合计 0 2 4 8 1 5 8 1 5 3 7 5 2 6 7 6 9 6 乙(50 岁以上)

(3)能否有 99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析. n?ad-bc?2 附:K2= . ?a+b??c+d??a+c??b+d? P(K2 ≥k0) k0 0.25 1.32 3 0.15 0.10 0.05 0.025 0.010 0.005 0.001

2.072

2.706

3.841

5.024

6.635

7.879

10.828

详解答案
一、选择题 1. 解析:回归直线过样本中心( x , y ). 答案:D 2.解析:根据独立性检验的思想方法,正确选项为 A.

4

答案:A ^ 3.解析:用回归模型y=7.19x+73.93,只能作预测,其结果不一定是一个确定值. 答案: C 4.解析:相关系数 r 越接近 1,R2 越大,残差平方和越小,拟合效果越好. 答案:B 5.解析:由图象可知,选项 B、D 为正相关,选项 C 不符合实际意义,只有 A 项符合 要求. 答案:A 6.解析:线性相关系数 r 满足|r|≤1,并且|r|越接近 1,线性相关程度越强;|r|越接近 0, 线性相关程度越弱, 故①错误; ③相关指数是度量模型拟合效果的一种指标. 相关指数越大, 模型拟合效果越好.故②④正确 答案:B 二、填空题 ^ ^ 7.解析:以 x+1 代 x,得y=0.254(x+1)+0.321,与y=0.254x+0.321 相减可得,年饮 食支出平均增加 0.254 万元. 答案:0.254 8.解析:设父亲身高为 x cm,儿子身高为 y cm,则 x y 173 170 170 176 176 182

- - ^ 0×?-6?+?-3?×0+3×6 x =173, y =176,b= =1, 02+9+9 ^ - ^- ^ ^ a= y -b x =176-1×173=3,∴y=x+3,当 x=182 时,y=185. 答案:185 - 3+4+5+6 - 2.5+3+4+4.5 9.解析:由题知, x = =4.5, y = =3.5,故样本数据的中 4 4 心点为 A(4.5,3.5).设回归方程为 y=0.7x+b,将中心点坐标代入得:3.5=0.7×4.5+b,解 得 b=0.35,故回归方程为 y=0.7x+0.35,所以当 x=10 时,y=0.7×10+0.35=7.35,即该 工厂每年大约消耗的汽油为 7.35 吨. 答案:7.35 三、解答题 10.解:(1)从 x,y 中各取一个数组成数对(x,y),共有 25 对,其中满足 x+y≥10 的有 9 (6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共 9 对.故所求概率 P= . 25 1 4 (2)用 y= x+1 作为拟合直线时,所得 y 值与 y 的实际值的差的平方和为 S1=( -1)2+ 3 3
5

10 11 7 (2-2)2+(3-3)2+( -4)2+( -5)2= . 3 3 3 1 1 用 y= x+ 作为拟合直线时,所得 y 值与 y 的实际值的差的平方和为 S2=(1-1)2+(2 2 2 7 9 1 -2)2+( -3)2+(4-4)2+( -5)2= . 2 2 2 1 1 ∵S2<S1,∴直线 y= x+ 的拟合程度更好. 2 2 -12-17+17-8+8+12 - 11.解:(1)∵ x =100+ =100, 7 -6-9+8-4+4+1+6 - y =100+ =100, 7 994 250 ∴s2 =142,∴s2 , 数学= 物理= 7 7
2 从而 s2 数学>s物理,∴该生的物理成绩更稳定.

(2)由于 x 与 y 之间具有线性相关关系,
7 xiyi-7 i=1
?

- - x y 497 ^ - ^- = =0.5,a= y -b x =100-0.5×100=50, 994

^ ∴b=

-2 7 x2 2 -7 x i=1
?

^ ∴线性回归方程为y=0.5x+50.当 y=115 时,x=130. 建议: 进一步加强对数学的学习, 提高数学成绩的稳定性, 这将有助于物理成绩的进一步提高. 12.解:(1)在 30 位亲属中,50 岁以上的人多以食蔬菜为主,50 岁以下的人多以食肉 为主. (2)2×2 的列联表如下: 主食蔬菜 50 岁以下 50 岁以上 合计 4 16 20 主食肉类 8 2 10 合计 12 18 30

30×?8-128?2 30×120×120 (3)因为 K2= = =10>6.635, 12×18×20×10 12×18×20×10 所以有 99%的把握认为其亲属的饮食习惯与年龄有关.

6


相关文档

10章 第三节 变量间的相关关系、统计案例
第九章 第三节 变量间的相关关系、统计案例
第九章 第三节 变量间的相关关系与统计案例
高考数学(理)创新大一轮浙江专用版:第十章 统计与统计案例 第3节 变量间的相关关系与统计案例
高考数学一轮复习第十章统计与统计案例第三节变量间的相关关系统计案例课件理
数学一轮复习第十章统计与统计案例第三节变量间的相关关系统计案例课后作业理08100160
第三节 变量间的相关关系、统计案例
第三节 变量间的相关关系与统计案例
第九章 统计与统计案例第三节 变量间的相关关系、统计案例
第三节变量间的相关关系统计案例
电脑版