高中数学 (2.3.2 两个变量的线性相关 第2课时)教案 新人教A版必修3


高中数学 (2.3.2 两个变量的线性相关 第 2 课时)示范教案 新人 教 A 版必修 3
导入新课 思路 1 客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非 因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是 “因”,物理是“果”,或者反过来说.事实上数学和物理成绩都是“果”,而真正的“因” 是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另 一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关 ——回归直线及其方程. 思路 2 某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某 6 天卖出热茶的 杯数与当天气温的对照表: 气温/℃ 杯数 26 20 18 24 13 34 10 38 4 50 -1 64

如果某天的气温是-5 ℃,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解 决这个问题我们接着学习两个变量的线性相关——回归直线及其方程. 推进新课 新知探究 提出问题 (1)作散点图的步骤和方法? (2)正、负相关的概念? (3)什么是线性相关? (4)看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么 方式增加的呢? (5)什么叫做回归直线? (6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想? (7)利用计算机如何求回归直线的方程? (8)利用计算器如何求回归直线的方程? 活动:学生回顾,再思考或讨论,教师及时提示指导. 讨论结果: (1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来 , 得到表示两个变量的一组数据的图形,这样的图形叫做散点图. (a.如果所有的样本点都落在 某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系. b.如果所有 的样本点都落在某一函数曲线附近 ,变量之间就有相关关系.c.如果所有的样本点都落在某 一直线附近,变量之间就有线性相关关系) (2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点 散布在从左上角到右下角的区域内,称为负相关. (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系. (4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可 以从散点图上来进一步分析. (5)如下图:

1

从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图 中点的分布从整体上看大致在一条直线附近 ,我们就称这两个变量之间具有线性相关关系, 这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方 程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一 个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表. (6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心 的一条直线. 那么,我们应当如何具体求出这个回归方程呢? 有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离, 然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方 程了.但是,这样做可靠吗? 有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相 同.同样地,这样做能保证各点与此直线在整体上是最接近的吗? 还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线 的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距. 同学们不妨去实践一下,看看这些方法是不是真的可行? (学生讨论: 1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的 个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、 截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图:

2

上面这些方法虽然有一定的道理,但总让人感到可靠性不强. 实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的 距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公 式
n ? ( xi ? x )( yi ? y ) ? ? i ?1 ? ? ?b ? n 2 ? ( xi ? x ) ? ? i ?1 ? ? ?a ? y ? bx.

?x y
i ?1 n i

n

i

? nx y , ? nx
2

?x
i ?1

(1)

2 i

其中,b 是回归方程的斜率,a 是截距. 推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理. 假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),?,(xn,yn), 且所求回归方程是 y =bx+a, 其中 a、b 是待定参数.当变量 x 取 xi(i=1,2,?,n)时可以得到 y =bxi+a(i=1,2,?,n), 它与实际收集到的 yi 之间的偏差是 yi- y =yi-(bxi+a)(i=1,2,?,n).
^ ^ ^

这样,用这 n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(yi- y ) 可正可负,为了避免相互抵消,可以考虑用

^

?| y
i ?1

n

i

? y i | 来代替,但由于它含有绝对值,运
2 2 2

^

算 不 太 方 便 , 所 以 改 用 Q=(y1-bx1-a) +(y2-bx2-a) +?+(yn-bxn-a) ② 来刻画 n 个点与回归直线在整体上的偏差. 这样, 问题就归结为:当 a,b 取什么值时 Q 最小, 即总体偏差最小.经过数学上求最小值的运 算,a,b 的值由公式①给出. 通过求②式的最小值而得出回归直线的方法, 即求回归直线, 使得样本数据的点到它的距离 的平方和最小,这一方法叫做最小二乘法(method of least square).

3

(7)利用计算机求回归直线的方程. 根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程. 以 Excel 软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归 方程,具体步骤如下: ①在 Excel 中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图),在菜单中选 定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框. ②单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按 钮,得到回归直线. ③双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后 单击“确定”按钮,得到回归直线的回归方程 y =0.577x-0.448.
^

(8)利用计算器求回归直线的方程. 用计算器求这个回归方程的过程如下:

所以回归方程为 y =0.577x-0.448. 正像本节开头所说的, 我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中, 找到 了它们之间关系的一个规律,这个规律是由回归直线来反映的. 直线回归方程的应用: ①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关 系. ②利用回归方程进行预测;把预报因子(即自变量 x)代入回归方程对预报量(即因变量 Y) 进行估计,即可得到个体 Y 值的容许区间.

^

4

③利用回归方程进行统计控制规定 Y 值的变化,通过控制 x 的范围来实现统计控制的目标. 如已经得到了空气中 NO2 的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空 气中 NO2 的浓度. 应用示例 思路 1 例 1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到 一个卖出的热饮杯数与当天气温的对比表: 摄氏温度 /℃ 热饮杯数 -5 156 0 150 4 132 7 128 12 130 15 116 19 104 23 89 27 93 31 76 36 54

(1)画出散点图; (2)从散点图中发现气温与热饮销售杯数之间关系的一般规律; (3)求回归方程; (4)如果某天的气温是 2 ℃,预测这天卖出的热饮杯数. 解: (1)散点图如下图所示:

(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之 间呈负相关,即气温越高,卖出去的热饮杯数越少. (3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归 方程的系数. 利用计算器容易求得回归方程 y =-2.352x+147.767. (4)当 x=2 时, y =143.063.因此,某天的气温为 2 ℃时,这天大约可以卖出 143 杯热饮. 思考 气温为 2 ℃时,小卖部一定能够卖出 143 杯左右热饮吗?为什么? 这里的答案是小卖部不一定能够卖出 143 杯左右热饮,原因如下: 1.线性回归方程中的截距和斜率都是通过样本估计出来的, 存在随机误差, 这种误差可以导 致预测结果的偏差. 2.即使截距和斜率的估计没有误差, 也不可能百分之百地保证对应于 x 的预报值, 能够与实 际值 y 很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回 归直线的附近,事实上,y=bx+a+e= y +e. 这里 e 是随机变量,预报值 y 与实际值 y 的接近程度由随机变量 e 的标准差所决定.
^ ^ ^ ^

5

一些学生可能会提出问题: 既然不一定能够卖出 143 杯左右热饮, 那么为什么我们还以 “这天大约可以卖出 143 杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体 地说,假如我们规定可以选择连续的 3 个非负整数作为可能的预测结果,则我们选择 142, 143 和 144 能够保证预测成功(即实际卖出的杯数是这 3 个数之一)的概率最大. 例 2 下表为某地近几年机动车辆数与交通事故数的统计资料. 机动车辆数 x/千台 交通事故数 y/千件 95 6.2 110 7.5 112 7.7 120 8.5 129 8.7 135 9.8 150 10.2 180 13

(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说 明理由; (2)如果具有线性相关关系,求出线性回归方程. 解: (1)在直角坐标系中画出数据的散点图,如下图.

直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:

? xi =1 031, ? y i =71.6,
i ?1 8 i ?1

8

8

? xi2 =137 835, ? xi y i =9 611.7.
i ?1 i ?1

8

将它们代入公式计算得 b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1. 思路 2 例 1 给出施化肥量对水稻产量影响的试验数据: 施化肥量 x 水稻产量 y 15 330 20 345 25 365 30 405 35 445 40 450 45 455

(1)画出上表的散点图; (2)求出回归直线的方程. 解:(1)散点图如下图.

(2)表中的数据进行具体计算,列成以下表格:
6

i xi yi xiyi

1 15 330 4 950

2 20 345 6 900
7

3 25 365 9 125
7

4 30 405 12 150

5 35 445 15 575
7

6 40 450 18 000

7 45 455 20 475

x ? 30, y ? 399.3, ? xi2 ? 7000 , ? yi2 ? 1132725 , ? xi yi ? 87175
i ?1 i ?1 i ?1

故可得到 b=

87175 ? 7 ? 30 ? 399 .3 ≈4.75, 7000 ? 7 ? 30 2
^

a=399.3-4.75×30≈257. 从而得回归直线方程是 y =4.75x+257. 例 2 一个车间为了规定工时定额,需要确定加工零件所花费的时间. 为此进行了 10 次试验, 测得数据如下: 零件个数 x(个) 加工时间 y(分) 10 62 20 68 30 75 40 81 50 89 60 95 70 102 80 108 90 115 100 122

请判断 y 与 x 是否具有线性相关关系,如果 y 与 x 具有线性相关关系,求线性回归方程. 解:在直角坐标系中画出数据的散点图,如下图.

直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:

x ? 55, y ? 91.7, ?
i ?1

10

x =38 500,

2 i

?
i ?1

10

y =87 777,

2 i

?x y
i ?1 i

10

i

=55 950.

?x y
b=
i ?1 10 i

10

i

? 10x y ? ? 10x 2

?x
i ?1

2 i

55950? 10 ? 55 ? 91.7 ≈0.668. 38500? 10 ? 552

a= y ? bx =91.7-0.668×55≈54.96. 因此,所求线性回归方程为 y =bx+a=0.668x+54.96. 例 3 已知 10 条狗的血球体积及红血球数的测量值如下: 血球体积 x(mL) 红血球数 y(百万) 45 6.53 42 6.30 46 9.52 48 7.50 42 6.99 35 5.90 58 9.49 40 6.20 39 6.55 50 8.72
^

(1)画出上表的散点图; (2)求出回归直线的方程.
7

解: (1)散点图如下.

(2) x ?

1 (45+42+46+48+42+35+58+40+39+50)=44.50, 10

y?

1 (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 10
^

设回归直线方程为 y =bx+a,则 b=

?x y
i ?1 10 i

10

i

? 10x y
=0.175,a= y ? bx =-0.418,

?x
i ?1

2 i

? 10x

2

所以所求回归直线的方程为 y =0.175x-0.148. 点评:对一组数据进行线性回归分析时 ,应先画出其散点图 ,看其是否呈直线形 ,再依系数 a,b 的计算公式,算出 a,b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防 计算中产生错误,求线性回归方程的步骤:计算平均数 x , y ;计算 xi 与 yi 的积,求∑xiyi;计 算∑xi ;将结果代入公式求 b;用 a= y ? bx 求 a;写出回归直线方程.
2

^

知能训练 1.下列两个变量之间的关系哪个不是函数关系( ) A.角度和它的余弦值 B.正方形边长和面积 C.正n边形的边数和它的内角和 D.人的年龄和身高 答案:D 2.三点(3,10),(7,20),(11,24)的线性回归方程是( ) A. y =5.75-1.75x C. y =1.75-5.75x
^ ^

B. y =1.75+5.75x D. y =5.75+1.75x
^

^

答案:D 3.已知关于某设备的使用年限 x 与所支出的维修费用 y(万元),有如下统计资料: 使用年限 x 维修费用 y 2 2.2
^

3 3.8

4 5.5

5 6.5

6 7.0

设 y 对 x 呈线性相关关系.试求: (1)线性回归方程 y =bx+a 的回归系数 a,b; (2)估计使用年限为 10 年时,维修费用是多少? 答案: (1)b=1.23,a=0.08; (2)12.38.
8

4.我们考虑两个表示变量 x 与 y 之间的关系的模型,δ 为误差项,模型如下: 模型 1:y=6+4x;模型 2:y=6+4x+e. (1)如果 x=3,e=1,分别求两个模型中 y 的值; (2)分别说明以上两个模型是确定性模型还是随机模型. 解: (1)模型 1:y=6+4x=6+4×3=18; 模型 2:y=6+4x+e=6+4×3+1=19. (2)模型 1 中相同的 x 值一定得到相同的 y 值,所以是确定性模型;模型 2 中相同的 x 值, 因 δ 的不同,所得 y 值不一定相同,且 δ 为误差项是随机的,所以模型 2 是随机性模型. 5.以下是收集到的新房屋销售价格 y 与房屋大小 x 的数据: 房屋大小 x(m ) 销售价格 y (万元)
2

80 18.4

105 22

110 21.6

115 24.8

135 29.2

(1)画出数据的散点图; (2)用最小二乘法估计求线性回归方程. 解: (1)散点图如下图.

(2)n=5,

? xi =545, x =109, ? y i =116, y =23.2,
i ?1 i ?1 5 i ?1

5

5

? xi2 =60 952, ? xi y i =12 952,
i ?1

5

b=

5 ? 12952 ? 545 ? 116 ≈0.199,a=23.2-0.199×109≈1.509, 5 ? 60952 ? 545 2

所以,线性回归方程为 y=0.199x+1.509. 拓展提升 某调查者从调查中获知某公司近年来科研费用支出(Xi)与公司所获得利润(Yi)的统 计资料如下表: 科研费用支出(Xi)与利润(Yi)统计表 单位:万元 年份 1998 1999 2000 2001 2002 2003 合计 科研费用支出 5 11 4 5 3 2 30 利润 31 40 30 34 25 20 180

要求估计利润(Yi)对科研费用支出(Xi)的线性回归模型.

9

解:设线性回归模型直线方程为: Y i ? ? 0 ? ? 1 X i , 因为: x ?

^

^

^

?X
n

i

?

30 =5, Y ? 6

?Y
n

i

?

180 =30, 6

根据资料列表计算如下表: (Xi- X ) 1998 1999 2000 2001 2002 2003 合计 5 11 4 5 3 2 30 31 40 30 34 25 20 180 155 440 120 170 75 40 1 000 25 121 16 25 9 4 200 0 6 -1 0 -2 -3 0 1 10 0 4 -5 -10 0
2

(Xi- X )(Yi-

年份

Xi

Yi

XiYi

Xi

2

Xi- X

Yi- Y

Y )
0 60 0 0 10 30 100

0 36 1 0 4 9 50

现求解参数 β 0、β 1 的估计值: 方法一: ? 1 ?
^ ^
^

n ? X ? (? X i )
2 i

n? X i Yi ? ? Yi

2

?

6 ? 1000 ? 30 ? 180 6000 ? 5400 600 ? ? =2, 1200 ? 900 300 6 ? 200 ? 30 2

? 0 ? Y ? ? 1 x =30-2×5=20.
方法二: ? 1 ?
^ ^
^

? X Y ? nxY ? X ? n( x )
i i 2 i

2

?

1000 ? 6 ? 5 ? 30 100 ? =2, 50 200 ? 6 ? 5 2

? 0 ? Y ? ? 1 x =30-2×5=20.
方法三: ? 1 ?
^ ^
^

? ( X ? x )(Y ? Y ) ? 100 =2, 50 ? ( X ? x)
i i 2 i
^

? 0 ? Y ? ? 1 x =30-2×5=20.
所以利润(Yi)对科研费用支出(Xi)的线性回归模型直线方程为: Y i =20+2Xi. 课堂小结 1.求线性回归方程的步骤: (1)计算平均数 x , y ; (2)计算 xi 与 yi 的积,求∑xiyi; 2 2 (3)计算∑xi ,∑yi ,

10

n ? ( xi ? x )( yi ? y ) ? ? i ?1 ?b ? ? ? n (4)将上述有关结果代入公式 ? 2 ( xi ? x ) ? ? i ?1 ? ? ?a ? y ? bx

?x y
i ?1 n i

n

i

? nx y , ? nx
2

?x
i ?1

2 i

求 b,a,写出回归直线方程. 2.经历用不同估算方法描述两个变量线性相关的过程 .知道最小二乘法的思想,能根据给出 的线性回归方程系数公式建立线性回归方程. 作业 习题 2.3A 组 3、4,B 组 1、2. 设计感想 本节课在上节课的基础上,利用实例分析了散点图的分布规律,推导出了线性回归直线 的方程的求法,并利用回归直线的方程估计可能的结果 ,本节课讲得较为详细,实例较多,便 于同学们分析比较.思路 1 和思路 2 的例题对知识进行了巩固和加强,另外, 本节课通过选取 一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心, 养成良好的学习态度,树立时间观,培养勤奋、刻苦的精神.

11


相关文档

更多相关文档

人教A版高中数学必修三 2.3.2 《两个变量的线性相关》 第2课时示范教案
2016-2017学年新人教A版必修3高中数学 2.3.2两个变量的线性相关(第2课时)教案(精品)
2016-2017学年新人教A版必修3高中数学 2.3.2 两个变量的线性相关(第2课时)教案(精品)
2016-2017学年新人教A版 必修3高中数学 2.3.2两个变量的线性相关(第2课时)教案(精品)
人教A版高中数学必修三 2.3.2 《两个变量的线性相关》第2课时教案
2016-2017学年新人教A版必修3高中数学 2.3.2 两个变量的线性相关(第2课时)教案 (1)(精品)
2016-2017学年新人教A版必修3高中数学 2.3.2两个变量的线性相关(第1课时)教案(精品)
2016-2017学年新人教A版必修3高中数学 2.3.2 两个变量的线性相关(第1课时)教案(精品)
2015年秋高中数学 2.3.2两个变量的线性相关(第2课时)教案 新人教A版必修3
2011年高中数学 2.3.2《两个变量的线性相关》教案 新人教A版必修3
湖北省十堰市郧阳中学人教版(B)高中数学必修三312事件与基本事件空间 教案
湖北省十堰市郧阳中学人教版(B)高中数学必修三214数据的收集 教案
高中数学必修三配套教案3.1.4概率的加法公式
必修三2.3.2两个变量的线性相关关系
高中数学 3.2.1古典概型教案 新人教A版必修3
电脑版