统计概率复习


期末复习

本学期课程安排及考试说明:

1. 课程安排 2. 考试说明
平时出勤(15%)
两次作业(15%)要求:a.按时提交 b.完成的质量 期末成绩(70%) 其他(奖励)

总体:把研究的一类对象的全体称为总体,可分 为有限总体和无限总体。

个体:把构成总体的每一个成员称为个体。
样本:从总体中抽出的部分个体组成的集合称为 样本。 样品:样本中包含的个体称为样品。 样本容量:样本中包含的个体的数量称为样本容 量,通常用n表示。

变异性:连续观察一个系统或现象并不能 得出完 全相同的结果。如每英里汽车的油耗。
随机变量:随机实验中,由于测量值有变异性, 我们把测量量称为随机变量。

反映数据集中位置的指标
样本均值:

数据波动的统计量
数据波动的统计量

极差

样本方差与 样本标准差

变异系数

极差:一组数据中的最大值与最小值之差,用R 表示。如某企业中员工的最大月收入是12000元, 最低月收入是800元,则R=12000-800=11200 (元) 样本离差:每个样本个体xi与样本均值之差.例: 现有样本数据:99.8 99.9 100.1 100.2.均值 为:100,于是,样本离差依次为:-0.2,-0.1, 0.1,0.2

1 n 样本方差:s 2 ? ( xi ? x ) 2 ? n ? 1 i ?1

样本中位数

中位数的计算公式为: ? x n+1 ? 2 ? Me= ? x n ? x n ?1 ? 2 2 ? ? 2

当n为奇数时 当n为偶数时

例——在如下样本集合中,17.0 17.1 17.6 17.5 17.5 17.2 17.6 中位数是Me=x4=17.5 而在如下样本数据集合中:16.8 17.0 17.1 17.2 17.5 17.5 17.6 17.6 中位数是:Me=(x4+x5)/2=17.35

当下四分点的位置与上四分点的位置为整数时, 相应整数位置上的样本值就是Q1和Q3的值。 当下四分点的位置与上四分点的位置不为整数时, 下四分点Q1的值与上四分点Q3的值,分别由下式 计算: Q1=Q1位置左边样本值+(Q1位置右边样本值-Q1 位置左边的样本值)×0.25 Q3=Q3位置左边样本值+(Q3位置右边样本值-Q3 位置左边的样本值)×0.75

图示如下:

计算Q1、Q2、Q3的取值 Q1=99.8+(99.9-99.8) ×0.25=99.825 Q2=Me=99.9+(100.1-99.9) ×0.5 =100 Q3=100.1+(100.2-100.1) ×0.75=100.175

例——样本数据集合(排序后)为: 3,5,6,8,11,12,18 试计算该数据集合的下四分点Q1和 上四分点Q3的值及中位数Q2的值。 解:n=7,由位置计算公式,有 下四分点Q1的位置=(7+1)×0.25=2,该位置为整数; 中位数Q2的位置=(7+1)×0.5=4,该位置为整数; 上四分点Q3的位置=(7+1) ×0.75=6,该位置为整数; 计算Q1、Q2、Q3的取值 中位数Q2的取值为“第4个位置”上的值“8”,即Q2=Me=8 下四分点Q1的取值为“第2个位置”上的值,即Q1=5 上四分点Q3的取值为“第6个位置”上的值,即Q3=12

(1)它随试验结果的不同而取不同的值,因而在 试验之前只知道它可能取值的范围,而不能预先 肯定它将取哪个值. (2)由于试验结果的出现具有一定的概率,于是 这种实值函数取每个值和每个确定范围内的值也有 一定的概率. 称这种定义在样本空间S上的实值单值函数X= X(e) 为

随机变量通常用大写字母 X,Y,Z 等表示

而表示随机变量所取的值时, 一般采用小写字母 x, y, z等.

随机变量的分类
我们将研究两类随机变量: 随 机 变 量 连续型随机变量

离散型随机变量

连续随机变量
? 如果一个随机变量可取数轴上某一区间内的任一
值,则称该随机变量为连续型随机变量。 如测量铜丝中的电流值 ? 连续型随机变量的取值可以是整个实数轴上的任 一区间(a,b)。

a

b

X

离散随机变量
? 如果一个随机变量的测量值是实数轴上的离散点
时,则称该随机变量是离散型随机变量。
如:公路上的汽车

? 离散型随机变量是仅取数轴上有限个点或可列个

x1 x2 x3 x4 x5 x6 x7

X 图1

考虑一个集合E, E的补集就是不在E中的元 素组成的集合,记作E’, 实数集记作R。

如果集合E1,E 2, ,E k的任意两两交集都是 ? 空的,则称他们是互不相容的

概率的性质

?1? P ? S ? ? 1 ; ? 2 ? 0 ? P ? A? ? 1 ;
(3)对于两两互斥事件 A1 , A2 ,?, 有 P ? A1 ? A2 ? ?? ? P ? A1 ? ? P ? A2 ? ? ?

易知:P( X ? E ') ? 1 ? P( X ? E )

例:假设随机变量X标准荧光管的使用寿命 (单位:小时),它的概率为:

P( X ? 5000) ? 0.1 P(5000 ? X ? 6000) ? 0.3 P( X ? 8000) ? 0.4

求:P(X>6000)和P(X ? 6000)

概率密度函数
对于任意实数 a , b, (a<b) ,
P{a ? X ? b} ? ? f ( x )dx
a b

f(x) a

P(a ? X ? b)

b

x

概率密度函数的性质
1o 2o

f ( x) ? 0

?

?

??

f ( x)dx ? 1
f (x)

这两条性质是判定一个 函数 f(x)是否为某r .v X 的 概率密度的充要条件

面积为1

o

x

累积分布函数
定义:设 X 是一个 r.v,称 F ( x ) ? P ( X ? x )( ?? ? x ? ??)
为 X 的累积分布函数 ,记作 F (x) .

o X

x

x

如果将 X 看作数轴上随机点的坐标,那么分 布函数 F(x) 的值就表示 X落在区间 (??, x] 内的 概率.

F ? x ? ? P( X ? x) ? ?
b a

x

??

f ? t ? dt

P (a ? X ? b ) ? ? f ? t ? dt
??
b ??

f ? t ? dt ? ?

a

??

f ? t ? dt

? F (b) ? F (a )

连续型随机变量的数学期望

定义 设X是连续型随机变量,其密度函数为 f (x),如 果积分
? ???

xf ( x)dx
?

绝对收敛,则称此积分值为X的数学期望, 即

? ? E ( X ) ? ? x f ( x)dx
??

X 的方差记为? 或V( x),
2

? ? V ( x) ? ?
2

? x-? ? ??

??

2

f (x)dx

X 的标准差记为? ,?= V( x)

定义:设 X 是一个随机变量,若 E[(X-E(X)]2 存在, 称 E[(X-E(X)]2为 X 的方差. 记为D(X)或Var(X),即 D(X)=Var(X)=E[X-E(X)]2

方差的算术平方根 D( X )称为X的标准差或均方差 记为? ( X ),它与X具有相同的量纲。

计算方差的一个简化公式 D(X)=E(X2)-[E(X)]2 证:D(X)=E[X-E(X)]2 =E{X2-2XE(X)+[E(X)]2} =E(X2)-2[E(X)]2+[E(X)]2 =E(X2)-[E(X)]2 利用期望 性质 展开

正态分布
若连续型 r .v X 的概率密度为

f ( x) ?

1 2? ?

?

( x ? ? )2 2? 2

e

, ??? x ? ?

其中 ? 和 ? ( ? >0 )都是常数, 则称X服从参数为 ? 和 σ 的正态分布或高斯分布. 记作

X ? N ( ? ,? 2 )

1 f x 具有下述性质 : ?1? f ? x ? ? 0 ;
?

? ?
??

??? f ? x ?dx ? 1 ; ? 3 ? 曲线 f ? x ? 关于? 轴对称;
? 4 ? 函数 f ? x ?在 (??, μ] 上单调增加,在 [ μ, ?? ) 上
单调减少,在 x ? μ 取得最大值;

?2 ?

正态分布 N ( ? , ? 2 ) 的图形特点

的陡峭程度.

? 决定了图形的中心位置,? 决定了图形中峰

正态分布 N ( ? ,? 2 ) 的分布函数 2
?

设 X~ N ( ? , ?

2

),
2σ 2

X 的分布函数是
( t ? μ )2

F ? x? ?

x ? 1 ? ?? e 2πσ

dt , ? ? ? x ? ?

3

?

标准正态分布

? ? 0,? ? 1 的正态分布称为标准正态分布.
其密度函数和分布函数常用? ( x )和 ?( x)表示:

φ? x ? ? ?? x? ?

1 e 2π 1 2π

x2 ? 2

, ?? ? x ? ?
t2 ? 2

?

x ??

e

dt , ? ? ? x ? ?

? ( x)

?( x )

?? x? ?

1 2π

?

x ??

e

t2 ? 2

dt ( ?? ? x ? ? ) 的性质 :

?1?
? 2?

1 ? ? 0? ? ; 2
?x ? R , ? ? ? x ? ? 1 ? ? ? x ? ;

定理

若 X ~ N ?? ,?

2

?, 则 Z ?

X ??

?

~ N ?0 , 1? .

标准正态分布的重要性在于,任何一个一 般的正态分布都可以通过线性变换转化为标准 正态分布.

把一般正态分布转换为标准正态分布

X ~ N ? ? ,? 2 ? ?X ?? x??? ? F ? x ? ? P ? X ? x? ? P ? ? ? ? ? ? ? ? x?? ? ? ?? ? ? ? ?

4

? 正态分布表

书末附有标准正态分布函数数值表,有了它,可 以解决一般正态分布的概率计算查表.

1 ? ( x) ? 2?

?

x

??

e dt

t2 ? 2

表中给的是 x >0 时, Φ(x)的值. 当x<0时,

? ( ? x ) ? 1 ? ? ( x)

若 X~N(0,1),

P ( a ? X ? b) ? ? ( b) ? ? ( a)
若 X ~ N ( ? , ? ), 则 Y ?
2

X ??

?

~N(0,1)

P ( a ? X ? b) ? P (

a??

? b?? a?? ? ?( ) ? ?( ) ? ?

?

?Y ?

b??

)

例:假设一根电线中电流的测量值服从均值为10毫安,方 差 为4毫安平方的正态分布,试计算(1)测量值超过13 毫安的概率 为多少?(2)电流值在9~11毫安之间的概率为多少? 第(1)的解答:

第(2)问的解答:

例 公共汽车车门的高度是按男子与车门顶头 碰头机会在 0.01 以下来设计的.设男子身高X~ N(170,62),问车门高度应如何确定?

解 设车门高度为h cm,按设计要求

P(X≥ h)≤0.01


P(X< h)≥ 0.99,

下面我们来求满足上式的最小的h .

求满足 P(X< h ) ? 0.99 的最小的 h .
所以 X ? 170 ~ N (0,1) . 因为 6 ? X ? 170 h ? 170 ? ? 故 P(X< h)=P ? ? 6 6 ? ? ? h ? 170 ? ? ?? ? 6 ? ? 查表得 ? (2.33)=0.9901>0.99 设计车门高度为 184厘米时,可使 h ? 170 因而 = 2.33, 男子与车门碰头 6 机会不超过0.01. 即 h=170+13.98 ?184 X~N(170,62),

离散随机变量
概率密度函数
X的可能取值为{0,1,2,3,4},假设X取各个值 的概率为: P(X=0)=0.6561 P(X=2)=0.0486 P(X=4)=0.0001 P(X=1)=0.2916 P(X=3)=0.0036

对于可能取值为x1,x2,…,xn,的随机变 量X,概率密度函数为:

累积分布函数

X的概率密度为: f(x0)= P(X=0)=0.6561 f(x2)= P(X=2)=0.0486 f(x4)= P(X=4)=0.0001 因此累积分布函数: f(x1)= P(X=1)=0.2916 f(x3)= P(X=3)=0.0036

F(0)=0.6561
F(4)=0.9999

F(1)=0.9477
F(5)=1

F(2)=0.9963

离散随机变量的均值
定义: 设X是离散型随机变量,它的分布率是: f(xk)P{X=xk}=pk, k=1,2,… 离散随机变量X的数学期望或均值,记为 μ或 E(x),为

? ? E ( X ) ? ? xk pk
k ?1

?

离散随机变量的方差

? ? V ( x) ? ? [ xk ? E ( X )] pk
2 2 k ?1

X的方差记为σ2或V(x),为 n

? ? x k f ( xk ) ? ?
2 k ?1

n

2

贝努里分布
当一个随机事件的发生只有两种可能的状态和结 果

如果某一随机事件在n次独立试验的每一次试验 中出现的概率p都是固定的,它不出现的概率为 1-p,那么,该事件在n次试验中出现x 次的概率 可用贝努里分布表示;
常用于产品检验中;

例:在大型公共网上,从系统注销的用户是一个泊松过程,均值 为每小时25次注销。计算(1)在6分钟内没有注销的概率为多 少? (2)到下一次注销的时间在2~3分钟之间注销的概率为多 少?(3)确定在一个区间长度,使得在这个区间内注销不发生 的概率为0.90? 解:令X表示从起点到第一次注销的小时数。则X服从参数为λ= 25次注销/小时的指数分布。 我们关心的是x超过6分钟的概率。因为λ给出的单位是每小时的 注销数,我们把所有的时间都表示成以小时为单位;6分钟= 0.1小时。要求的概率见下图概率密度函数下面阴影的面积。

贝努里分布的渐近正态分布

泊松分布的渐近正态分布
如果X是泊松随机变量,均值和方差分别为 E(X)=λ和V(X)= λ,则

Z ?

X ??

?

就是渐近标准正态变量

独立性
X 1 , X 2 , ??? X n为n个随机变量,如果对于任何 集合E1 ,E 2 , ???E n , 总有: P ? X 1 ? E1 ,X 2 ? E 2 ,??? X n ? E n ? ? P ? X 1 ? E1 ? P ? X 2 ? E 2 ? ??? P ? X n ? E n ? 称随机变量X 1 , X 2 , ??? X n是独立的

随机变量的函数
设X是均值为μ,方差为σ2的随机变量,定义新随机变量 Y=X+c,则

E ?Y ? ? E ? X ? ? c ? ? ? c
2

V ?Y ? ? V ? X ? ? 0 ? ?
若随机变量Y=cX,则

E ?Y ? ? E ? cX ? ? c ? V ?Y ? ? V ? cX ? ? c ?
2 2

独立随机变量的线性组合
独立随机变量X1,, X2...Xn的线性组合为:

Y ? c1 X1 ? c2 X 2 ? ...cn X n
其线性组合的均值和方差为:

E ?Y ? ? c1?1 ? c2 ? 2 ? ...cn ? n V ?Y ? ? c ? ? c ? ? ...c ?
2 1 2 1 2 2 2 2 2 n 2 n

例 假设长度X1和宽度X2服从独立的正态分布,

均值和方差分别为μ1 =2cm, σ1 =0.1cm, μ2 =5cm, σ2 =0.2cm。求周长Y=2 X1 + 2X2的均值和方差,并求出周长超过 14.5cm的概率

令随机变量X1, X2,...,Xn表示从n 次从重复试验得到的观察值,因为重复实 验是相同的,每个随机变量都有相同的分 布。并且假设随机变量是独立的。 我们就把这种独立同分布的随机变量 X1, X2,...,Xn称为随机样本 随机样本中随机变量的函数是统计量, 如样本均值,样本方差等 统计量的概率分布称为抽样分布

样本平均值

? ? ? ?? ? ? E( X ) ? ?? n
方差为:

均值为:

1 n X ? ? Xi n i ?1

V( X ) ?

? ? ? ??? ?
2 2

2

n

2

?

?

2

n

中心极限定理
如果X1, X2,...Xn是从均值为μ,方差为σ2的总体 中抽取的样本量为n的随机样本。

如果x为样本均值,当n ? ?时 X ?? Z? ? n 的分布的极限形式是标准正态分布

参数估计
参数估计问题是利用从总体抽样得到的信息来估 计总体的某些参数或者参数的某些函数. 估计新生儿的体重

估计废品率
估计湖中鱼数

在参数估计问题 中,假定总体分 估计降雨量 布形式已知,未 … 知的仅仅是一个 … 或几个参数.

点估计:用一个数值来估计某个参 数,这类问题称为参数的点估计; 比如用样本均值估计总体的均值。 通常用θ表示参数


设从某灯泡厂某天生产的一大批灯 泡中随机地抽取了10只灯泡,测得其寿 命为(单位:小时): 1050, 1100, 1080, 1120, 1200 1250, 1040, 1130, 1300, 1200 试用估计该厂这天生产的灯泡的平均 寿命及寿命分布的标准差.

设从某灯泡厂某天生产的一大批灯泡中随机地抽 取了10只灯泡,测得其寿命为(单位:小时): 1050, 1100, 1080, 1120, 1200 1250, 1040, 1130, 1300, 1200 试用矩法估计该厂这天生产的灯泡的平均寿命及 寿命分布的标准差. ? 1 10 解: E ( X ) ? x ? ? xi ? 1147(h) 10 i ?1

1 2 2 ? V ( X ) ? ? ? ? xi ? x ? 6821 9 i ?1
2

?

10

V ( X ) ? 79.25(h)

?

无偏性
估计量是随机变量,对于不同的样本值会得到 不同的估计值。我们希望估计值在未知参数真值附 近摆动,而它的期望值等于未知参数的真值. 这就 导致无偏性这个标准 . ? 设 ? ( X1,?, X n ) 是未知参数 ? 的估计量,若

? E (? )=?

则称

?? 为? 的无偏估计

.

无偏性的实际意义是指没有系统性的偏差 .



假设X是均值为μ,方差为σ2的随机变量。令 X1,X2,…, Xn 表示从由X代表的总体中抽取的样 本量为n的随机样本,证明样本均值和样本方差 分别是μ和σ2的无偏估计

检验假设

H0:?

? ? 0 (? 0 = 355)

称H0为原假设(或零假设); 它的对立假设是: H1:?

在实际工作中, 往往把不轻易 否定的命题作 为原假设.

? ?0

称H1为备选假设

罐装可乐的容量按标准应在350毫升和360毫 升之间. 一批可乐出厂前应进行抽样检查,现

抽查了n 罐,测得容量为 X1,X2,…,Xn,问这一 批可乐的容量是否合格?

提出假设 H0: ? = 355 由于 H1:? ≠ 355

? 已知,

选检验统计量 U ? 它能衡量差异

X ? ?0

| X ? ?0 | 大小且分布已知 .

?

n

~ N(0,1)

对给定的显著性水平?,可以在N(0,1)表中查到 分位点的值 u? 2,使

P{| U |? u? 2 } ? ?

P{| U |? u? 2 } ? ?
也就是说,―

| U |? u? 2 ‖是一个小概率事件.

故我们可以取拒绝域为:

W: | U |? u?

2

如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .

如果H0成立,但统计量的实测值落入否定 域,从而作出否定H0的结论,那就犯了“以真 为假”的错误 . 如果H0不成立,但统计量的实测值未落 入否定域,从而没有作出否定H0的结论,即 接受了错误的H0,那就犯了“以假为真”的 错误 .

请看下表

假设检验的两类错误 实际情况 决定 拒绝H0

H0为真
第一类错误

H0不真
正确

接受H0

正确

第二类错误

犯两类错误的概率: P{当H0为真时拒绝H0}=

?
?

,

显著性水平 ? 为犯第一类错误的概率.

P{当H0不真时接受H0}=

,

假设检验的一般步骤
从问题的背景里识别出感兴趣的参数 指定零假设和被择假设

选择显著性水平
写出合适的检验统计量,并计算其值 决定零假设是否应该被拒绝,在问题背景下 做出报告

总体均值的推断,方差已知
假设

1. X1,X2,…,Xn是从总体中抽取的样本量为 n的随机样本。 2.总体是正态分布的,如果不是正态分布 的,也满足中心极限定理的条件

在这些假设下, 的分布服从均值 x 为μ,方差为σ2/n的渐近正态分布

x ? ?0 Z? ~ N (0,1) ? n

均值的假设检验
假设希望检验假设: H 0 : ? ? ?0 H1 : ? ? ?0 把样本均值标准化和使用标准正态分布的检验统 计量很方便,因此选择检验统计量为:

Z0 ?

x ? ?0

?/ n

~ N (0,1)

例:某机床厂加工一种零件,根据经验知 道,该厂加工的零件的椭圆度渐近服从正 态分布,其总体均值为0.081 mm,总体标 准差为0.025 mm。今另换一种新机床进行 加工,取200个零件进行检验,得到椭圆度 均值为0.076mm。试问新机床加工零件的椭 圆度总体均值与以前有无显著差别(已检定 新机床的总体标准差为0.025 mm)。

提出原假设
H 0 : ?0 ? 0.081 H1 : ?0 ? 0.081

确定适当的统计量 x ? ?0 Z? ?/ n 规定显著性水平为 ?=0.05 计算检验统计量

Z ?

x ? ?0

?

?

作出统计决策

n

0.076 ? 0.081 ? ?2.83 0.025 200

由此我们得知 a 2 是由标准正态分布查表得到接受域 与 拒绝域相交的临界值。决策时是用两者比较。当Z 为正值时,接受域的范围是:

Z 0.025 ? 1.96

Z

?Za ? Z ? Za
2

2

结论:因为-2.83<-1.96,故拒绝。

大样本检验
根据总体方差是否已知,分为两种情况:

x ? ?0 1、方差已知 z ? ? n x ? ?0 2、方差未知 z ? S n
对于方差未知的情形,只要样本容量n充分大,可 以认为Z~N(0,1),故可以近似使用Z检验法。

均值的置信区间
我们希望确定一个区间,使我们能以比较高的 可靠程度相信它包含真参数值. 湖中鱼数的真值

[ ?

]

这里所说的“可靠程度”是用概率来度量的 , 称为置信度或置信水平.
习惯上把置信水平记作1-α,这里α是一个很小的 正数。

设总体X的分布函数为F(x;?).其中? 是未知参数, (X1,X2, · · · ,Xn)是X的样本,给定?(0< ?<1 ), 若统计量

? ? ? ( X 1 , X 2 ,? , X n ) ? ? ? ( X 1 , X 2 , ? , X n )
满足 P(? ? ? ? ? ) ? 1 ? ? 则称区间 (? , ? ) 是?的置信水平为1- ?的置信区间,

?

和 ? 分别称为置信下限和置信上限, 1- ? 称为 置信水平。

由于

1 n X ? ? Xi n i ?1

是?的无偏估计, 且

X ~ N (? ,

?2
n

)

所以随机变量

(X ? ?) n U? ~ N (0,1)

给定?(0<?<1),查正态N(0,1)分布表,可得满足条 件 ? ? ? ?
(X ? ?) n P? U ? ?? ? ? P? ? ?? ? ? ? ? ? ? ? ? 2 ? 2 ? ? ?

?

的双侧分位数等价于

由此得到?的置信水平为1- ?(简称1- ? )的置信区 间为 ? ? ? ?
?? / 2, ? X ?? / 2 ? ?X ? n n ? ?

? ? ? ? P? X ? ?? / 2 ? ? ? X ? ?? / 2 ? ? 1 ? ? n n ? ?

总体方差?2已知的区间估计图示说明
f (x) N (0,1)

?
2
? ?? / 2

?
2

O

?? / 2

x

置信区间的长度
设置信区间的长度为l,则

2? l? ?? /2 n

#对给定?,区间长度l随n的增加而减少;

#对给定n,区间长度l随?的减少(即置信水平1- ? )而增大。
注意: 在同一置信水平下,置信区间的选取是不唯一的,如在上 例中,可以令?=0.01+0.04,则新的置信区间为:
? ? ? ? X? ? 0.04,X ? ? 0.01 ? ? n n ? ?

置信长度l2(=0.0408)>l1(=0.0392)

总体均值的推断,方差未知
设总体 X ~ N ( ? , ? 2 ),总体方差末知,此时,对总体 均值的检验不能用上述z检验法,因为,此时的检验 统计量
?

x?? Z ? ? / n

中包含了未知参数。为了得到一个不含未知参数的 检验统计量,很自然会用总体方差的无偏估计量— 样本方差

S

2 n

来代替,于是得到t统计量。

? xn ~ N ( ? , ? 2 ) ? 2 xn ? ? ? ? ? n ~ N (0,1)? ? ? xn ~ N ( ? , ) ? 1 n xn ? ? xi ? ? ? n ?? n i ? ? 2 (n ? 1) sn 2 ? ~ ? (n ? 1) 2 ? ? ? ?t ? xn ? ? ? n (n ? 1) s (n ? 1)?
2 n 2

xn ? ? ? ~ t (n ? 1) sn n

具体做法
?

?

根据题意提出假设(与Z检验法中的假设形式 相同);构造检验统计量t,并根据样本信息 计算其具体值;对于给定的检验水平?,由t分 布表查得临界值;将所计算的t值与临界值比 较,作出检验结论。 检验准则:若 t ? t a ,则拒绝 H 0;反之, 2 接受 H1

某公司人事部门在社会上招工,在文化 考核结束后,公司经理问人事经理考核 情况,回答是“平均成绩在90 分”。经 理随机从试卷抽取20份,发现平均成绩 为83分,标准差为12分。如果经理想在 0.01的显著性水平下检验人事部门所做 的推测的准确性,应该怎样处理?

假设H0: “平均成绩在90 分”成立, H1: “平均成绩在90 分”不成立。 X ~ N ( ? , ? 2 ) ,均值已知,方差未知, 总体 适宜用t统计量检验。依题意:

x ? 83, s ? 12 ? 144 , n ? 20, ? ? 90, ? ? 0.01
2 2

x ? ? 83 ? 90 t? ? ? ?2.61 s 12 n 20

t0.005 ?19 ? ? 2.861

t ? t0.005 ?19 ?
接受H0,即“平均成绩在90 分”成立。

总体方差?2未知的区间估计
随机变量
t? X ?? ~ t (n ? 1) S/ n

对给定?(0<?<1),查t分布,可得t(n-1)分布 的双侧分位数t?/2(n-1),使得

? X ?? ? ? P (| t |? t? / 2 (n ? 1)) ? P? ? S / n ? t? / 2 (n ? 1) ? ? 1 ? ? ? ?

置信区间为

S S ? ? P? X ? t (n ?1), X ? t (n ?1) ??1?? n ? /2 n ? /2 ? ?
S S ? ? t? / 2 ( n ? 1), X ? t? / 2 ( n ? 1) ? ?X ? n n ? ?

在上例中,若总体方差未知,样本方差可以根据样 本数据计算得到。则此时?=0.05,查t分布表得 t0.025=2.57,代入置信区间计算公式得参数?的置信 水平为95%的置信区间为:(1.4715,1.5185)
f (x) t (n)

?
2

?
2

t1?? / 2 (n)

O

t? / 2 (n)

x

正态总体的方差推断
正态总体方差的假设检验
1 n 1 n 若X ~ N ( ? , ? 2 ), ? ? xi,S 2 ? X ( xi ? X ) 2 , 则有 : ? n i ?1 n ? 1 i ?1 ? xi ? X ?? ? ? i ?1 ?
n

? ?n ? 1?S 2 ~ ? 2 (n ? 1) ? ~ ? 2 (n ? 1) ? ? ?2 ?
2

1.建立假设

H0 :? ? ?
2

2 0

H1 : ? ? ?
2

2 0

2.构造适当的检验统计量 由于样本方差是总体方差的无偏估计量,因此可 用此特点来构造检验统计量
? 02 ? 2 检验.当原假 用上式为检验统计量的检验称为 设为真时,该统计量服从自由度为n-1的 ? 2 分布

检验统计量及其分布为: v ?

(n ? 1) s 2

~ ? 2 (n ? 1)

3.定显著性水平α,一般α=0.05或0.01 4.决策规则
2 接受H0: ? 2 a ( n ? 1) ? v ? ? a ( n ? 1) 1? 2 2

拒绝H0: v ? x 2 a ( n ? 1) 1?
2

2 v ? xa (n ? 1) 2

5.根据统计量的观察值和统计量的分布的临 界值的比较进行决断

正态总体方差的置信区间 设总体X~N (?,?2) ,(X1,X2, · · · ,Xn)是X的样本, 对总体方差?2 做区间估计 随机变量
(n ? 1 S 2 ) ?2 ? ~ ? 2 (n ? 1) 2

?

给定?(0<?<1),依?2分布上侧分位数的定义
P( ?12?? / 2 (n ? 1) ? (n ? 1) S 2

?2

2 ? ?? / 2 (n ? 1)) ? 1 ? ?

查?2(n-1)分布表,可得



2 ?12?? / 2 (n ? 1) 和 ?? / 2 (n ? 1)

2 ? (n ? 1) S 2 ( n ? 1) S 2 P? 2 ?? ? 2 ? ? ?1?? / 2,n ?1 ? ? / 2,n ?1

? ? ? 1?? ? ?

则得标准差的一个置信水平位1-?的置信区间为
? (n ? 1) S (n ? 1) S ? ? ? , ? ? 2 (n ? 1) ? 2 (n ? 1) ? ? /2 1?? / 2 ? ?

二项比例的假设检验
考虑一个生产过程,通常,用二项分布对缺陷 的发生建模是合理的,而且二项参数p代表生产的产 品有缺陷的比例。 H1 : p ? p0 假设: H 0 : p ? p0 根据二项分布的正态近似性做出的近似假设, 令X表示样本量为n的随机样本中与p关联的那一类的 观察数,则: X ? np Z? ~ N (0,1) np(1 ? p)

如果原假设H0:p=p0为真,就有近似的

X ~ N [np0 , np0 (1 ? p0 )]
X ? np0 np0 (1 ? p0 )

计算检验统计量:

Z0 ?
如果

z0 ? z? /2



z0 ? ? z? /2

就拒绝H0 ,否则就接受H0。

例:半导体制造厂生产了用于汽车发动机的控制器。 顾客要求生产过程的次品率不超过0.05,制造厂用 α=0.05证明了生产过程能达到这个水平,半导体制 造厂随机抽取了200个设备做样本,发现有4个是次 品。制造商能证明生产过程能被顾客接受吗? 解:假设H0:p=0.05 H1:p<0.05

α=0.05
检验统计量为:

z0 ?

x ? np0 np0 (1 ? p0 )

如果z0<-z0.05=-1.645就拒绝H0:p=0.05 计算检验统计量的值

4 ? 200(0.05) z0 ? ? ?1.95 200(0.05)(0.95)
因为z0<-z0.05=-1.645,拒绝H0,得出结论:生 产过程的次品率小于0.05.

二项比例的置信区间
构造p的置信区间
P( ? z? / 2 ? Z ? z? / 2 ) ? 1 ? ? ? P?p ? P( ? z? / 2 ? ? z? / 2 ) ? 1 ? ? p(1 ? p) n

重新整理可以得到
? ? P ? P-z? / 2 ? p(1 ? p) ? ? p ? P+z? / 2 n p(1 ? p) ? ? ? 1?? n ?

? 式中 p(1 ? p) 称为点估计 P 的标准误差

? 在标准误差中用 P 代替p,得到
? ? ? ? ? P(1 ? P) P(1 ? P) ? ? ? ? ? 1?? P ? P-z? /2 ? p ? P+z? /2 n n ? ? ? ?

? 如果 P 是样本量为n的随机样本中某一感兴 趣类的观察比例,属于这一类的总体比例p的 100(1-α)%的渐近置信区间为:
? P-z? /2 ? ? ? ? P(1 ? P) P(1 ? P) ? ? p ? P+z? /2 n n

例:在一个由85个汽车发动机机轴组成的随机样 本中,有10个表面加工比较粗糙达不到规格要求。 因此,总体中超过粗糙程度规格的轴承比例的点 ? 估计为 P ? x / n ? 10 / 85 ? 0.12 计算p的95%的双边置信区间: ? ? ? ? P(1 ? P) P(1 ? P) ? ? P-z0.05 ? p ? P+z0.05 n n 即

0.12(0.88) 0.12(0.88) 0.12-1.96 ? p ? 0.12+1.96 85 85 0.05 ? p ? 0.19

相关关系的种类

(1)

( 2)

(3)

( 4)

图中()、(2)为线性相关,(3)、(4)为非线性相关。 1

1.按相关关系的程度划分可分为完全相关,不 完全相关和不相关。 2.按相关形式划分可以分为线性相关和非线性 相关。 3.按相关的方向划分可分为正相关和负相关

(1)正相关:两个相关现象间,当一个变量的数值 增加(或减少)时,另一个变量的数值也随之增 加(或减少),即同方向变化。 例如收入与消费的关系。

(2)负相关:当一个变量的数值增加(或减少)时, 而另一个变量的数值相反地呈减少(或增加)趋 势变化,即反方向变化。
例如物价与消费的关系。

相关系数的定义
简单相关系数:在线性条件下说明两个变量之间 相关关系密切程度的统计分析指标,简称相关系 数。

若相关系数是根据总体全部数据计算的,称 为总体相关系数,记为? 若是根据样本数据计算的,则称为样本相关 系数,记为 r

相关系数及其计算

r?

? (x
i ?1

n

i

? x)( yi ? y )
2

? (x
i ?1

n

i

? x)

?(y
i ?1

n

i

? y)

2

式中,x, y为随机变量,n为变量的项数

测定两变量是否线性相关?
计 算 公 式
? xy 定义式: ? ? ? x ??
r?
y

实际计算:

相 关 系 数

n? x 2 ? ( ? x ) 2 n? y 2 ? ( ? y ) 2

n? xy ? ? x ? ? y

|r|=0 不存在线性关系或存在非线性相关; 值:|r|=1 完全线性相关 0<|r|<1不同程度线性相关(0~0.3 微弱; 0.3~0.5 低度;0.5~0.8 显著;0.8~1 高度) 符号:r>0 正相关;r<0 负相关

相关关系的测度
(相关系数取值及其意义)

完全负相关

无线性相关

完全正相关

-1.0

-0.5

0

+0.5
正相关程度增加

+1.0

r
负相关程度增加

一元线性回归模型
(概念要点)

1. 当只涉及一个自变量时称为一元回归,若因变量 y
与自变量 x 之间为线性关系时称为一元线性回归。

2. 对于具有线性关系的两个变量,可以用一条线性
方程来表示它们之间的关系。

3. 描述因变量 y 如何依赖于自变量 x 和误差项? 的方
程称为回归模型。

一元线性回归 回归分析的一个基本任务是估计?(x), 对散点图上n个点拟合一条曲线,如果该曲 线能正确反映y与x的关系,则该曲线的方 程应为y= ?(x),当?(x)为线性函数, 即?(x)=a+bx,此时,估计?(x)的问题 称为一元线性回归问题。

线性回归方程
如果由样本得到参数 于给定的x,取 作为 ? ( x) ? a ? bx

a, b

的估计

? ? a, b

,则对

? ? ? y ? a ? bx
的估计,方程

? ? ? y ? a ? bx

称为y关于x的线性回归方程,其图形称为回归 直线。

a,b和?2的估计
? 取x的一组不全相同的值 x1, x2 ,?, xn 作 独立试验,得到样本

( x1, y1 ), ( x2 , y2 ), ?, ( xn , yn )
? 由一元线性回归数学模型知

yi ~ N (a ? bxi , ? ), i ? 1,2,?, n
2

a,b和?2的估计
? 用最小二乘法来估计参数a和b,全部观测值 yi 与回 归值 y i 的偏差平方和 ?

? Q(a, b) ? ? ( yi ? yi ) 2 ? ? ( yi ? a ? bxi ) 2
i ?1 i ?1

n

n

使 Q(a, b)达到最小值的a和b,作为a,b的估计值。
? 取Q关于a和b的偏导数,并令它们分别等于零
n ?Q ? ?2? ( yi ? a ? bxi ) ? 0 ?a i ?1

n ?Q ? ?2? ( yi ? a ? b xi ) xi ? 0 ?b i ?1

最小二乘法(图示)

y
? ? ei = yi^i -y

(xn , yn) ? ?

? ? ? y ? ?0 ? ?1 x
?

(x2 , y2) ?
? ? (x1 , y1)


? (xi , yi)

x

a,b和?2的估计 整理后得

na ? nx b ? ny nx a ? (? xi )b ? ? xi yi
2 i ?1 i ?1 n n

其中

称上述方程组为正规方程

1 n 1 n x ? ? xi ,y ? ? yi n i ?1 n i ?1

? ? a ? y ? bx ? b?

? (x
i ?1 n

n

i

? x )( yi ? y )
i

? (x
i ?1

? x)

2

? 于是所求的线性回归方程为 y ? a ? bx ? ? ?

? ? ? 若将 a ? y ? bx 的另一形式:

代入上式,则得线性回归方程

? ? y ? y ? b( x ? x )

? 上式表明回归直线必通过散点图的几何中心 x, y

a,b和?2的估计
为了计算上的方便,引入以下记号:

1 n S xx ? ? ( xi ? x ) ? ? xi ? (? xi ) 2 n i ?1 i ?1 i ?1
2 2

n

n

1 n 2 S yy ? ? ( yi ? y ) 2 ? ? yi ? (? yi ) 2 n i ?1 i ?1 i ?1
S xy ? ? ( xi ? x )( yi ? y )
i ?1 n 1 n ? ? xi yi ? (? xi )(? yi ) n i ?1 i ?1 i ?1 n n

n

n

则a和b的估计可写为:

? ? ? y ? bx ? y ? a ?? b S xy S xx

S xy S xx

x

例 某种合金的抗拉强度y(kg/mm2)与其中的含 碳量x(%)有关,今测得12对数据如表所示。 试求y关于x的线性回归方程.

x y

0.10 42.0

0.11 43.5

0.12 45.0

0.13 45.5

0.14 45.0

0.15 47.5

0.16 49.0

0.17 53.0

0.18 50.0

0.20 55.0

0.21 55.0

0.23 60.0

解——列表
x y x2 y2 xy

0.10 0.11 0.12 0.13 0.14 0.15

42.0 43.5 45.0 45.5 45.0 47.0

0.0100 0.0121 0.0144 0.0169 0.0196 0.0225

1764.00 1892.25 2025.00 2070.25 2025.00 2256.25

4.2 4.785 5.4 5.915 6.3 7.125

0.16
0.17 0.18 0.20 0.21 0.23 ? 1.90

49.0
53.0 50.0 55.0 55.0 60.0 590.5

0.0256
0.0289 0.0324 0.0400 0.0441 0.0529 0.3194

2401.00
2809.00 2500 3025 3025 3600 29392.72

7.84
9.01 9.0 11 11.55 13.8 95.925

解——计算结果
1 S xx ? 0.3194 ? ? (1.90) 2 ? 0.0186 12 1 S xy ? 95.925 ? ?1.90 ? 590 .5 ? 2.4292 12 ? ? S xy ? 130 .6022 b S xx ? ? a ? y ? bx ? 28 .5340



? 线性回归方程为 y ? 28.534 ? 130 .6022 x

离差平方和的分解

1. 总平方和(SST)
? 反映因变量的 n 个观察值与其均值的总离差

2. 回归平方和(SSR)
? 反映自变量 x 的变化对因变量 y 取值变化的影响, 或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和。
反映除 x 以外的其他因素对 y 取值的影响,也称 为不可解释的平方和或剩余平方和。

3. 残差平方和(SSE)
?

样本决定系数
(判定系数 r2 )

1. 回归平方和占总离差平方和的比例:

2. 反映回归直线的拟合程度 3. 取值范围在 [ 0 , 1 ] 之间 4. r2 ?1,说明回归方程拟合的越好; r2?0,说明回归方程拟合的越差

被变动并设有待比较的一组处理的因子称为试验因素, 简称因素或因子(factor),试验因素的量的不同级别或 质的不同状态称为水平(level)。 (1)单因素试验(single-factor experiment) 单因素试验是指 整个试验中只变更、比较一个试验因素的不同水平,其 他作为试验条件的因素均严格控制一致的试验。 (2) 多因素试验(multiple-factor or factorial experiment) 多因素试验是指在同一试验方案中包含2个或2个以上 的试验因素,各个因素都分为不同水平,其他试验条件 均应严格控制一致的试验。

正交试验法是研究与处理多因素试验的一种科学方 法,它是在实践经验与理论认识的基础上,利用正 交表来科学、合理安排和分析众多因素的试验方法。 它优点在于能从很多试验条件中,选出代表性强的 少数次条件,并能通过对少数次试验条件的分析, 找出较好的生产条件、最优的试验方案、较优的结 果。
选择三个不同的水平

影响因素 4 10

全面试验次数 34 (81) 310 = 59049

正交试验次数 9 27

正交表是由正交拉丁方自然推广而得到的规格化的表。 正交表是有规律的,按顺序排成现成的表格,是正交试 验的工具,正交试验是通过正交表进行的。
正交表列数
因素数 正交表代号

L4(23)
? ? ? ? ? é ? ? ? ? 1 2 3 4 1 1 1 2 2 2 1 2 1 2 3 1 2 2 1

L4
正交表横行数 代表试验次数

(23)
因素水平表 位级数

正交表的格式与特点

L8(2 )? ? ± ??í ?? ?? ?é? ??? 1 2 3 4 5 6 7 8 1 1 1 1 1 2 2 2 2 2 1 1 2 2 1 1 2 2 3 1 1 2 2 2 2 1 1 4 1 2 1 2 1 2 1 2 5 1 2 1 2 2 1 2 1 6 1 2 2 1 1 2 2 1 7 1 2 2 1 2 1 1 2

7

某轨枕厂试用减水剂以节约水泥。影响 指标的因素有四个,每个因素选取三个 水平。 考察的试验指标仅为脱模强度, 已知在节约水泥10%的条件下 使用减水剂对脱模强度影响比 较好,希望通过正交试验找出 比较好的配方。

1
2

试验目的:水泥掺用减水剂以节约水泥 考核指标:轨枕脱模强度

制订因素水平表- 根据以往经验和资料 分析制订
ò ????± í
ò × ? ? ? ? ? ? 1 2 3 ? ? ? ? ? ± A 0.28 0.30 0.32 ? °? ? ? ? B 0.27 0.28 0.29 ? ? ? ? ? ? ? ? ? ? C 0.30% 0.50% 0.70% ? à ? ? ? ? ? ? 2 D? kg/cm ? ¨ ? 370 380 390

3 选用正交表 这里选用L9(34)
? ? ? ? ? é ? ? ? ? 1 2 3 4 5 6 7 8 9 1 1 1 1 2 2 2 3 3 3 L9 (3 ) 2 1 2 3 1 2 3 1 2 3
4

3 1 2 3 2 3 1 3 1 2

4 1 2 3 3 1 2 2 3 1

4 设计试验方案
????± é í
? ? ? ? ? é ? ? ? ? 1 2 3 4 5 6 7 8 9 ? ? ? ? ? ± A 1(0.28) 1(0.28) 1(0.28) 2(0.30) 2(0.30) 2(0.30) 3(0.32) 3(0.32) 3(0.32) ? °? ? ? ? ? ? ? ? ? ? ? ? ? ? B C(%) 1(0.27) 1(0.3) 2(0.28) 2(0.5) 3(0.29) 3(0.7) 1(0.27) 2(0.5) 2(0.28) 3(0.7) 3(0.29) 1(0.3) 1(0.27) 3(0.7) 2(0.28) 1(0.3) 3(0.29) 2(0.5) ? à ? ? ? ? ? ? 2 D? kg/cm ? ¨ ? 1(370) 2(280) 3(390) 3(390) 1(370) 2(280) 2(280) 3(390) 1(370)

5 进行试验,并记录计算
水泥轨枕脱模强度试验分析表
列号 水灰比 含砂率 减水剂用量 试验号 A B C(%) 1 1(0.28) 1(0.27) 1(0.3) 2 1(0.28) 2(0.28) 2(0.5) 3 1(0.28) 3(0.29) 3(0.7) 4 2(0.30) 1(0.27) 2(0.5) 5 2(0.30) 2(0.28) 3(0.7) 6 2(0.30) 3(0.29) 1(0.3) 7 3(0.32) 1(0.27) 3(0.7) 8 3(0.32) 2(0.28) 1(0.3) 9 3(0.32) 3(0.29) 2(0.5) K1 1063 1058 1015 K2 1036 1053 1097 K3 1069 1057 1056 R 33 5 82 水泥用量 试验结果 2 D(kg/cm ) (脱模强度) 1(370) 333 2(380) 368 3(390) 362 3(390) 367 1(370) 336 2(380) 333 2(380) 358 3(390) 349 1(370) 362 1031 K = 3168 1059 1078 47

进行分析 – 计算极差 6 水泥轨枕脱模强度试验分析表
列号 水灰比 含砂率 减水剂用量 试验号 A B C(%) 1 1(0.28) 1(0.27) 1(0.3) 2 1(0.28) 2(0.28) 2(0.5) 3 1(0.28) 3(0.29) 3(0.7) 4 2(0.30) 1(0.27) 2(0.5) 5 2(0.30) 2(0.28) 3(0.7) 6 2(0.30) 3(0.29) 1(0.3) 7 3(0.32) 1(0.27) 3(0.7) 8 3(0.32) 2(0.28) 1(0.3) 9 3(0.32) 3(0.29) 2(0.5) K1 1063 1058 1015 K2 1036 1053 1097 K3 1069 1057 1056 R 33 5 82

最好? 水泥用量 试验结果 2 D(kg/cm ) (脱模强度) 1(370) 333 2(380) 368 3(390) 362 3(390) 367 1(370) 336 2(380) 333 2(380) 358 3(390) 349 1(370) 362 1031 K = 3168 1059 1078 47

K1= 333 + 368 + 362 = 1063 K2= 367 + 336 + 333 = 1036 K3= 358 + 349 + 362 = 1069 RA= 1069 – 1036 = 33

7

进行分析

确定主次因素顺序:R越大,说明 该因素的水平变化对试验结果指标 影响越大,因而这个因素对试验指 标就愈重要。在本例中,减水剂是 主要因素;
主 C D A B 次

7 进行分析
选取较优方案:
最优方案一般就是最优水平的组合,所谓最优水平的组 合就是指全体最优水平组成的试验条件;当试验指标越 大越好时,以每列的Ki中数值最大的相应水平为最优水 平; 本例中, 因素A 中最优水平为水平3 因素B 中最优水平为水平1 因素C 中最优水平为水平2 因素D 中最优水平为水平3

最优水平组合为A3B1C2D3:

某工厂生产一种检查某种疾病用的 碘化钠晶体,要求应力愈小愈好。 退火工艺是影响质量的一个重要环 节。现通过正交试验找到降低应力 的工艺条件。影响指标的因素有升 温速度、恒温温度、恒温时间、降 温速度,每个因素选取三个水平。

1

试验目的:找到事宜的退火工艺条件 考核指标:应力

2 制订因素水平表
因素水平表
因素 水平 1 2 3 升温速度 恒温温度 恒温时间 A B C 30(C/h ) 600(C ) 6(h) 50(C/h ) 450(C) 4(h) 100(C/h ) 500( C) 2(h) 降温速度 D 1.5(安培) 1.7(安培) 15(C/h )降

3 选用正交表 用L9(34)
? ? ? ? ? é ? ? ? ? 1 2 3 4 5 6 7 8 9 1 1 1 1 2 2 2 3 3 3 L9 (3 ) 2 1 2 3 1 2 3 1 2 3
4

3 1 2 3 2 3 1 3 1 2

4 1 2 3 3 1 2 2 3 1

4
列号 试验号 1 2 3 4 5 6 7 8 9

设计试验方案

正交试验表
升温速度 恒温温度 A B 恒温时间 C 降温速度 D

5

进行试验,并记录计算
试验结果分析表

列号 升温速度 恒温温度 试验号 A B 1 2 3 4 5 6 7 8 9 K1 K2 K3 R

恒温时间 C

降温速度 D

应力 6 7 15 8 0.5 7 1 6 13 K = 63.5

6

进行分析

确定主次因素顺序:

R越大,说明该因素的水平变化对试验 结果指标影响越大,因而这个因素对 试验指标就愈重要。在本例中,主要 因素是?????;
主 A? C ? B? D? 次

何为交互作用

在一个生产过程中,变异性只能减少,不能 消除,变异总是存在的。自然变异或“背景噪声” 是那么小的、根本无法避免的原因的积累。 当过程中的背景噪声相对比较小时,通常把 它看成是过程绩效的一个可接受水平,自然变异 通常被称为“机遇因素的稳定系统”,仅仅面临 机遇因素的过程称为在统计控制中。 错误的调整机器、操作错误以及有缺陷的原 材料等这些变异同背景噪声相比通常是较大的, 它通常表示过程绩效一个不能接受的水平。我们 称这些不属于机遇因素变异的资源为非机遇因素。 在非机遇因素存在下操作的过程就说不在控制中。

控制图是判别生产过程是否处于控制状态的一种 手段; 利用它可以区分质量波动是由偶然原因引起的还 是由系统原因引起的。

控制图

质量特征值可描述成一般形式:

xt ? ? ? rt ? d

rt ~ N (0, ? 2 )

式中:xt 为t时刻的产品质量特征值, ? 为质量 特征值分布的均值, rt 是随机因素引起的噪声, d 是异常因素引起的干扰

xt ~ N ( ? , ? )
2

xt ~ N ( ? ? d , ? 2 )

质量特性 x

公差上限Tu
控制上限UCL
Upper Control Limit



中心线CL
Central Limit



控制下限LCL
Lower Control Limit

公差下限TL
样品序号

三线:中心线,上控制限,下控制限;
控制图的基本模式

控制图的设计原理
正态性假定 3σ准则

小概率原理
反证法思想 经济性原则

控制图的分类
按产品质量特性来分类,控制图可分为: 计量值控制图与计数值控制图; 按控制图的用途来分类,控制图可分为: 分析用控制图与控制用控制图;

计量值控制图 适用于产品质量特性为计量值的情形。 例如:长度、重量、时间、强度、成分等连 续变量。常用的计量值控制图有下面几种:
1. 均值-极差控制图( x ? R 图)。

x 2. 中位数-极差控制图( ~ ? R
3. 单值-移动极差控制图( x ? Rs

图)。
图)。

4. 均值-标准差控制图(

x?S

图)。

计数值控制图

适用于产品质量特性为计数值的情形。 如:不合格品数、不合格品率、缺陷数、 单位缺陷数等离散变量。常用的计数值控 制图有:
1. 不合格品率控制图(P图)。 2. 不合格品数控制图(Pn图)。 3. 单位缺陷数控制图( u图)。 4. 缺陷数控制图(c图)。

均值-极差控制图
图(均值控制图)和R图(极差控制图) 联合使用的一种控制图。
X

X ? R 图是

要求的受控状态, 能力要强。

X 图主要用于判断生产过程的均值是否处于或保持在所
X

图比单值(x)控制图发现异常的敏感

R图用于判断生产过程的标准差是否处于或保持在所要求 的受控状态;

的计量值控制图;一般n = 3、4、5、6为宜;

X ? R 图通常在样本容量较小时使用,是一种最常用

绘制控制图的基本步骤
1、收集数据并加以分组 在5MIE充分固定,并标准化的情况下,从生产 过程中收集数据。

对于均值控制图,当每组样本大小 n≤ 10 时,一 般来说,组数k≥ 25.
第一步

数据

ù ? ? ? ±? 1 2 ? ? k

X1 x11 x21 ? ? xk1

? ? ? ? ? ? X2 …… x12 x22 ? ? xk2 ? ? ? ? ? ?

Xn x1n x2n xkn

ù ? ? ? Xi

? ? ? ? Ri

2、计算每组的样本均值和样本极差

1 xi ? ? xi j n j ?1

n

i =1,2,…,k

Ri ? max xi
1? j ? n

? ?? min?x ?
j 1? j ? n i j
第二步

3、计算全部样本组的平均样本均值和平均样本极差

1 X ? ? xi k i ?1

k

1 R? k

?
i ?1

k

Ri
第三步

4、计算控制界限 我们用总平均来估计总体均值μ
?UCL ? x ? 3 ? ? x?3 R ? x ? A2 R ? n (d 2 n ) ? ? x 图?CL ? x ? ? LCL ? x ? A2 R ? ?

总体标准差未知,需要确定样本极差与它的关系

W ? R /?

R是随机变量,所以相对极差W
第四步

也是随机变量,并且W分布的参数都是确定的。

W分布的均值称作d2,W的标准差称为d3

? R ?? W ? ? R ? d 2? ? ? ? R / d2 ? ? R ? d3 R / d 2

? R ? d3?

R是? R的一个估计

? 3d3 R ? D4 R ?UCL ? R ? 3d 3? ? R ? d2 ? R图 ?CL ? R ? LCL ? D R ? 0 3 ? ?
系数A2(n)数值表
n 2 3 4 5 6 7 8 9 10 A2(n) 1.881 1.023 0.729 0.577 0.483 0.419 0.373 0.337 0.308 D3(n) 0.076 0.136 0.337 0.308 D4(n) 3.267 2.575 2.282 2.115 2.004 1.924 1.864 1.816 1.777

5、制作控制图;

在方格纸上分别作 x 图和R图,两张图必须画 在同一页纸上,这样以便对照分析。x 图在上,R 图在下,纵轴在同一直线上,横轴相互平行,并 且刻度对齐。极差R不可能为负值,所以R的下控 制界限线可以省略。

第五步

6、描点
49.56 49.54 49.52 49.5 49.48 49.46 49.44 0.2

x 图
UCL= 49.553 CL= 49.5068

R图

LCL= 49.4606 UCL= 0.1692

0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0

CL= 0.08

第六步

7、分析生产过程是否处于统计控制状态;

利用分析用控制图的判断规则,分析生产过程 是否处于统计控制状态。

第七步

分析用控制图的判断规则1 绝大多数点子在控制界限内,即: A. 连续25点中没有一点在控制界限外; B. 连续35点中最多有一点在控制界限外; C. 连续100点中最多有两点在控制界限外。

分析用控制图的判断规则2 点子排列无下述异常现象: ? 连续7点或更多点在中心线同一侧(7点链); ? 连续7点或更多点的单调上升或单调下降(7点单调链) ? 连续11点中至少有10点在中心线同一侧; ? 连续14点中至少有12点在中心线同一侧; ? 连续17点中至少有14点在中心线同一侧; ? 连续20点中至少有16点在中心线同一侧; ? 连续3点中至少有2点落在二倍标准差与三倍标准差控制 界限之间; ? 连续7点中至少有3点落在二倍标准差与三倍标准差控制 界限之间。

模式:连续7点出现在中心线一侧。 “连续7点出现在中心线一侧”出现的概率 值为:

P ? C ?0.49865 ? ?0.9973 ? 0.49865 ? ? 0.0077
7 7 7 0

因为0.0077<0.01(小概率数值标准),所以 ,在控制图中“连续7点出现在中心线一侧” 的现象应判断点子排列有缺陷。

例:某厂生产一种零件,其长度要求为 49.50±0.10 ( mm ), 生产过程质量要求为过程 能力指数不小于1,为对该过程实施连续监控,试 设计均值-极差控制图;

1、收集数据并加以分组 在5MIE充分固定,并标准化的情况下,从生产 过程中收集数据。 本例每隔2h,从生产过程中抽取5个零件,测量 其长度值,组成一个大小为5的样本,一共收集25 个样本. 一般来说,制作R图,每组样本大小 n≤ 10 , 组数k≥ 25.

数据

ù ? ? ? ±? 1 2 ? ? k

X1 x11 x21 ? ? xk1

? ? ? ? ? ? X2 …… x12 x22 ? ? xk2 ? ? ? ? ? ?

Xn x1n x2n xkn

ù ? ? ? Xi

? ? ? ? Ri

样本 1 2

xi1 ? xi 5

xi
49.485 49.516

Ri
0.06 0.07

样本 15 16 17 18 19 20 21 22 23 24

xi1 ? xi 5

xi
49.490 49.504 49.510 49.506 49.510 49.502 49.516 49.502 49.502 49.500

Ri
0.09 0.05 0.07 0.06 0.05 0.08 0.10 0.06 0.09 0.05

3
4 5 6 7 8 9 10 11 12 13

49.500
49.496 49.530 49.506 49.504 49.502 49.506 49.526 49.500 49.512 49.494

0.06
0.07 0.11 0.12 0.10 0.06 0.12 0.09 0.11 0.06 0.07

25

49.524
1237.669 49.5068

0.11
2.00 0.080

?
平均

14

49.526

0.10

表(某零件长度值数据表)

2、计算每组的样本均值和样本极差

1 xi ? ? xi j n j ?1

n

i =1,2,…,k

Ri ? max xi j ? min xi j
1? j ? n 1? j ? n

? ?

? ?

3、计算全部样本组的平均样本均值和平均样本极差

1 X ? ? xi ? 49 .5068 k i ?1
1 R ? ? Ri ? 0.0800 k i ?1
k

k

4.计算控制界限
?UCL ? x ? A R ? 49.5068? 0.577? 0.0800 ? 49.5530 2 ? ? x图?CL ? x ? 49.5068 ? ? LCL ? x ? A2 R ? 49.5068? 0.577? 0.0800 ? 49.4606 ? ?UCL ? D4 R ? 2.115 ? 0.0800 ? 0.1692 ? 上式中A2,D4,D3 均从控 R图?CL ? R ? 0.0800 制图系数表中查得:当 ?LCL ? D R ? 0 3 ?

系数A2(n)数值表

n=5时,A2=0.577 D3<0 D4=2.115

n 2 3 4 5 6 7 8 9 10 A2(n) 1.881 1.023 0.729 0.577 0.483 0.419 0.373 0.337 0.308 D3(n) 0.076 0.136 0.337 0.308 D4(n) 3.267 2.575 2.282 2.115 2.004 1.924 1.864 1.816 1.777

5、制作控制图;

在方格纸上分别作 x 图和R图,两张图必须画 在同一页纸上,这样以便对照分析。x 图在上,R 图在下,纵轴在同一直线上,横轴相互平行,并 且刻度对齐。本例由于R图的下限为负值,但极差 R不可能为负值,所以R的下控制界限可以省略。

6、描点;
49.56 49.54 49.52 49.5 49.48 49.46 49.44

x图

UCL= 49.553 CL= 49.5068

LCL= 49.4606

0.2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0

R图

UCL= 0.1692

CL= 0.08

7、分析生产过程是否处于统计控制状态; 利用分析用控制图的判断规则,分析生产过程 是否处于统计控制状态。本例经分析,生产过程 处于统计控制状态。

x-Rs图适用于一次只能测得一个数据或由于产品比较均匀 (如流程性材料)一次只需测一个数据的情况。

x图主要用于判断生产过程的均值是否处于或保持在所要 求的受控状态; Rs图用于判断生产过程的标准差是否处于或保持在所要求 的受控状态;

xi ~ N (? ,? ),i ? 1,2,?k
2

1 ? ??x? k

?x
i ?1
k

k

i

Rs ? ? ? d 2 ?2 ?

Rsi ? xi ? xi ?1
1 Rs ? k ?1

i= 2,…,k

?R
i?2

si

d 2 ?2? ? 1.128

X-Rs图(单值-移动极差控制图)

? Rs Rs ? x ? 2.66Rs ?UCL ? x ? 3 ? x ? 3 d2 1.128 ? ? x图?CL ? x ? ? ?LCL ? x ? 2.66Rs ?

Rsi ? xi ? xi ?1

i ? 2,3,?, k

移动极差Rs的期望 : E ?Rs ? ? d 2? ? 1.128 ?

移动极差Rs的标准偏差: D?Rs ? ? d 3? ? 0.853 ?
Rs Rs ? ? ? ? d 2 ?2? 1.128 1.128? 3 ? 0.853 ? Rs ? 3.27Rs ?UCL ? d 2? ? 3d 3? ? 1.128 ? ? Rs图?CL ? d 2? ? Rs ? 1.128? 3 ? 0.853 ? LCL ? d 2? ? 3d 3? ? Rs ? 0 ? 1.128 ?

例:某化工厂生产某种化工产品,为控制产品中 主要成分含量而设置质量控制点。若对主要成分 含量的要求为:12.8 ? 0.7,过程质量要求为不合 格品率不超过5%,试设计 x ? R 图
s

样本

xi
12.1
12.1 12.4 13.2 13.3 12.4 13.0 13.5 12.5 12.8 13.1 0

Ri

样本

xi
12.4
12.6 13.0 13.2 13.4 13..2 13.3 13.0 12.6 12.1 12.0

Ri
0..6
0..2 0.4 0..2 0..2 0.2 0.1 0.3 0.4 0.5 0.1

1
2 3 4 5 6 7 8 9 10 11

15
16 17 18 19 20 21 22 23 24 25

0.3 0.8 0.1 0.9 0.6 0.5 1.0 0.3 0.3

12
13 14

12.8
13.4 13.0

0.3
0.6 0.4

?
平均

318.7
12.75

9.5
0.40

某化工产品主成分含量数据表

1、收集数据;

在5MIE充分固定并标准化的情况下,从生产过 程中收集数据,每次测一个数据,共需 k≥ 25个 数据。本例,每隔24个小时从生产过程中抽取一 个样品化验,共抽取25个样品。

2、计算移动极差;

Rsi ? xi ? xi ?1
i= 2,…,k

3、计算 x 和 R

s

1 x ? ? xi ? 12.75 k i ?1
1 Rs ? k ?1

k

?R
i ?2

k

si

? 0.40

4、计算控制界限;

?UCL ? x ? 2.66 Rs ? 12.75 ? 2.66 ? 0.40 ? 13.81 ? x图?CL ? x ? 12.75 ?LCL ? x ? 2.66 R ? 12.75 ? 2.66 ? 0.40 ? 11.69 s ?
?UCL ? 3.27 Rs ? 3.27 ? 0.40 ? 1.31 ? Rs图?CL ? Rs ? 0.40 ? LCL ? 0 ?

5、制作控制图; 在方格纸上分别作出x图和Rs图,x图在上,R图在 下。Rs的下限LCL<0,故下控制界限可省略。

6、描点;
x图
13.6 13.1 12.6 12.1 11.6

UCL= 13.81 CL= 12.75

LCL= 11.69

6、描点;
Rs 图
1.4 1.2 1 0.8 0.6 0.4 0.2 0

UCL= 1.31

CL= 0.40

7、分析生产过程是否处于统计控制状态; 经分析生产过程处于统计控制状态。

P图(次品率控制图)
P图(不合格品率控制图)用于判断生产过程不 合格品率是否处于或保持在所要求的受控状 态;它虽然适用于样本大小ni不相等的情况, 但ni也不宜相差太大,否则控制图的上、下 控制限不是一条直线,而是阶梯式的。

UCL ? n p ? 3 n p 1 ? p CL ? n p

?

? ?

np p? n np p? n

LCL ? n p ? 3 n p 1 ? p

?

? ?UCL ? P ? ? ? p图?CL ? P ? ? LCL ? P ? ? ?

3 n 3 n

p (1 ? p )
np图(不合格品 数控制图)的控 制限同时除以n得 到不合格品率控 制图的控制限

p (1 ? p )

P图(不合格品率控制图)基本绘图步骤 1、收集数据;

在5MIE充分固定,并标准化的情况 下,从生产过程中收集数据。

第一步

2、计算样本中的不合格品率pi;
Pi = mi/ni


i =1,2,…,k

各样本大小ni的平均值n ?

?n
i ?1

k

i

k

样本大小ni的取值范围 / 2 ? ni ? 2n n

3、求过程平均不合格品率 p

p?

?m / ?n
i i ?1 i ?1

k

k

i

4、计算控制界限;

3 ? ?UCL ? P ? n ? ? p图?CL ? P ? 3 ? LCL ? P ? ? n ?

p (1 ? p )

p (1 ? p )

5、制作控制图;
以样本序号i为横坐标,样本不合格品率Pi为纵坐 标,作 P图如下

6、描点;
Pi (%)
3 2.5 2 1.5 1 0.5 0

UCL CL

LCL

7、分析生产过程是否处于统计控制状态

从图上可见,有一点超出上控制限,出现异 常现象,此说明生产过程处于失控状态。

不合格品率波动大,不能将此分析用控制图转 化为控制用控制图,应查明产生失控点的原因, 并制定纠正措施。

过程能力:概念
过程能力指过程处于正常状态(稳定受控状态)时, 加工产品的能力。通常以产品质量特性数据分布 的6倍标准偏差表示。
B = 6σ

设备 工艺

如设备精度的稳定性,性能的可靠性,定位装置和传动装置的准 确性,设备的冷却润滑的保护情况,动力供应的稳定程度等。 如工艺流程的安排,工序之间的衔接,工艺方法、工艺装备、 工艺参数、测量方法的选择,工序加工的指导文件,工艺卡、 操作规范、作业指导书、工序质量分析表等。

材料
操作者 环境

如材料的成分,物理性能,化学性能处理方法,配套件元器件 的质量等。
如操作人员的技术水平熟练程度,质量意识,责任心,管理程 度等。 如生产现场的温度、湿度、噪音干扰、振动、照明、室内净化、 现场污染程度等。

影响过程能力的因素

质量标准是指工序加工产品必须达到的质量要求,通常用标准、公 差、允许范围等来衡量,一般用符号T表示。
质量标准(T)与过程能力(B)之比值,称为过程能力指数,记为Cp。

T T Cp = —— = —— B 6σ

技术要求

过程能力
过程能力指数Cp值,是衡量过程能力大小的数值,过程对技术要求满 足程度的指标,过程能力指数越大,说明过程能力越能满足技术要求, 甚至有一定的能力贮备。但是不能认为过程能力指数越大,加工精度 就越高或者说技术要求越低。
进行工序能力分析的意义

计量值为双侧公差而且分布中心和标准中心重合的情况
T TL 6σ Tu

μ(M)

T T Cp = —— = —— B 6σ

T Tu-TL Cp = —— = ————— 6S 6S

T TL 6σ Tu

某零件尺寸规格为20± 0.25, 抽样100,计算

x ? 20, s ? 0.05
μ(M)

T Tu ? Tl 0.5 Cp ? ? ? ? 1.67 6S 6S 6 ? 0.05

分布中心和标准中心不重合的情况
T /2 TL
ε

T /2 Tu

T/2 - ε Cp上 = ———— 3σ
T/2 + ε Cp下 = ———— 3σ Cpk = Cp(1-K) =(T -2ε)/6 σ

M

μ

其中 K = 2ε/T 0.67

某零件的规格要求为20?0.15,抽样100件, ?0.15 他们的数据特征是 x ? 20.05, s ? 0.05, 请计算工序能力指数CPK?

例:某化工厂生产某种化工产品,为控制产品中 主要成分含量而设置质量控制点。若对主要成分 含量的要求为:12.8 ? 0.7,过程质量要求为不合 格品率不超过5%,试设计 x ? R 图
s

样本

xi
12.1
12.1 12.4 13.2 13.3 12.4 13.0 13.5 12.5 12.8 13.1 0

Ri

样本

xi
12.4
12.6 13.0 13.2 13.4 13..2 13.3 13.0 12.6 12.1 12.0

Ri
0..6
0..2 0.4 0..2 0..2 0.2 0.1 0.3 0.4 0.5 0.1

1
2 3 4 5 6 7 8 9 10 11

15
16 17 18 19 20 21 22 23 24 25

0.3 0.8 0.1 0.9 0.6 0.5 1.0 0.3 0.3

12
13 14

12.8
13.4 13.0

0.3
0.6 0.4

?
平均

318.7
12.75

9.5
0.40

某化工产品主成分含量数据表

1、收集数据;

在5MIE充分固定并标准化的情况下,从生产过 程中收集数据,每次测一个数据,共需 k≥ 25个 数据。本例,每隔24个小时从生产过程中抽取一 个样品化验,共抽取25个样品。

2、计算移动极差;

Rsi ? xi ? xi ?1
i= 2,…,k

3、计算 x 和 R

s

1 x ? ? xi ? 12.75 k i ?1
1 Rs ? k ?1

k

?R
i ?2

k

si

? 0.40

4、计算控制界限;

?UCL ? x ? 2.66 Rs ? 12.75 ? 2.66 ? 0.40 ? 13.81 ? x图?CL ? x ? 12.75 ?LCL ? x ? 2.66 R ? 12.75 ? 2.66 ? 0.40 ? 11.69 s ?
?UCL ? 3.27 Rs ? 3.27 ? 0.40 ? 1.31 ? Rs图?CL ? Rs ? 0.40 ? LCL ? 0 ?

5、制作控制图; 在方格纸上分别作出x图和Rs图,x图在上,R图在 下。Rs的下限LCL<0,故下控制界限可省略。

6、描点;
x图
13.6 13.1 12.6 12.1 11.6

UCL= 13.81 CL= 12.75

LCL= 11.69

6、描点;
Rs 图
1.4 1.2 1 0.8 0.6 0.4 0.2 0

UCL= 1.31

CL= 0.40

7、分析生产过程是否处于统计控制状态; 经分析生产过程处于统计控制状态。

8、计算过程能力指数;
1) 求Cp值

T T 1.4 Cp ? ? ? ? 0.66 6? 6 Rs / d 2 (2) 6 ? 0.40 / 1.128
式中d2(n)查控制图系数表,n = 2时,d2(n)=1.128 2) 求修正系数k

k?

? ? Tm
T /2

?

x ? Tm T /2

?

12.75 ? 12.80 0.7

? 0.07

3) 求修正后的过程能力指数Cpk

Cpk = (1- k) Cp = (1 – 0.07)×0.66= 0.61

9、过程能力指数CP与不合格品率P的关系
当分布中心与标准中心重合时,合格品率 P?Tl ? X ?T u ?:
Tu ? ?
l

P ?Tl

? X

? ?T u ? ? ?T ? ? ?

1 2?

e

t2 ? 2

dt

T ? ? Tu ? ? ? ? Tl ? ? ? ? T ? ? ? ?? ? ? ?? ? ? ?? ? ? ?? ? ? ? 2? ? ? 2? ? ? ? ? ? ? ? ? ? 3C p ? ? ? 3C p ? 1 ? 2 ? ? 3C p

? ?

?? ? ?

??

? ?

??

当分布中心与标准中心重合时,不合格品率P:

P ? 1 ? P?Tl ? X ?T u ? ? 2 ? ? 3C p

??

??

T /2

T /2 ε

TL

Tu

M

μ

当分布中心与标准中心不重合时,合格品率 P?Tl ? X ?T u ? : Tu ? ? t2 1 ?2 ? Tu ? ? ? ? Tl ? ? ? ? P?Tl ? X ?T u ? ? Tl ? ? e dt ? ?? ? ? ?? ? 2? ? ? ? ? ? ? ?

?

? Tu ? M ? ? M ? ? Tl ? M ? ? M ? ? ?? ? ? ? ? ?? ? ? ? ? ? ? ? ? ?

? ?? ? ? ? ?? ?T ?? ? T ?? ? ? ? ?? ? ? ? ?? ? ? ? ? ??? 3C p ? ?? ? ??? ? 3C p ? ?? ? ?? ? ? ? ?? ? 2? ? ? ? 2? ? ? ? ? ? ? 3C p ? 3KC p ? ? ? 3C p ? 3KC p ? ? 3C p (1 ? K ) ? ? ? 3C p (1 ? K )

??

?? ? ?

?? ? ?

?? ? ?

??

2? 2? ? K? ? ? T 6?C p 3?C p

? ? 3KC p ?

当分布中心与标准中心不重合时,不合格品率P:

P ? 1 ? P?Tl ? X ?T u ? ? 1 ? ? 3C p (1 ? K ) ? ? ? 3C p (1 ? K )

? ?

?? ? ?

??

9、用过程能力指数CP与偏移系数k求不合格品率P

C p ? 0.66

k?

12.75 ? 12.80 0.7

? 0.07

分布中心与标准中心不重合,不合格品率P:

? 1 ? ??1.84? ? ??? 2.12? ? 0.05

P ? 1 ? ? 3C p (1 ? K ) ? ? ? 3C p (1 ? K )

??

?? ? ?

??


相关文档

更多相关文档

概率统计复习
二轮复习概率与统计
统计与概率复习 课件
概率与统计复习引导
中考数学复习概率与统计
二轮复习概率与统计 (2)
概率统计复习题
第一部分专题二轮复习概率与统计
统计概率复习全市公开课
必修3概率复习
2013年数学高考总复习重点精品课件: 用样本估计总体 105张
必修三概率单元复习课件
必修3复习-统计
电脑版