《统计学》第二章 统计数据


第二章统计数据

西南财经大学《统计学》课程组

第一节
第二节

统计数据的收集——统计调查
统计数据的整理

第三节

统计数据的显示

——统计表和统计图 第四节 统计指标

西南财经大学《统计学》课程组

第一节

统计数据的收集——统计调查

一、统计调查的意义 二、统计调查的方案 三、统计调查的组织形式

西南财经大学《统计学》课程组

一、统计数据搜集的意义
(一) 定义
有组织、有计划地搜集大量统计数据的过程。 是统计工作的基础环节。 (二)与一般社会调查的主要区别。 主要着眼于数字资料的搜集; 不是搜集个别单位的资料,而是搜集大量单位 的资料并能够据以汇总计算形成说明总体的综合数

据。
西南财经大学《统计学》课程组

(三)对统计调查的要求
准确、及时、全面、系统。 准确性(真实性、客观性)——如实反映客观实际。 真实性是统计的生命。 及时性——在规定时间内尽快提供统计资料。过时 的信息有如“雨后送伞”。 全面和系统——调查方案规定调查的单位要全、项 目要全,不能遗漏。资料残缺不全,就不能正确、 系统地反映现象总体的实质和规律性。

西南财经大学《统计学》课程组

二、统计调查方案

1.确定调查目的 确定调查目的就是明确一项调查所要解决的问题。 2.确定调查对象和调查单位 调查对象是所要调查事物的全体,由许多个别单位构成, 即统计总体。 调查单位是所要调查的具体单位,是调查项目的具体承担 者,即总体单位。 调查单位要与调查的填报单位或报告单位相区别。填报单 位是向上报告调查内容、提交统计数据的单位,它可能与调 查单位一致,也可能不一致。如调查工业生产情况(目的), 所有的工业企业是总体(对象),每一个工业企业是调查单 位,同时每一个工业企业也是填报单位;而调查工业生产设 备情况,所有的工业生产设备是调查对象,每一台设备是调 查单位,每一个工业企业是填报单位。
西南财经大学《统计学》课程组

3.确定调查项目和调查表 调查项目是具体的调查内容,是调查单位具有的特征,由一系 列品质标志和数量标志构成。为了便于调查和汇总,应该把调查项 目按一定顺序排列在表格中,这就是调查表。一个调查单位填写一 份的调查表称为单一表,若干个调查单位填写一份的调查表称为一 揽表。

西南财经大学《统计学》课程组

4.确定调查组织形式和方法 全面调查和非全面调查。 5.确定调查时间 确定调查时间一是指确定标准时间,即调查资料所属 的时间,一是指确定调查工作的起止时间。对时期现象, 标准时间是一段时间,如2003年第三产业营业收入调查, 标准时间是2003年1月1日至2003年12月31日,调查工 作时间是2004年1月1日至1月31日;对时点现象,标准 时间是某一时刻,如第五次人口普查的标准时间是2000 年11月1日零点,调查工作时间是2000年11月1日至10 日。 6.确定其它事项 包括确定调查机构、培训计划、是否需要试点、经费 预算、资料报送程序和方法、数据公布时间等。

西南财经大学《统计学》课程组

三、统计调查的组织形式

? ?统计报表 ?按调查组织形式 ? ?专门调查:普查、重点 调查、典型调查、抽样 调查 ? ? ?全面调查:统计报表、普查 ? 统计调查?按调查单位的范围? ?非全面调查:重点调查 、典型调查、抽样调查 ? ? ?经常性调查:主要适合 调查时期现象 ?按调查时间是否连续 ? ? ?一次性调查:主要适合 调查时点现象 ?

西南财经大学《统计学》课程组

按范围不同划分 ? 全面调查 优点:资料齐全、能够满足各级政府领导管理需要;不 存在代表性误差。 缺点:耗费大,易产生登记性误差。 应用:搜集重要的、基础性数据。 ? 非全面调查 优点:耗费小(人财物时间),不易产生登记性误差。 缺点:存在代表性误差;不是所有层次政府领导都能够 得到其管辖范围的数据。 应用:广泛。

西南财经大学《统计学》课程组

全面调查
(一)统计报表

概念:按国家统一规定的表式、内容、报送程序、依据基层 单位的原始记录,自下而上的提供统计资料的一种制度。
优点:能确保资料的全面性和连续性;能满足及时性的要求; 能满足不同层次管理的需。 局限性:现在所有制和经济利益的多元化,统计报表不能收 集到准确的数据;统计报表层层上报,容易造成数据失真; 由于新的经济情况、问题不断出现,增加统计报表,会增 加基层的工作量。

西南财经大学《统计学》课程组

(二)普查
概念:为了了解重要的国情国力资料而专门组织的一次 性全面调查。 作用:调查内容详细、提供重要国情国力资料;提供抽样 框。 特点:必须规定标准时间、统一进行、基本内容和 指标解释统一并相对稳定。

西南财经大学《统计学》课程组

非全面调查
(三)重点调查

重点调查是在所要调查的总体中选择一部分重点单位
进行调查,用以反映总体基本情况的一种非全面调查。 (四)典型调查 典型调查是在对调查对象有一定了解的基础上,有意 识地选择少数典型单位进行的调查。

(五)抽样调查
抽样调查是以概率论和数理统计理论为基础,按照随 机原则从调查对象中抽出一部分样本单位进行调查,再用

部分单位资料推算总体数值的一种非全面调查方式。下一个
西南财经大学《统计学》课程组

三种非全面调查的比较
调查单位 的确定 目 的 与总体的关系

重点 调查 典型
调查 抽样 调查

重点单位 有意识选择

了解总体 基本情况 了解生动 具体资料

不宜推断总体 “划类选典”时, 典型单位可以推断 总体,但不能 计算和控制误差
可计算和控制抽取 部分单位误差

按随机原则

推断总体

西南财经大学《统计学》课程组

我国统计调查方法体系改革的目标模式 建立以周期性普查为基础,以经常性的抽样 调查为主体,以必要的统计报表、重点调查、综 合分析为补充,搜集、整理基本统计资料的统计

调查方法体系。

西南财经大学《统计学》课程组

四、统计数据收集的具体方法
优点 直接观察法 报告法 采访法 数据准确性较高 健全原始记录 缺点 花费人力和时间多 易发生虚报瞒报现象

(很灵活,又有具体多种方法)

西南财经大学《统计学》课程组

第三节

统计数据的整理

一、统计整理的意义和步骤 二、统计分组 三、分布数列

西南财经大学《统计学》课程组

一 、统计整理的意义
1.统计整理含义
统计整理是指根据统计研究的需要,将统计调查阶段所搜 集到的大量个体资料进行科学的分类汇总、加工处理,或对已 经经过加工的次级资料再加工,使之系统化、条理化,成为能 够反映事物总体特征的综合资料的过程。 2.内容

数据处理:分类、汇总、 表现(制表) 数据管理:输入、贮存、更新、输出
3. 步骤

审核原始资料、数据的分类汇总 数据的表现、数据保管和发布
西南财经大学《统计学》课程组

二 、统计整理的基本方法----统计分组
1. 统计分组概念和作用 1)概念---统计分组就是根据统计研究的需要,将总体中的所 有单位按照一定的标志分为若干部分。 对总体——分; 对个体——合。 突出组与组之间的差异、抽象组内各单位差异 2)作用 划分类型、反映结构比例、揭示依存关系 2.原则 科学性、完备性、互斥性 3.统计分组的种类 按分组标志的性质不同分为品质标志分组和数量标志分组。 按分组标志的多少分为简单分组和复合分组。
西南财经大学《统计学》课程组

三、 分布数列--- 统计分组整理的基本结果
(一)分布数列的概念
1.将总体各单位按某个标志分成若干组,列出各组的总体单 位数或各组单位数在总体单位数中所占的比重,这样形成的 数列称为分布数列,它表明总体单位在各组的分布状况。 2.构成要素 各组名称或变量值 (按某个标志所分的组) 次数(频数或 频率)

西南财经大学《统计学》课程组

3.分布数列的种类
(1)品质数列 按品质标志分组形成的分布数列

?组名称 要素: ? ?组次数(频数或频率)

西南财经大学《统计学》课程组

表2-1 某公司职工文化程度状况

品质 标志
? 文化程度 ? 小学 ? 初中 ? 高中 ? 大学 ? 合计 工人数 400 1500 2600 500 5000 比重(%) 8 30 52 10 100

西南财经大学《统计学》课程组

性别是品质标志

性别 男

人数(万人) 63629

比重(%) 50.98



61181

49.02

合计

124810

100.00

西南财经大学《统计学》课程组

(2)变量数列
?变量值 要素: ? ?各组次数(频数或频率)

单项式数列—一个变量值为一个组; 适合于: 离散型变量且变动范围小 组距数列—以一定区间的变量值为一个组; 适合于:离散型变量变动范围大、连续变量 等距数列 异距数列 概念:组限(开口、闭口) 组距(等距、异距) 组中值
西南财经大学《统计学》课程组

某企业日产量

日产量 是数量 标志
工人数(人)
70
100

日产量(件)
10
11

12 13
14 合计

380 150
100 800

下一个 西南财经大学《统计学》课程组

±2— 5 í ? ù ê ? ? ¨? ? ? ? ? ? ? ? ? ? 2500? ? ? ? 2500? 3000 ? 3000? 3400 ? 3400? 4000 ? 4000? 5000 ? 5000? ? ? ? ? ? ? ?

? ? ? ù ê ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ¨§? ? 32.00 88.00 160.00 272.00 152.00 44.00 748.00

西南财经大学《统计学》课程组

3.变量数列的编制

—组距数列

步骤 确定全距=最大值-最小值;(排序) 先确定组数 确定组距 确定组限 表现现象的度、规定的界限 体现分布的集中趋势 考虑到习惯、便于对比

西南财经大学《统计学》课程组

某月啤酒公司60个销售点的销量

48 41 51 39 54

71 72 53 58 57

52 81 47 43 58

53 37 66 29 63

36 43 59 46 49

41 58 52 52 40

69 68 34 38 54

58 47 60 53 29 42 73 62 59 44 49 73 29 47 16 46 80 58 51 67 61 58 66 47 50 单位:桶 excel

西南财经大学《统计学》课程组

啤酒销售量的分布数列

? 销售桶数 ? 19以下 ? 20—29 ? 30—39 ? 40—49 ? 50—59 ? 60—69 ? 70—79 ? 80以上 ? 合计

销售点数 1 3 5 16 20 9 4 2 60

频率(%) 1.7 5.0 8.3 26.7 33.3 15.0 6.7 3.3 100.0

西南财经大学《统计学》课程组

4.累计次数
销售桶数 10—19 20—29 30—39 40—49 50—59 60—69 70—79 80—89 合计 啤酒销售量的累计次数(频率)表 频数 相对频数 向上累计 向下累计 (%) 次数 频率 次数 频率 1 1.7 1 1.7 60 100 3 5 4 6.7 59 98.3 5 8.3 9 15 56 93.3 16 26.7 25 41.7 51 85 20 33.3 45 75 35 58.3 9 15 54 90 15 25 4 6.7 58 96.7 6 10 2 3.3 60 100 2 3.3 60 100 ———— ———— ———— ————
西南财经大学《统计学》课程组

某班学生考试成绩次数表
成绩(分)
60以下 60-70 70-80 80-90 90-100 合 计

学生人数
2 15 20 15 4 556

向上累计
2 17 37 52 56 ——

向下累计
56 54 39 19 4 ——

西南财经大学《统计学》课程组

将全社会从业人员按收入水平分组,从低收入到高收 入组汇总计算向上累计频率,得洛伦茨曲线。
累 计 收 入 ( %)

A
B

0

累计人数(%)

绝对平均曲线,绝对不均等曲线,实际分配曲线 20世纪初意大利经济学家基尼,根据洛伦茨曲线 找出了判断分配均等程度的指标——基尼系数:
西南财经大学《统计学》课程组

基尼系数(洛伦茨系数)= A/(A+B) ? 表示收入(或财富)的不均等程度。 ? 在0~1 之间。系数越大,表示收入分配越是趋向不均等, 洛伦茨曲线的弧度越大

? 联合国有关组织规定:
? 高度平均 比较平均 差距相对合理 差距偏大 两极分

化 0

95年

0.2

96年

0.3

97年

98年

0.4

99年

0.5

0.28

0.284

0.292

0.3

0.295
西南财经大学《统计学》课程组

5.次数分布类型和次数分布图
(1)次数分布的主要类型

钟型分布——中间多、两头少
对称分布——如正态分布 左偏分布(负偏) 右偏分布(正偏)

U型分布 J型分布

西南财经大学《统计学》课程组

对称分布

右偏分布

左偏分布

U型分布

正J型分布

反J型分布

西南财经大学《统计学》课程组

(2)次数分布图 直方图、折线图和曲线图。

西南财经大学《统计学》课程组

20 18 16 14 12 10 8 6 4 2 0 60以下 60-70 70-80 成绩(分) 80-90 90-100

学生人数(人)

图 学生成绩次数分布直方图

西南财经大学《统计学》课程组

学生人数(人)

20 15 10 5 0
60 以 下 60 - 70 70 - 80 90 - 10 0 80 - 90

成绩(分) 图 学生成绩次数分布折线图

西南财经大学《统计学》课程组

学生人数(人)

20 15 10 5 0

70

80

90 80 -

60 以 下

60 -

70 -

90 -

10 0

成绩(分)

学生成绩次数分布曲线图

西南财经大学《统计学》课程组

茎叶图(stem-leaf plot):是 Tukey(1960)提出的,将资料由小到大依序排 列,将每一观测值分成两部分,位数高的部分属 于茎(stem),其余的属于叶(leaf),可以洞悉资 料的集中与分散情形。

西南财经大学《统计学》课程组

学生成绩的茎叶图和直方图

西南财经大学《统计学》课程组

第三节

统计数据的显示

一、统计表 二、统计图

西南财经大学《统计学》课程组

(一)统计表
1.概念
把经过调查整理汇总计算得到的统计数据按一定的结构和顺序,系统 排列在一定的表格内,则形成统计表。表现经过整理的统计数据表格。

2.统计表的构成
按形式:标题——总标题、横栏标题、纵列标题 横行、纵列

数字
按内容:主词(主栏) 宾词(宾栏)

西南财经大学《统计学》课程组

2006年城乡居民家庭人均收入及恩格尔系数 家庭人均可支配收入
绝对数(元)
指数 1978=100

总标题

恩格尔系数%

?纵列标题

农村居民
?横行

2366.4
6859.6

503.8
416.3

47.7
37.9

? 数 据

标题

城镇居民

?? ?? ?
主词栏

???? ????? ? ?
宾词栏

西南财经大学《统计学》课程组

3.统计表的种类
按主词是否分组及分组标志的多少: 简单表—主词未作任何分组 分组表—主词按一个标志分组 复合表—主词按两个或两个以上标志进行层叠分组

西南财经大学《统计学》课程组

4.交叉列联表 将两个或以上的定类变量进行交叉分类,得到的频数分布 表。

西南财经大学《统计学》课程组

r × c 列联表
列 行 1 2 … c 合计

1

f 11 f 21


f12 f 22




f 1c

f1? f 2?


2



f r2


合计





r

f r1

f r2



f rc

fr?
f..

f?1

f?2

?

f?c

西南财经大学《统计学》课程组

某心理学者想了解人的社會参与度與生活满意度之关系。因此随机抽取1077位 市民,结果如下表所示,请問此心理学者如何解释此结果?社会参与度与生活满意度 有无显著关系。

社会参与 时常参加 生活满意 很满意 无意见 350 120 偶尔参加 150 102 很少参加 48 88

不满意

30

87

102

例:如何在excel中构造交叉列联表。性别和择偶首选 两个变量间的交叉列联表。 利用该数据你可以得到什么信息。利用你知道的检

验方法进行检验。
西南财经大学《统计学》课程组

西南财经大学《统计学》课程组

西南财经大学《统计学》课程组

西南财经大学《统计学》课程组

确 定

西南财经大学《统计学》课程组

点击

点击 ,改为计数

西南财经大学《统计学》课程组

5.统计表的设计规则

西南财经大学《统计学》课程组

二、统计图
1. 条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。 条形图有单 式、复式等形式, 在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频 数或频率。 绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,也称为柱形 图。

12000 10000 8000 6000 4000 2000 0 北京 天津 上海 重庆

2005 2006

2005-2006年我国直辖市地区生产总值
西南财经大学《统计学》课程组

2.轮廓图(线图)

2000年与2006年城镇居民消费支出比较
3500 3000 2500 2000 1500 1000 500 0 食 品 衣 着 家庭 设备 医疗 保健 交通 通讯 娱乐 教育 居住 杂项 商品

2000年 1958 500.5 439.3 318.1 395 627.8 500.5 258.5 2006年 3112 901.8 498.5 620.5 1147 1203 904.2 309.5

西南财经大学《统计学》课程组

3.饼图(圆形图)

2006年城镇居民消费计划结构
杂项商品和服 务 居住 4% 10%

娱乐教育文化 服务 14%

食 36%



交通通讯 13% 医疗保健 7%

衣 着 家庭设备用品 10% 及服务 6%

西南财经大学《统计学》课程组

4.环形图
甲乙两个地区消费者对空调售后服务意见

频率(%)

服务质量等级
甲地区 乙地区

好 较好 一般 较差 差 合计

10 21 36 19 14 100

11 19 33 22 15 100
西南财经大学《统计学》课程组

15% 14% 19%

11% 10% 21% 19%

22%

好 较好 一般 较差 差

36% 33%

甲乙两地消费者对空调售后服务质量评价的环形图

西南财经大学《统计学》课程组

5.雷达图
2006年全国城乡居民家庭人均消费支出构成(单位:元)

项目 食品 衣着 家庭设备用品及服务 医疗保健 交通通信 教育文化娱乐服务 居住 杂项商品与服务

城镇居民 3111.92 901.78 498.48 620.54 1147.12 1203.03 904.19 309.49

农村居民 1216.99 168.04 126.56 191.51 288.76 305.13 468.96 63.07

西南财经大学《统计学》课程组

食品 4000 杂项商品与服务 3000 2000 1000 居住 0 家庭设备用品及服务 衣着

教育文化娱乐服务 交通通信

医疗保健 城镇居民 农村居民

2006年全国城乡居民家庭人均消费支出构成雷达图
西南财经大学《统计学》课程组

10

15

20

25

30

35

0
1997年1月 1997年7月 1998年1月 1998年7月 1999年1月 1999年7月 2000年1月 2000年7月 2001年1月 2001年7月 2002年1月 2002年7月 2003年1月 2003年7月

5 人数(万人) 人数(万人)

6.线图 1997年——2003年北京外国旅游 人数月度趋势图

西南财经大学《统计学》课程组

7. 茎叶图 茎叶图(stem-leaf plot):是 Tukey(1960)提出的,将资料由小到大依序排 列,将每一观测值分成两部分,位数高的部分属 于茎(stem),其余的属于叶(leaf),可以洞悉资 料的集中与分散情形。

西南财经大学《统计学》课程组

学生成绩的茎叶图和直方图

西南财经大学《统计学》课程组

第四节 统计指标
一、总规模、总水平的描述——总量指标 二、现象的对比分析——相对指标

三、集中趋势的度量——平均指标
四、离中趋势的度量——变异指标

西南财经大学《统计学》课程组

(补充)

统计指标的含义

含义:统计指标说明现象总体的数量特征的概念和范畴。

构成:名称、指标值、计量单位、时间、地点。
指标和标志既有区别又有联系: 联系:(1)许多统计指标是由数量标志值汇总而来; (2)指标与数量标志间存在变换关系。 区别 :(1)两者说明的对象不同;

(2)两者在可量性上的表现不同。

西南财经大学《统计学》课程组

(补充) 统计指标的种类
(一)根据指标所反映的内容不同,分为: ? 数量指标(外延指标) ?反映客观现象总体规模和水平, ?说明总体的外延范围的大小或数量的多少, ?数量指标的数值大小必然会随总体范围变化而变动。 ? 质量指标——(内涵指标) ?反映客观现象总体的一般水平或相对水平, ?说明总体的数量对比关系, ?其数值大小与总体范围大小的变动没有直接关系 。

西南财经大学《统计学》课程组

统计指标的种类(续)

(二)根据指标数值的表现形式不同,分为:
? 总量指标——也称为统计绝对数 ? 相对指标——也称为统计相对数

? 平均指标 ——也称为统计平均数 ? 两种分类的关系
? 数量指标——总量指标 ? 质量指标——相对指标、平均指标

西南财经大学《统计学》课程组

统计指标的种类(续)
? (三)统计指标按性质不同,可分为: ? 正指标 ? 指标数值越大越好 ? 如企业的利税总额、劳动生产率等 ? 逆指标 ? 指标数值越小越好 ? 如产品单位成本、废品率、犯罪率等 ? 适度指标 ? 在一定范围内波动才说明现象变化处于正常状态, 过高或过低都不理想 ? 如基尼系数 在0.3—0.4之间比较合理

西南财经大学《统计学》课程组

一、 总量指标

(一)总量指标的意义
? 总量指标——也称为统计绝对数 ? 表明现象总规模或绝对水平

? 绝对数的形式表示 ? 是统计资料汇总的直接结果 ? 作用 ? 是认识社会经济现象的起点; ? 是进行管理的重要依据; ? 是计算相对指标、平均指标的基础。

西南财经大学《统计学》课程组

(二)总量指标的分类
1、按反映总体的特征(内容)分为: ? 总体总量 ?即总体单位总数 ?表示总体本身的规模大小 ? 标志总量 ?即总体各单位某一数量标志值总和。 ?表示所研究现象的总水平。 ? 总体单位总量与标志总量的区分,不是固定不变的,而 是随着研究目的和研究对象的不同而变化的。 如: 某地区工业企业职工总数是: ?总体总量——以该地区每个工业企业职工为总体单位时 ?标志总量——以该地区每个工 业 企 业 为总体单位时
西南财经大学《统计学》课程组

(二)总量指标的分类(续)
2、按反映的时间状况分 ? 时期指标——也称为流量 ?反映总体在一段时期内活动过程的总量, ?指标数值可以累计相加, ?数值大小和时间的长短有直接关系; ? 时点指标——也称为存量 ?是反映总体在某一时刻(瞬间)状况的总量 ?数值不能累计相加, ?数值的大小和时间间隔的长短没有直接关系。 ? 试判断下列指标中哪些是时期指标? ?在校学生人数、招生人数、毕业生人数、出生人数、 死亡人数、迁移人数、从业人数、失业人数
西南财经大学《统计学》课程组

(二)总量指标的分类(续)
3、按计量单位不同分为: ? 实物(量)指标 ? 计量单位为实物单位——指以事物的自然属性和特点进行计量 的单位,包括: ? 自然单位:如人、只、台、件…,是长期习惯使用形成, 用于离散型数据。 ? 度量衡单位: kg、cm、…,用于连续型数据 。 ? 标准实物单位:按某一标准(含量、规格等)折算后的实物 单位,用于将用途相同、但规格或含量不同的物品数量汇总。 如粮食、能源(标准吨)等; ? 复合单位: 吨公里、人公里、人次数、工日… ? 特点——使用价值明确;综合性能差,不同使用价值的实物量不 能直接汇总。 ? 用途——反映主要物资的生产和消耗、主要产品的供需平衡、特别 是无法估价的土地面积和自然资源数量等 。
西南财经大学《统计学》课程组

(二)总量指标的分类(续)
? 价值量指标 ? 是用货币单位(如人民币元,对外贸易中使用英 镑、美元、欧元等)计量。 ?特点: ?具有较强的综合性和概括能力, ?内容抽象,而且要受价格波动的影响。 ?用途:表明经济活动的总成果、总规模,广泛用于 经济效益的考核和评价等。 ? 劳动量指标 ?是用劳动时间单位来计量的,如工时、工日、人年 等。 ?劳动量指标可作为确定劳动定额、评价劳动时间利 用程度、计算劳动生产率的依据。但一般限于同一 企业内部使用。
西南财经大学《统计学》课程组



相对指标

(一)相对指标的意义
? 1、概念
? 两个有联系的指标对比的比率 ? 其指标数值的表现形式为相对数 ? 有两种表现形式 ?无名数——百分比、千分比、倍数、系数、成数等 ?名数——分子与分母的计量单位构成的复名数

西南财经大学《统计学》课程组

? 意义:

?揭示了现象之间的数量联系和对比关系, ?使一些不能直接对比的现象找到共同的比较基础。 例如:有两个企业的利润总额为: 甲:50万元 乙:5000万元 与资金投入对比——资金利润率 与上期数对比——发展速度 与计划数对比——计划完成程度

西南财经大学《统计学》课程组

(二)相对指标的种类
对比标准不同,相对指标所说明问题也就不同。

? 1.结构相对数(又称比重)

总体中某一部分的数值 结构相对数 ? ? 100 % 总体的数值 ?反映社会经济现象的内部结构以及分布状况
?如:恩格尔系数
? 绝对贫困 勉强度日 59% 小康 50% 富裕 40% 最富裕 30%

?城市化程度=城市人口数 / 总人口数 ?货币化程度=用货币支付的商品和劳务总量 / 全部商品和劳务总量
西南财经大学《统计学》课程组

国内生产总值构成与从业人员构成

年份

国内生产总值( 亿元)

国内生产总值构成(%)

第一产 业

第二产 业

第三产 业

年底从 业人员( 万人) 67947 68850 69600 69957 70586 71150 73025 73740 74432

从业人员构成(%)

第一产 业
52.5 50.5 49.9 49.8 50.1 50.0 50.0 50.0 49.9

第二产 业
23.0 23.5 23.7 23.5 23.0 22.5 21.2 21.4 21.6

第三产 业
24.8 26.0 26.4 26.7 26.9 27.5 28.8 28.6 29.3

1995 1996 1997 1998 1999 2000 2001 2002 2003

58478.1 67884.6 74462.6 78345.2 82067.5 89468.1 97314.8 104790.6 114326.5

20.5 20.4 19.1 18.6 17.6 16.4 15.2 15.4 14.5

48.8 49.5 50.0 49.3 49.4 50.2 51.1 51.5 52.7

30.7 30.1 30.9 32.1 33.0 33.4 33.6 33.5 32.8

西南财经大学《统计学》课程组

2.比例相对数——比例(结构性的比例)

总体中某一部分的数值 比例相对数 ? ? 100% 总体中另一部分的数值
?反映总体内部的比例关系,揭示总体不同部分之间 的发展变化的协调平衡状况。 ?如:某地区农轻重比例:20%:50%:30% ? 消费与积累的比例 ? 两种商品价格之比——比价
?分子分母可互换
西南财经大学《统计学》课程组

我国城乡居民收入差距逐步扩大
年度
农村/城市

1990年
1:2.2

1995年
1:2.71

2000年
1:2.79

2001年
1:2.9

西南财经大学《统计学》课程组

?3、比较相对数

甲空间某类现象的数值 比较相对数 ? ? 100% 乙空间同类现象的数值
?相同时间不同空间同类现象数值的对比, ?说明不同空间的经济势力强弱和工作优劣等。 ?分子分母可互换
中美比较(《中国统计年鉴》1999年) 平均预期寿命 (岁) 76 谷物产量 (万吨) 34970 公共教育经费 占GNP比(%) 5.4

美国

中国
美国与中国之比 (倍或%)

71
1.07(倍) (107%)

45625
0.766( 倍 (76.6%) )

2.5
2.16( 倍 (216%) )

西南财经大学《统计学》课程组

? 4、动态相对数
报告期水平 动态相对数 ? ?100% 基期水平

?反映现象发展变化的相对程度(即发展速度)。
年份 国内生产总 值 110.5 109.6 第一产业 105.0 105.1 第二产业 113.9 112.1 第三产业 108.4 107.9 人均国内生 产总值 109.3 108.4

1995 1996

1997
1998 1999

108.8
107.8 107.1

103.5
103.5 102.8

110.5
108.9 108.1

109.1
108.3 107.7

107.7
106.8 106.2

2000
2001 2002

108.0
107.3 108.0

102.4
102.8 102.9

109.4
108.7 109.8

108.1
107.4 107.5

107.1
106.7 107.2
西南财经大学《统计学》课程组

2003

109.1

102.5

112.5

106.7

110.3

5、强度相对数

某一现象的数值 强度相对数 ? 另一有联系现象的数值
反映现象的强度,如:人均GDP、人均粮食产量… 反映现象的密度和普遍程度。如:人口密度、每万 人拥有医院病床数(医生数)、人均绿地面积等 反映经济效益,如资金利润率。 其它如: 外贸依存度=对外贸易总额/GDP 保险密度=保费/人口数 金融相关度(率)=金融资产总量/GNP

西南财经大学《统计学》课程组

按某地人口平均的主要工业产量指标
年 份 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 布(米)
16.6 15.8 15.9 19.6 17.7 21.6 17.2 20.2 19.4 19.9


(公斤)


(公斤)

5.1 5.6 7.0 6.5 5.0 4.6 5.2 5.7 6.6 6.9

58.4 61.7 69.5 76.0 77.7 79.2 82.3 88.6 93.1 99.1

原煤 (吨) 1.0 0.9 1.0 1.0 1.0 1.1 1.2 1.1 1.0 0.8

原油 (公斤) 122 123 122 123 123 125 129 131 130 128

发电量
(千瓦小时)

547 589 647 712 779 836 888 923 939 989

西南财经大学《统计学》课程组

强度相对数的特点

强度相对数是惟一有单位(且为复名数)的相对数 (有的也用无名数形式); 分子分母一般可以互换,故有正指标与逆指标之分。

强度相对数常带有“平均”字样,但不是平均 数(含义不同)。

西南财经大学《统计学》课程组

?

6、计划完成相对数(计划完成百分比)

反映计划任务的完成程度。

计划完成相对数 实际完成数 ? ? 100% 计划任务数
西南财经大学《统计学》课程组

例1、 某地上年国内生产总值为500亿元, 计划为550亿元,实际为560亿元。该地计划完 成程度如何?
计划完成百分比= 560/550*100%=101.8%

101.8%的经济意义,超额完成计划 1.8%

西南财经大学《统计学》课程组

例2、某地上年国内生产总值为500亿元,今年计划 国内生产总值比上年增长10%,实际增长12%。

500 ? (1 ? 12%) 560 ? ? 101.8% 计划完成百分比= 500 ? (1 ? 10%) 550
?
同理,若表示为:计划当年比上年增加50亿元,实际增 加了60亿元。 计划完成% =(500+60)/(500+50)*100%=101.8% 注意:百分比与百分点的区别。

1 ? 12% ? ? 100 % 1 ? 10%

这里的超额完成1.8%,也可以说超额完成2个百分点。
西南财经大学《统计学》课程组

例3、某企业计划把单位成本降低3%,实
际降低2%。该企业是否完成了单位成本降低 计划?

1 ? 2% ? 101.03% 计划完成百分比 ? 1 ? 3%
1 ? 实际增(减)率 ? ? 100 % 1 ? 计划增(减)率
西南财经大学《统计学》课程组

超额完成计划百分比? 在分析计划完成情况时,要注意计划任务数的 性质差异。 ?若计划数是以下限规定的(越大越好的指 标——正指标),其计划完成相对数大于 100%为超额完成计划,如产值、利润等; ?若计划数是以上限规定的(越小越好的指 标——逆指标),其计划完成相对数小于 100%为超额完成计划,如产品成本、原材 料消耗量等。
西南财经大学《统计学》课程组

相对指标的种类小结
根据研究的目的不同、对比的基础不同,分为:

? ? 比例相对数——反映现象内部比例关系 ? 比较相对数——评价不同单位的实力、优劣 强度相对数——反映现象强度、密度和普遍程度 ? 动态相对数——反映现象发展变化的状态 ? 计划完成相对数——检查计划完成程度 ?

结构相对数——反映现象的结构和分布

西南财经大学《统计学》课程组

(三)计算和应用相对指标应注意的问题
1 正确选择基础

2 确保可比性
3 相对数与绝对数结合运用 4 多种相对数综合运用

西南财经大学《统计学》课程组

三、平均指标(平均数)
概念
平均指标反映同类现象的一般水平,是总体内各 单位参差不齐的标志值的代表值,也是对变量分 布集中趋势的测定。 数据集中区

变量x

x
西南财经大学《统计学》课程组

三 、平均指标
? (一)平均指标的意义 ? 平均指标 ——也称为统计平均数

? 反映某一现象的一般水平
? 反映现象分布的集中趋势(代表数据分布中心) ? 统计推断的基础指标 ? 按所平均数据的时间状况不同,分为 ? 静态平均数 ? 同一时间不同单位的数据的平均 ? 反映现象总体在一定历史条件下的一般水平 ? 动态平均数 ? 不同时间同一总体的数据的平均 ? 反映现象在发展阶段上的一般水平

西南财经大学《统计学》课程组

(二)平均指标的计算

1 算术平均数
(1)基本公式

总体标志总量 算术平均数 ? x ? 总体单位总量
例: ? 平均工资=工资总额/职工人数 平均成本=总成本/产量

西南财经大学《统计学》课程组

(2)简单算术平均数——未分组时

5名学生的考试成绩分别为(分): 70、80、80、85、85, 他们的平均成绩是多少? (70+80+80+85+85)/5=80(分)

x1 ? x2 ? ? ? xn ?x x? ? n n
西南财经大学《统计学》课程组

(3)加权算术平均数 ——当数据已分组,形成了变量数列:

成绩 x

人数 f

平均成绩=(70+80+85)/3 ? 平均成绩=所有人的成绩总
和/总人数

70 80 85

1 2 2

=(70+80*2+85*2)/5=80

合计

5
西南财经大学《统计学》课程组

工人日产量(件) 10 11 12 13 14

工人人数(人) 工人人数比重(%) 70 150 380 150 100 8.75 12.50 47.50 18.725 12.50





800

100.00

西南财经大学《统计学》课程组

工人平均量 ?

错误的计算:10 ? 11 ? 12 ? 13 ? 14

5

60 ? ? 12 (件) 5

不符合基本公式,不是5个工人,而是800个工人; 工人人总产量不是60件,而是9710件 所以,应该这样计算:
10 ??? ?? ? 11 ??? ?? ? 12 ? ??? ? 13 ??? ?? ? 14 ??? ?? 10 11 12 12 13 14 ?? 10???? ?? 11???? ??? ? ?? ?? 13???? ?? 14????
70 100 380 150 100

西南财经大学《统计学》课程组

加权平均数

x1 f1 ? x2 f 2 ? ? ? xn f n ?xf x? ? f1 ? f 2 ? ? ? f n ?f 9710 ? ? 12.1375 800
(件)

西南财经大学《统计学》课程组

权数(权重) ——权衡轻重(影响)作用的数(变量)。

权数的两种形式——绝对数(次数)f;
——相对数(比重)

x1 f1 ? x2 f 2 ? ? ? xn f n ?xf x? ? f1 ? f 2 ? ? ? f n ?f
f1 fn f x ? x1 ? ? ? xn ? ?x ?f ?f ?f
西南财经大学《统计学》课程组

? 比重权数更能够直接体现权数的实质:
成绩 x
70 80 85

人数
f1 1 2 2 f2 10 20 20 F3 10 40 50

合计

5

50

100

?权数的确定方法——主观赋权,客观赋权
西南财经大学《统计学》课程组

按成绩分组(分)

学生人数(人)

60以下 60—70 70—80 80—90 90—100
合计

2 15 19 15 3
54

西南财经大学《统计学》课程组

根据组距数列计算总平均数的方法 ——加权算术平均

?X——各组的组中值(代表组平均水平) ?假定条件:组内均匀分布或对称分布 ?一般地,计算结果是近似值。

x1 f1 ? x2 f 2 ? ? ? xn f n ?xf 4070 x? ? ? ? 75.37 (分) f1 ? f 2 ? ? ? f n ?f 54

西南财经大学《统计学》课程组

某企业职工按月工资分组
月工资 500以下 500-600 600-700 700-800 800-900 900-1000 1000-1100 1100以上 合计 组中值 450 550 650 750 850 950 1050 1150 ------

x

职工人数 208 314 382 456 305 237 78 20 2000

f

xf
93600 172700 248300 342000 259250 225150 81900 23000 1445900

x1 f1 ? x2 f 2 ? ? ? xn f n ?xf 1445900 x? ? ? ? 722 .95元 f1 ? f 2 ? ? ? f n ?f 2000
西南财经大学《统计学》课程组

(4) 算术平均数的特点和数学性质 特点:

算术平均数受变量值和变量值出现次数的 共同影响; 算术平均数靠近出现次数最多的变量值; 算术平均数受极端变量值的影响;

西南财经大学《统计学》课程组

数学性质: 变量值与算术平均数的离差和为零。
? (x ?
? ( xi
n n

x) ? 0

? (x ?

x) f ? 0

i ?1

? x)
n i ?1

? ? xi ? ? x
i ?1 n

? ? xi ? nx
i ?1

? ? xi ? ? xi ? 0
i ?1 i ?1
西南财经大学《统计学》课程组

n

n

? (x

? x ) ? ( x ? c)
证明:设
x0 ? x ? c ? 0
? (x ?

?变量值与算术平均数的离差平方和最小 2 2 2 2 ?
? (x

? x ) f ? ? ( x ? c) f

x0 ) 2 ? ? [( x ? ( x ? c)]2 ? ? [( x ? x) ? c)]2

? ? ( x ? x) 2 ? 2c ? ( x ? x) ? nc 2 ? ? ( x ? x) 2 ? nc 2

?c ? 0

? x? (

? nc 2 ? 0
x0 ) 2 ? ? x ? x) 2 (
西南财经大学《统计学》课程组

? (x ?

x) 2 ? min

某供销社分三批收购某种农副产品,其收购单价及 各批收购额如下

批次 1 2 3 合计

单价(元)x 2.40 2.25 2.15 ——

收购额 xf 6000 12000 2150 20150
西南财经大学《统计学》课程组

收购额 ? xf x? ? 收购量 ? f ?xf ? 1 ? xf
x

6000 ? 12000 ? 2150 ? 6000 / 2.40 ? 12000 / 2.25 ? 2150 / 2.15 20150 ? 2500 ? 5333.33 ? 1000 20150 ? ? 2.28元 8833.33
西南财经大学《统计学》课程组

2、调和平均数(倒数平均数)
常作为加权算术平均数的变形公式使用。仍是总体的标志总量 与总体单位总量的对比,仅仅是因为资料的不同,需要将算术平均 数变形。 当缺乏分子数据时,采用算术平均数; 当缺乏分母数据时,采用调和平均数。

西南财经大学《统计学》课程组

工人日产量(件) x 10 11 12 13 14 合计

工人日总产量(件) xf 700 1100 4560 1950 1400 9710

西南财经大学《统计学》课程组

? xf x? 1 ? x xf

700 ? 1100 ? 4560 ? 1950 ? 1400 ? 700 1100 4560 1950 1400 ? ? ? ? 10 11 12 13 14

9710 ? ? 12.1375(件) 800

西南财经大学《统计学》课程组

(1)选择加权算术平均法还是调和平均法,应该根据基本公式确 定。

(2)相对数的算术平均数
各组相对数的平均=总体的相对数 符合相对数本身公式——将分子视为总体标志总量,分母视 为总体单位总量, 确定用加权算术平均法还是调和平均法。

西南财经大学《统计学》课程组

某公司下属18个企业,计划完成相对数如下
产值计划完成程 度(%)

组中值 (%) x 85 95 105 115 ——

企业数 (个) 2 3 10 3 18

计划产值 (万元)f 800 2500 17200 4400 24900

实际产值 (万元) xf 680 2375 18060 5060 26175

80—90 90—100 100—110 110—120 合计

西南财经大学《统计学》课程组

实际完成产值 x? 计划产值

?xf 0.85 ? 800 ? 0.95 ? 2500 ? 1.05 ?17200 ? 1.15 ? 4400 ? ? ?f 800 ? 2500 ? 17200 ? 4400
26175 ? ? 105.12% 24900

西南财经大学《统计学》课程组

某公司下属18个企业,计划完成相对数如下:
产值计划 完成程度 (%) 80-90 组中值 (%) x 85 企业数 (个) 2 实际 产值 xf 680
计划产 值 1

x 800

xf

90-100
100-110 110-120

95
105 115

3
10 3

2375
18060 5060

2500
17200 4400

合计

——

18

26175

24900
西南财经大学《统计学》课程组

平均计划完成百分比:
?xf 实际完成产值 ? x? 1 计划产值 ? xf x 26175 ? ? 105 .12 % 24900

西南财经大学《统计学》课程组

3、几何平均数 例 某企业生产某种产品要经过三道工序,各工 序的合格品率分别为95%、96%和98%。 该产品三道工序的平均合格品率为多少?

x ? ?
3

n

x1 ? x2 ? xn

0.95 ? 0.96 ? 0.98

? 0.9632
西南财经大学《统计学》课程组

三道工序的平均合格品率为96.32%.

思考:三道工序的平均废品率为多少?
平均废品率=1 - 平均合格率

西南财经大学《统计学》课程组

几何平均数通常用在总量等于各分量乘积的

情形。比如,求某些平均比率,平均发展速度等。

西南财经大学《统计学》课程组

例1 某流水生产线有前后衔接的五道工序。某日各工 序产品的不合格率分别为5%、8%、10%、15% 、 20%,整个流水线产品合格率?

x ? ? ?.?? ? ?.?? ? ?.?? ? ?.?? ? ?.?? ? ??.??%

西南财经大学《统计学》课程组

例2 某金融机够以复利方式计息。近12年来的年 利率有4年为3%、 2年为5% 、 2年为8%、3年 为10%、 1年为15%。则12年的平均年利率?
x?

?? ? ? ? ? ? ????

?.??? ??.??? ??.??? ??.??? ??.?? ? ???.??%

平均年利率=106.82%-100%=6.82%

西南财经大学《统计学》课程组

2008年成都市劳动力市场工资指导价位(元/人年) 职业类别 高级管理人员 工资价位 低位数 中位数 高位数 国有企业 19144 56405 186916 其它经济类型 13244 38744 146254

专业技术人员

低位数
中位数 高位数

12645
32220 94716 11313 21429 76817 9234

10088
23560 72387 8219 16800 48733 7368

办事人员

低位数 中位数 高位数

商业服务人员

低位数

中位数
高位数 生产人员 低位数 中位数 高位数

17515
67929 9265 21521 73739

13598
44163 7656 15000 37293 西南财经大学《统计学》课程组

2008年成都市劳动力市场工资指导价位(按学历分组元/人年)

工资价位 1.低位数 2.中位数 3.高位数

博士及 以上 27913 60192 268591

硕士 19205 50160 262038

本科 12275 36588 132500

大专 10307 25488 89141

高中中 专 技 校 8384 18000 57004

初中及 以下 7396 14398 42602

西南财经大学《统计学》课程组

4.中位数(Median)
中位数是根据变量值的位置来确定的平均数。将变

量值按大小顺序排序,处于中间位置的变量值(或数据)
即中位数,用me表示。由于中位数是位置代表值,所以 不会受极端值的影响,具有较高的稳健性。

50%
Me

50%

西南财经大学《统计学》课程组

中位数位置的确定

n ?1 未分组数据: 中位数位置= 2
n 组距数列数据:中位数位置 ? 2

西南财经大学《统计学》课程组

未分组数据的中位数

? X ? N ?1 ? ? ?? 2 ?? ? Me ? ? 1? ? ? ?XN ? XN ? ?1 ?2 ? 2 ? 2 ?

当N为奇数时 当N为偶数时

西南财经大学《统计学》课程组

? 原始数据: 24 22 21 26 20 ? 排 序: 20 21 22 24 26 ? 位 置: 1 2 3 4 5

?
n ?1 5 ?1 中位数位置 ? ? ?3 2 2

中位数 ? 22

西南财经大学《统计学》课程组

原始数据: 排 序: 位 置:

10 5 9 12 5 6 8 9 1 2 3 4

6 8 10 12 5 6

?
6 ?1 中位数位置 ? ? 3.5 2 8?9 中位数 ? ? 8.5 2
西南财经大学《统计学》课程组

5.众数(Mode)
众数是指总体中出现次数最多或频率最大的变量
值(数据),用 Mo 表示。 众数也是一种位置平均数,且也不受极端值的影 响。

西南财经大学《统计学》课程组

?

集中趋势的测度值之一

?
?

出现次数最多的变量值
不受极端值的影响

?

可能没有众数或有几个众数

西南财经大学《统计学》课程组

众数(众数的不唯一性)

条件——总体单位多;分布有集中趋势
?无众数 原始数据:

10

5

9

12

6

8

一个众数 原始数据:

6

5

9

8

5

5

多于一个众数 原始数据: 25 28 28 36 42 42

西南财经大学《统计学》课程组

(三)众数、中位数和算术平均数的比较
1.算术平均数综合反映了全部数据的信息,众数和中位数由数

据分布的特定位置所确定。

2.算术平均数和中位数在任何一组数据中都存在而且具有惟一性, 但计算和应用众数有两个前提条件

3.算术平均数只能用于定量(数值型)数据,中位数适用于定序 数据和定量数据,众数适用于所有形式(类型、计量层次) 的数据

西南财经大学《统计学》课程组

4.算术平均数要受数据中极端值的影响。而众数和 中位数都不受极端值的影响。
为了排除极端值的干扰,可计算切尾均值, 即去掉数据中最大和最小的若干项数值后计算 的均值.

切尾均值是将均值与中位数取长补短的结果。
5. 算术平均数可以推算总体的有关总量指标,而中 位数和众数则不宜用作此类推算。

西南财经大学《统计学》课程组

中位数、众数和平均数的关系: 中位数、众数和平均数之间的数量关系决 定于总体内次数分配的状况。 对称钟形分布情形下:
x ? me ? mo

非对称左偏分布情形下:x ? me ? mo

非对称右偏分布情形下: x ? m ? m e o

西南财经大学《统计学》课程组

众数、中位数和均值的关系

均值 中位数 众数

均值 = 中位数 = 众数

众数 中位数 均值

左偏分布

对称种型分布

右偏分布

西南财经大学《统计学》课程组

不论左偏还是右偏,在偏斜适度(微偏)的情

况下,偏还是右偏,则有如下的经验公式:

1 me ? x ? ( mo ? x ) 3
3(平均数-中位数)=( 平均数-众数)

西南财经大学《统计学》课程组

四、变异指标
变异指标的概念 变异指标的种类 变异系数

西南财经大学《统计学》课程组

(一)变异指标的概念
某车间有两个生产小组,某周5天的产量如下:

甲:171,172,172,172,173(件) 乙:220,190,170,150,130(件) ? 两组的平均日产量均为172件。 ? 平均日产量172件的代表性甲组比乙组好。
西南财经大学《统计学》课程组

变异指标
?反映总体单位变量值的离中趋势(或差异程度 ,均衡性、稳定性) ?衡量平均数的代表性。

?

变异指标越大,平均数代表性越小;

? 变异指标越小,平均数代表性越大。

西南财经大学《统计学》课程组

集中趋势(Central tendency)——平均指标

一组数据向其中心值靠拢的倾向和程度,测度集中趋

势就是寻找数据一般水平的代表值或中心值,不同类 型的数据用不同的集中趋势测度值。
选用哪一个测度值来反映数据的集中趋势,要根据所掌 握的数据的类型来确定离中趋势(差异程度)——变异指标

西南财经大学《统计学》课程组

(二)变异指标的种类 1、全距(极差Range): R=最大值— 最小值 2、平均差(Average Deviation) 变量值与平均数的离差绝对值的平均数

? x?x A.D ? ?f

f

? x?x A.D ?
n
西南财经大学《统计学》课程组

3、方差Variance和标准差S.D
测度标志变异最重要,最常用的指标。

标准差=方差的平方根。
方差——变量值与平均数的离差平方的平均数。
? ?x ? x ? ? ? n
2 2

?
2

2

?? x ? x ? ? ?f

2

f

??

? ?x ? x ? n

? ?

?? x ? x ? ?f

2

f

西南财经大学《统计学》课程组

成绩(分) 学生人数 55 2 -20.37 829.8738 65 15 -10.37 1613.0535 75 19 -0.37 2.6011 85 15 9.63 1391.0535 85 3 19.63 1156.0107 54 —— 4992.5926 合计 ?xf (分) x ? ? 75.37 ?f ?( x ? x ) 2 f 4992.5926 2 ? ? ? ? 92.4554 ?f 54
? ?
?( x ? x ) 2 f ? 9.62 (分) ?f
西南财经大学《统计学》课程组

x?x

( x ? x )2 f

4、方差和标准差具有以下数学性质 (1) 若每一个变量值加上一个常数,方差和标准差

不变。设a为任意常数, yi ? xi ? a
则有:


2 ? y ? ? x2

?y ??x

(2)若每一个变量值均扩大一个常数倍,方差是

常数项的平方倍,标准差同比例变化。设a为任意常
数,

yi ? axi

? y2 ? a 2? x2

? y ? a? x
西南财经大学《统计学》课程组

(3) 分组条件下,总方差可以分解成组内方差的平
均数? 2 和组间方差 ? 2 两部分,即:
? 2 ?? 2 ?? 2

其中

? ?
2

? fi i ?1
?
m 2 i i ?1

? 2 ? i ?1

? ( xi

m

? x) 2 fi
m

?

m

fi
? i2 ?

? fi i ?1
j ?1

xi ?

j ?1

?

fi

xij

?

fi

( xij ? xi ) 2 fi

fi

i ? 1,2,3,?, m

西南财经大学《统计学》课程组

某工厂实行早、中、晚三班工作制。工厂管理部 门想了解不同班次工人劳动效率是否存在明显的差异。 每个班次随机抽出了7个工人,得工人的劳动效率 (件/班)资料如表。计算总方差、组内方差和组间 方差。 早班 中班 晚班 34 49 39 37 47 40 35 51 42 33 48 39 33 50 41 35 51 42 36 51 40
西南财经大学《统计学》课程组

总平均劳动效率为:

y?( ?

k ni

i ?1 j ? i

?

yij ) / n

34 ? 37 ? ? ? 42 ? 40 ? ? 41.571 21

西南财经大学《统计学》课程组

三个班次工人的平均劳动效率分别为:
y1 ? 34.714 y2 ? 49.571
y3 ? 40.429

总方差
? {(34 ? 41.571)/ 2 ? (37 ? 41.571)2 ? ? ? (40 ? 41.571)2 }/ 21 ( y ? y ) 21
??
i ?1 j ?1 k ni 2 ij

? 825.1429 / 21 ? 39.29

组间方差
? n ( y ? y)
i ?1 i i k 2

/ 21

? ?7 ? (34.714 ? 41.571) 2 ? 7 ? (49.571 ? 41.571) 2 ? 7 ? (40.429 ? 41.571)2 ? / 21 ? 34.44

西南财经大学《统计学》课程组

?? ( y
i ?1 j ?1

k

ni

ij

? yi ) 2 / 21

? [(34 ? 34.714)2 ? ? ? (36 ? 34.714)2

? (49 ? 41.571) 2 ? ? ? (51 ? 41.571) 2
?(39 ? 40.429)2 ? ? ? (40 ? 40.429) 2 ] / 21 ? 38.857 / 21 ? 1.85

西南财经大学《统计学》课程组

例:

一家公司在招收职员时,首先要通过两项能 力测试。在A项测试中,其平均分数是100分,标 准差是15分;在B项测试中,其平均分数是400分, 标准差是50分。一位应试者在A项测试中得了115 分,在B项测试中得了425分。与平均分数相比, 该位应试者哪一项测试更为理想?

西南财经大学《统计学》课程组

标准化值
在对多个具有不同量纲的指标进行处理时,常常需要 对各指标数值进行标准化处理。标准化值也给出了一组数 据中各数值的相对位置。

zi ?

xi ? x

?

如某一数据的标准化值为-1.5,则表明 该值低于均值1.5倍的标准差。 对于一组数据,大约有68%的数据在1 个标准差内,有95%的数据在两个标准 差内,有99%的数据在3个标准差内。

上例:ZA=1,ZB=0.5,A项测试标准化值高于B项,故A项 测试比较理想。
西南财经大学《统计学》课程组

(4)离散系数 (变异系数)

一群牛的平均体重是180公斤,标准差是18公
斤;一群羊的平均体重是15公斤,标准差是3公

斤,能不能说羊的平均体重的代表性高些?为什
么?

西南财经大学《统计学》课程组

? 有两组学生成绩为: 60 65 70 75 80 X=70 66 68 70 72 74 X=70 二组学生的平均成绩的代表性是否一致?

西南财经大学《统计学》课程组

全距、平均差、方差和标准差有计量单位, 是标志变异的绝对指标。 而且指标的大小不仅 取决于变量值的差异程度,还取决于变量值水

平的高低。因而,对于具有不同水平的数列,
或不同量纲的数列,都不能直接用全距、平均

差、方差和标准差来比较平均数代表性的大小。
只能用相对形式——变异系数——进行比较。
西南财经大学《统计学》课程组

变异系数包括:

全距系数v R
平均差系数

R ? x
A.D ? x

v AD

标准差系数v? ?

?

x
西南财经大学《统计学》课程组

变异系数适合于:
? 比较不同标志的变异程度 ? 当同一个标志在多个总体具有不同的平均水平时,要评价 和比较哪个总体的平均水平具有较好的 代表性时。 ? 前例:

西南财经大学《统计学》课程组

(四)计算和应用平均指标 应注意的问题

? 同质性
? 与分组结合 ? 与变异指标结合

西南财经大学《统计学》课程组

在许多大奖赛中,对评委的打分采用了去掉 一个最高分,去掉一个最低分,然后计算歌手算 术平均分数”的记分方法。这很类似四分位数和算 术平均数相结合的方法,为避免个别评委的极值 打分,影响歌手最后得分的代表性和公平性起到 了很好的作用,不失为一种灵活运用统计平均数 的尝试。

西南财经大学《统计学》课程组

四、结论
平均指标在分析和评价社会经济现象,制定统计决策 以及日常生活中有着不可替代的重要作用。谨慎正确地使 用平均指标不仅仅是一个学术问题,而且是一个重大的实 践问题,尤其是应用平均指标对某种具体的现象进行评价 和制定分配原则时更应小心谨慎。

西南财经大学《统计学》课程组

世说新语(《青年文摘》2004年2期P33)
13亿,是一个很大的数字,如果你用乘法来算,一个很小 的问题,乘以13亿,都会变成一个大问题。如果你用除法的话, 一个很大的总量,除以13亿,都会变成一个小的数目。这是许 多外国人不容易理解的。 ——温家宝总理接受《华盛顿邮报》总编采访时说

西南财经大学《统计学》课程组

思考题
? 一项关于大学生体重状况的研究分析,男生30人的平均体 重为60公斤,标准差为5公斤;女生20人的平均体重为 50公斤,标准差为5公斤。请回答下面的问题: ? (1)男生的体重差异大还是女生的体重差异大?为什么? ? (2)求体重的平均数和标准差。

西南财经大学《统计学》课程组

综合5数:最大值,75%的分位数,中位数,25%的
分位数,最小值。 说明数据分布的离散程度。

西南财经大学《统计学》课程组

【例6】EXCEL数据“汽车传动”

Metropolitan Research有限公司是一家消费者研 究组织,它设计调查,对消费者所使用的大量的产品和服 务进行评估。在某一项研究中,Metropolitan调查消费 者对底特律某一个主要制造商所生产的汽车的性能的满意 程度。分发给该制造商所生产的一种最大型号小汽车用户 的调查表表明,许多人抱怨该车刚开始传动系统不佳。为 了更好地了解传动系统的问题,Metropolitan采用由底 特律地区一个修理企业所提供的实际传动系统的维修记录 为样本。

西南财经大学《统计学》课程组

管理报告 (1)用适当的描述统计量汇总传动系统数据。 (2)求曾经出现过传动系统问题的汽车总体中在出现传动 系统问题时所行驶里程的均值的95%置信区间,并对该 区间估计做出管理上的解释。

西南财经大学《统计学》课程组

平均 标准误差

73342.3 3521.221473

我们可以看出可 靠性汽车传动装置出 问题的时间差异是 很大的。生产过程的 质量不稳定。

中位数
众数 标准差 方差 峰度 偏度 区域 最小值 最大值 求和 观测数 #N/A

72705

24898.79582 619950033.2 0.166992025 0.25986483 113048 25066 138114 3667115 50

最大(1)
最小(1) 置信度(95.0%)

138114
25066 7076.159344

西南财经大学《统计学》课程组

求其综合5数的方法

综合5数

西南财经大学《统计学》课程组


相关文档

更多相关文档

统计学 第二章统计数据的描述
统计学第2章统计数据的描述
第2章统计数据的描述统计学第三版
统计学第二章、统计数据及其来源(二)
统计学第二章、统计数据及其来源(一)
统计学 第2章 统计数据收集
统计学 第二章 统计数据的搜集
统计学 第2章 统计数据的搜集
第二章 统计数据的描述(统计学)
统计学第二章统计数据的搜集1
《统计学》第二章 统计数据的搜集、整理(1)
《统计学》第二章 统计数据的搜集、整理
《统计学》第二章统计调查与整理
《统计学》课程PPT第二章 统计调查与整理
《统计学》第二章
电脑版