第一章
绪论
统计学:是指人们对客观事物的数量表现、数量关系和数量变化进行描绘和分析的计量活动;简言之,是指对客观事物的数量方面进行核算和
分析。
总体:指在某种共性基础上由许多个别事件所组成的整体。
总体单位:构成总体的个别事物。总体和总体单位都是客观存在的食物,是统计学研究的客体。 无限总体:总体单位无限多的总体。
有限总体:总体单位数有限而可数的的总体。
标志:说明总体单位特征的名称。可分为数量标志和品质标志。
变异:总体单位之间品质和数量的差异,即可变标志在在总体各单位之间所表现出来的差异。 数量标志:凡反映总体单位数量特征,需要用数字回答的标志。
品质标志:凡反映总体单位属性(品质)特征,只能用文字来回答问题的标志。可分为不变标志和可变标志。 不变标志:所有总体单位都共同具有的特征。 可变标志:在总体各单位之间必然存在差异的标志。 变量:可变的数量标志。
指标:说明总体数量特征的概念。
第二章 统计调查
统计调查误差:指调查所得的统计数字与调查对象的实际数量之间的差异,即调查所得的数量大于或小于调查对象的实际数量之差。
普查:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查。其特点是涉及面广、工作量大、时间性强、耗费较多、组织
工作复杂。
重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非全面调查。
典型抽样:根据对调查对象的初步了解,有意识地从中挑选有代表性的单位进行研究的一种非全面调查。
第三章 统计整理
统计整理:是根据统计研究的目的的要求对统计调查所取得的各项资料进行科学的分组和汇总的工作过程。 统计分组:根据社会现象的特点和统计研究的目的的要求,按照某种重要标志把总体分成若干部分的科学分类。 全距:总体中的最大标志值与最小标志值之差。
重合式:相邻两组中,前一组的上限与后一组的下限数值相重。
不重合式:前一组的上限与后一组的下限,两值紧密相连而又不相重复。
统计资料汇总:在统计分组的基础萨哈那个,将统计资料归并到各组中去,并计算各组和总体的合计数的工作过程。 集中汇总:把统计调查资料集中在组织调查的最高机关或由它指定的机构进行汇总。 逐级汇总:按照一定的统计管理系统,由各级机构自下而上地逐级将调查资料汇总上报。 会审汇编:把下级统计工作人员集中到上级机关,共同审核和汇总统计资料。
综合汇总:对各级都需要的基本资料实行逐级汇总,对调查所得的其他资料则进行集中汇总。 分布数列:反映总体单位在各组的分布状况的一系列数字。
第四章 总量指标和相对指标
统计表:集中而有序地显示统计资料的表格。结构由标题、横行与总行、数字资料三部分组成。
总量指标:是反映社会经济现象在一定时间.地点条件下所达到的总规模.总水平或工作总量的综合指标,又叫绝对指标。 总体总量:即总体单位数,由每个总体单位加总而得到的. 时期指标:反映社会经济现象总体一段时期内发展过程的总量。 实物指标:指采用实物单位计量的总量指标。 价值指标:指采用货币单位计量的总量指标。 劳动量指标:劳动时间为单位计量的总量指标。 时点指标:表明社会经济现象总体在某一时点的总量。
无名数::是一种抽象化的数值.通常表示为成数,系数,倍数,百分数,千分数等.对比双方为同类事物,性质、形态、计量单位相同 有名数::指有具体内容的计量单位的数值.它有单名数和复名数之分.对比双方非同类事物,不存在可比性
第五章 平均指标
平均指标:即平均数,是同质总体某一数量标志在一定时间、地点条件下所达到的一般水平,是总体的代表值。 算术平均数:指总体各单位标志值的总和除以总体单位总数得到的平均数值。 交替标志:又称是非标志,它是一个只有两种答案的标志。 调和平均数:又称倒数平均数,是变量倒数的算术平均数的倒数 几何平均数:n个变量连乘积的n次根。
众数:指变量数列中出现次数最多或频率最大的变量值。
中位数:将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的那个数值就是中位数。
第六章 变异度指标
变异度指标:又称标志变动度指标,是综合反映总体各单位标志值及其分布的差异程度的指标。 全距:总体各单位标志值中最大值与最小值之差,又称极差。
第七章 抽样调查
类型抽样 :又称为分层抽样或分类抽样,是指对总体各单位先按主要标志加以分类,然后再从各类中按随机原则抽选一定单位构成样本的抽样
组织方式。
等距抽样 :又称机械抽样或系统抽样,是将总体全部单位按某一标志排列,而后按固定顺序和间隔来抽选样本单位的抽样组织形式。
第八章 假设检验
假设检验:是利用样本的实际统计量,去检验事先对总体某些数量特征所作的假设是否可信,进而为决策取舍提供依据的一种统计分析方法。 原假设和备选假设(了解):原假设又称虚无假设或零假设,一般用
H0表示,常常是根据已有的资料,或经过周密考虑后确定的;备选假设
又称择一假设,即原假设被否定之后而采取的逻辑对立的假设。
显著性水平(了解):在进行假设检验时应该事先规定一个小概率的标准,作为判断的界限,这个小概率标准称为显著性水平。
第九章 相关与回归
相关关系:现象之间数量上不确定、不严格的依存关系。这种依存关系的特点是:某一现象在数量上发生变化会影响另一现象的变化,而且这
种变化在数量上有一定的随机性。
第十章 时间数列分析指标
时间数列:亦称为动态数列或时间序列,将表明社会现象在不同时间发展变化的某种指标数值,按时间先后顺序排列而成的数列。 绝对时间数列:指由一系列同类的总量指标数值所构成的时间数列。
时期数列:由反映某种经济现象在一段时间内发展过程累计量的总量指标所构成的绝对数时间数列。 时点数列:由反映某种现象在一定时点上的发展状况的总量指标所构成的绝对数时间数列 平均数时间数列:由一系列同类的平均数指标数值所构成的时间数列。 平均发展水平:指将不同时间的发展水平加以平均而得到的平均数。
第十一章 时间数列预测方法
移动平均法:指根据时间数列资料,逐项递推移动,依次计算包含一定项数的扩大时距平均数,形成一个新的时间数列,反应长期趋势并进行
外推预测的方法。
指数平滑法:一种特殊的加权平均法。它是利用本期实际观察值和本期趋势预测值,分别给予不同权数进行加权,求得一个指数平滑值,作为
下一期趋势预测值的预测方法。
第十二章 统计指数
指数:(1)广义:是指反映社会经济现象变动与差异程度的相对数,如产值指数、产量指数、出口额指数、出口价格指数、出口购买力指数、
贸易条件指数等。(2)狭义:它虽然也反映事物变动或差异的程度,但所反映的对象是一种特殊的总体,如产品的总产量、市场上流通商品的价格总水平等。
指数体系:是指在经济意义上和数量上相互联系的一系列指数。如物量指数。物价指数与物值指数就是相互联系的一个指数体系。在这个体系
中,当一个指数以基期的质量指标为同度量因素时,另一个指数就应以报告期的数量指标为同度量因素,这样才能保持指数体系的平衡。
指数数列:是指由同一指数的一系列数值所组成的数列,用于反映事物在较长一段时间内连续变化的情况。
居民消费价格指数:是指反映一定时期居民生活消费所必须的商品与服务项目价格变动情况的指标。
二.简答题与相关知识点
第一章 绪论
1、 统计科学的学派有哪些?
答:统计科学的学派有:记述学派、政治算术学派、图表学派、数理学派、社会学派,而今天的统计学已形成一门统一的学科。 2、统计学有哪些特点?最基本的特点是什么? 答:一、统计的特点:数量性、具体性、综合性
其中,统计学最基本的特点是以数字为语言,用数字说话。 3、 统计学的研究对象是什么?它是基本理论和方法有哪些? 答:统计学以客观事物的数量方面作为研究对象、
统计学作为研究统计工作规律的科学,它既要研究统计调查、统计整理和统计分析的一般规律,又要结合各个部门的业务实践来研究各个部门统计工作的具体规律。具体内容包括:一、统计调查。包括调查统计的意义和原则、种类、方法、方案、统计调查误差及防止方法。 二、统计整理。包括统计整理的意义和程序、审核、分组、汇总、分布数列和统计图表。三、统计分析。描述和分析客观事物的数量表现、关系和变化。
4、 标志有哪几类?
答:标志按照不同的分法可分为:数量标志和品质标志、不变标志和可变标志。 5、 标志和指标的区别和联系。
答:(1)指标和标志的区别有两个:一个是指标用于说明总体,标志则用于说明总体单位。二是指标只说明总体的数量特征,所有指标都要用数字表示,但标志却说明总体单位的品质特征和数量特征;品质标志用文字表示,数量特征才用数字回答问题。(2)联系:主要表现为许多指标的数值是由总体各单位某种数量标志的标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按照品质标志分组计算出来的。此外,由于一个客体是作为总体还是作为总体单位可随统计研究任务的变换而变换,故指标和数量标志亦可在一定条件下转化
第二章 统计调查
1、什么是统计调查,其基本原则是什么?
答:统计调查是指根据统计研究的目的,有组织有计划地搜集统计资料的过程。
准确性原则——要实事求是,如实反映情况 及时性原则——要及时反映,及时预报 完整性原则——要数字与情况相结合 2、统计调查的组织形式有哪些?
答:统计调查的组织形式有(1)普查,(2)抽样调查,。抽样调查包括随机抽样调查和非随机抽样调查,其中,非随机抽样调查又包括重点抽样、典型抽样、任意抽样、配额抽样。(3)定期统计报表。 3、收集统计的方法有哪些?各有什么特点?
答:收集统计资料的方法有直接观察法、报告法、采访法、通讯法、实验调查法和网上调查法等。 4、调查误差有几种情况及产生的原因?
答:统计调查误差有两种情况:一种是由于调查工作中的失误所造成的误差,叫工作误差;另一种是以部分推断总体时必然存在的误差,叫代表性误差。
产生误差的原因有以下几个方面:
(1)因调查方案规定不妥而产生的设计误差
(2)因调查过程中记录不准和转抄有误而产生的登记误差
(3)因计量器不准、计量单位折算和数据汇总有误而产生的计算误差 (4) 因被调查者故意弄虚作假而产生的立意误差
5.什么是调查对象、调查单位和报告单位?报告单位和调查单位有什么不同?
答:调查对象即总体,调查单位即总体单位。报告单位又叫填报单位,按照调查方案的要求负责向上级报送调查结果的单位。
报告单位和调查单位的区别在于:报告单位是调查资料的报送者,只能是向上级报送调查结果的机构和人;调查单位则是调查项目的承担者,既可以是某种机构和人,还可以是某种物。所以,报告单位和调查单位两者,有时是一致的。
第三章 统计整理
1、统计整理的程序有哪些?
答:统计整理的过程包括对统计资料的审核、分组、汇总、值表与绘图几个环节,需要按照一定的步骤进行: (1)对搜集到的资料进行全面审核
(2)根据研究的目的要求和统计分析的需要,选择整理的指标并进行划类分组(3)在分组基础上,将各项资料进行汇总,得出反映分组和总体数量特征指标(4)通过绘制统计图表,将整理的资料简洁明了、系统有序、形象的表现出来 2、什么是统计整理,它分几个步骤?
答:统计整理是指根据研究的目的要求,对统计调查所取得的各种资料进行科学的分组和汇总的工作过程。通过统计整理,要得出能说明总体特征的综合数字资料,为统计分析提供基础和前提条件。 统计整理的步骤有:
(1) 对调查资料进行全面审核和订正
(2) 根据研究目的的要求和统计分析的需要,选择分组标志和整理指标,进行具体分组。 (3) 对各种资料进行汇总,计算出反映各组和总体的各种指标。 (4) 编制统计表,表述整理的结果。 3、统计分组有哪些种类?
(1)按分组的作用或目的不同分为:类型分组、结构分组和分析分组 (2)按分组标志多少,分为:简单分组、复合分组和并列分组 (3)按分组标志的性质分为品质分组和数量分组
第五章 平均指标
1.平均指标有什么特点?
答:平均指标特点:1. 同质性,即总体内各单位的性质是相同的,如果各单位性质上存在着差异,就不能计算平均数。2. 抽象性,即总体内各同质单位虽然存在数量差异,但在计算平均数时并不考虑这种差异,即把这种差异平均掉了。3. 代表性,即尽管各总体单位的标志值大小不一,但我们可以用平均数这一指标值来代表总体一般水平。 2.算术平均数、中位数、众数的关系: (一)对称分布情况下
(二)偏态分布情况下 右偏分布
左偏分布
(三)三者近似关系
第六章 变异度指标 1.偏态系数SK公式为:
pSK越大,则偏斜程度越大。 p2.偏态系数为:
–
– –
偏态系数=0为对称分布
xMeM0M0MexxMeM0M0x3(xMe)SKpxM0偏态系数> 0为右偏分布 偏态系数< 0为左偏分布
m335峰度的测定方法 =3 标准正态曲线
3 平顶峰曲线,离散程度大 3 尖顶峰曲线,离散程度小 1.8 U形曲线 1.8 一条水平线 3.常用的几种次数分布类型 偏度和峰度指标值 m442m2m4曲线类型 偏度0 峰度 3 左偏平顶曲线 3 左偏尖顶曲线 偏度0 峰度 3 3 右偏平顶曲线 右偏尖顶曲线 偏度=0 峰度 =3 3 3 正态曲线 平顶曲线 尖顶曲线 (第七章无)
第八章 假设检验
1.假设检验的思路与程序:
A建立假设。(首先提出原假设,记为H0,设立原假设的目的在于检验中要确立予以拒绝或接受的假设。原假设总是假定总体没有显著性差异,所有差异都是由随机原因引起的,所以这种假设又称无效假设。其次提出备选假设,记为H1,如果原假设被拒绝则等于接受了备选假设,所以备选假设也就是原假设的对立事件。)
B 决定检验的显著性水平。(在原假设成立的条件下,由被检验的统计量分布求出相应的临界值,该临界值即为原假设的拒绝域和接受域的分界线。)
C 确定检验统计量,并依据样本信息计算检验统计量的实际值。
D 将实际求得的检验统计量取值与临界值进行比较,作出拒绝或接受原假设的决策。(如果样本统计量取值超过临界值,说明原假设落入拒绝域中,我们就选择拒绝接受原假设;若样本统计量的取值小于临界值,原假设落入接受域中,我们就不能拒绝原假设,而必须接受原假设或作进一步的检验。)
2.两类错误分析(判断两类错误):(1)原假设是真实的,而作出接受原假设的判断,这是正确的决定;(2)原假设是不真实的,而作出了拒绝接受原假设的判断,这是正确的决定;(3)原假设是真实的,而作出拒绝原假设的判断,这是犯了第一类型的错误;(4)原假设是不真实的,而作出了接受原假设的判断,这是犯了第二类型的错误。
接受 正确的决定(1) 拒绝 第一类型错误() H0真实 H1不真实 第二类型错误() 正确的决定(1) 第八章 相关与回归
1.相关分析与回归分析的区别与联系:(1)区别是:相关分析研究的都是随机变量,并且不分自变量与因变量;回归分析研究的变量要定出自变量与因变量,并且自变量是确定的普通变量,因变量是随机变量。(2)联系是:它们是研究现象之间相互依存关系的两个不可分割的方面。在实际工作中,一般先进行定性的相关分析。然后计算相关系数,拟合适当的回归方程,进行显著性检验;最终用回归方程进行推算或预测。 2.相关分析与回归分析的步骤 (1)进行相关关系的定性分析 (2)确定回归方程
(3)计算相关系数或相关指数,对回归方程进行显著性检验。 (4)利用回归方程式进行推算和预测 (5)对推算和预测作出置信区间估计
第九章 时间数列和分析指标
1、 时间数列由哪些基本要素构成?
答:时间数列由两个基本要素构成:一个是资料所属的实践,另一个是在一定时间条件下的统计指标数值。 2、 编制时间数列的原则是什么?
答:编制时间数列的目的,在于通过数列找你个各项指标值对比,说明社会经济现象的发展过程和规律性。编制原则如下:
(1)时间长短应该可比 (2)总体范围大小应该一致 (3)指标的经济内容应该相同
(4)指标的计算方法和计量单位应该一致
第十一章 时间数列预测方法
1.时间数列的因素分析:长期趋势 、季节变动、 循环变动 、不规则变动 (第十二章无)
三、作业题
第五单元
11.某企业工人日产量的分组资料如下表: 日产量(千克) 20以下 20-30 30-40 40-50 50及以上 合计 15 25 35 45 55 --- 组中值 工人数(人) 4月份 20 35 30 10 5 100 5月份 10 20 25 30 15 100
试根据表中资料分别计算4月份和5月份工人日产量的算术平均数、中位数和众数,并分析工人平均日产量变化的原因,说明两个月次数分布的特点。
答:(1)根据表中资料计算算术平均数如上表(绿色部分)
总产量(千克) 4月份 300 875 1050 450 275 2950 5月份 15 500 875 1350 825 3700 X4Xi15i155iffi295029.5(千克)100
X5Xi15i1ff370037.0(千克)100从计算结果得知,5月份比4月份平均每人日产量多7.5千克,其原因是不同日产量水平的工人所占比重发生变化。4月份日产量在30千克以上的工人只占工人总数的45%,5月份这部分工人所占比重则上升为75%。这体现了权数对内平均数的影响。
(2)
4月份众数:M0L13520*i20*1027.5(千克)
12(3520)(3530)13025*i40*1042.5(千克)
12(3025)(3015)5月份众数:M0 (3)
Lfi1月份中位数:MeL52Sm1fm*i205020*1028.57(千克) 35fi15月份中位数:MeL2Sm1fm*i305030*1038(千克) 25从以上计算可以看出,该企业的、工人日产量的分布状况是,4月份日产量呈右偏分布,5月份日产量呈左偏分布。
12.某地甲、乙两个农贸市场蔬菜价格及销售额资料如下:
品种 单价(元/千克) 甲市场 A B C 2.00 2.20 2.60 2200 10 520 销售额(元) 乙市场 800 1320 2600 试根据表中资料计算,哪个市场蔬菜平均价格高?并说明原因。 答:销售量同理得:B甲m2200800:A甲1100;A乙400 x22700;B乙600;C甲200;C乙1000;合计甲2000;合计乙2000
x甲m2200105202.13(元/千克) m2000xx乙m800132026002.36(元/千克) m2000x由计算结果可知,乙市场蔬菜平均价格高。
原因:乙市场中单价较高的C品种所占的比重比甲市场C品种所占的比重大,所以乙市场的平均价格比甲市场的高。
第六单元
11、 甲品种 田地面积(公顷) f 1.2 1.1 1.0 0.9 0.8 合计:5.0 乙品种 田地面积(公顷) 总产量(吨) 单产(吨) 离差 离差平方 离差平方x次数 xf 18.00 15.68 16.50 12.15 12.60 74.93 x 15.00 14.25 16.50 13.50 15.75 14.99 总产量(吨) 单产(吨) 离差 离差平方 离差平方x次数 xx 0.01 -0.74 1.51 -1.49 0.76 — (xx)2 0.0001 0.76 2.2801 2.2201 0.5776 — (xx)2f 0.00012 0.60236 2.28010 1.99809 0.46208 5.34275 f 1.5 19.50 1.3 1.0 0.9 合计:6.0 xf 25.20 15.68 17.55 18.12 9.45 .82 x 16.80 15.00 13.50 18.12 10.50 14.97 2xx 1.8300 0.0300 -1.4700 3.1500 -4.4700 — (xx)2 3.34 0.0009 2.1609 9.9225 19.9809 — (xx)2f 5.02335 0.00117 2.80917 9.92250 17.98281 35.73900 标准差:甲(xx)ff(xx)f25.34275 1.0337(件)5.0
乙f甲35.73900 2.4406(件)6.0标准差系数:Vx1.03370.069
14.992.44060.1630
14.97 V乙x由上表及计算结果可知,甲品种的单产略高于乙品种,标准差和标准差系数又都比乙品种小,说明了甲品种收获量具有较大的稳定性,有推广价值。 14、
Xxff152.5*4157.5*12162.5*18167.5*28172.5*22177.5*10182.5*2167.5
100组中值x 按身高分组(厘米) 150-155 155-160 160-165 165-170 170-175 175-80 180-185 185-190 合计 人数(人) yx167.05 5-3 -2 -1 0 1 2 3 4 — yf-12 -24 -18 0 22 20 12 8 8 y2f36 48 18 0 22 40 36 32 232 y3f-108 -96 -18 0 22 80 108 128 116 y4f3324 192 18 0 22 160 324 512 1552 4 12 18 28 22 10 4 2 100 152.5 157.5 162.5 167.5 172.5 177.5 182.5 187.5 — 计算原点的k阶动差:
M1yff80.08 100M2yffyffyff2322.32 100M31161.16 100M4155215.52 100利用原点的k阶动差推算y的k阶中心动差:
m1(y)0
m2(y)M2M122.314
m3(y)M33M2M12M130.616
m4(y)M44M3M16M2M123M1415.238
利用y的k阶中心动差推算x的k阶中心动差:
m2(x)b2m2(y)522.31457.85 m3(x)b3m3(y)530.61677 m4(x)b4m4(y)15.529523.75
m3(x)m2(x)37757.8530.1750
m4(x)9523.752.8463 22m2(x)57.85根据上述计算,可见该厂职工身高的分布曲线是呈正偏,而且是平顶峰曲线。
第七单元
32、某灯管厂生产10万日光灯管,现采用简单随机不重复抽样方式抽取千分之一进行质量检验,测试结果如下。根据上述资料: (1)试计算抽样总体灯管的平均耐用时间。
(2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。
(3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并在95%的概率保证程度下,估计10万只灯管的合格率区间范围。
(4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验?
耐用时间(小时) 灯管数(只)fi 组中值xi xifi 7500 12750 xi-x -220 -120 (xix)2fi 484000 216000 800以下 800-900 10 15 750 850 900-1000 1000-1100 1100以上 合计
35 25 15 100 950 1050 1150 — 33250 26250 17250 97000 -20 80 180 — 14000 150000 486000 1360000 解:(1)样本平均数:xxfi1nniifi197000970100ixi-xfi1360000^2(2)样本方差:i1n13600100fii1抽样平均误差:xn2^^^2n13600110.00111.66nN100
抽样极限误差:tx3*11.6634.98x区间范围:Xx97034.98x即在99.73%的概率保证度下,该批灯管平均耐用的时间在935.02%~1004.98%小时之间。四.例题
第四章 总量指标和相对指标
(例1)
某公司2000年计划销售某种产品30万件,实际销售32万件。则该公司该年销售计划完成相对数是多少?
解:该公司2000年销售计划完成相对数=32/30=106.7%,超额6.7%完成计划。 考点:计划完成相对数=(实际完成数÷同期计划数)×100%
(例2)某企业某种产品的产值计划要求增长10%,该种产品的单位成本计划要求下降5%,而实际产值增长了15%,实际单位成本下降了3%,则计划完成程度指标分别是多少?
解:产值计划完成相对数=115%÷110%=104.55%
单位成本计划完成相对数=(100%-3%)÷(100%-5%)=102.11%
〔例3〕某企业要求劳动生产率达到5000元∕人,某种产品的计划单位成本为100元,该企业实际的劳动生产率达到6000元∕人,某种产品的实际单位成本为80元,它们的计划完成程度指标分别是多少? 解::劳动生产率计划完成相对数=6000÷5000=120%(正指标) 单位成本计划完成相对数=80÷100=80%(逆指标) 考点:计划完成相对数=(实际平均水平÷计划平均水平)×100% 计划完成相对数=〔实际完成数(%)÷计划完成数(%)〕×100%
说明:如果计划规定的任务是提高率,结果要等于或大于100%才算超额完成任务;如果计划规定的任务是降低率,结果等于或小于100%才
算超额完成任务。
例4〕某种产品按五年计划规定,最后一年产量应达200万吨,计划执行情况如下:
问:1.计算该产品计划完成程度 2.计算提前完成计划的时间 解:1.产量计划完成程度=(53+58+65+72)÷200=124%
2.从第四年第三季度至第五年第二季度产量之和:42+49+53+58=202(万吨)
提前完成计划时间=(60-)+2÷[(58-38)÷90]=6个月零9天 考点:用水平法来计算中长期(一年以上)计划完成相对数
计划完成相对数=(计划期末年实际达到的水平÷计划中规定的末年水平)×100%
提前完成计划的时间=(计划期月数-实际完成月数)+超额完成计划数÷(达标月(季)日均产量-上年同月(季)日均产量) 说明:水平法适用条件:若计划指标是按整个计划期的末年应达到的水平来规定的 [例5] 某市某五年计划规定整个计划期间基建投资总额达到500亿元,实际执行情况如下: 时间 第 1 年 第 2 年 第 第 第 5 年 一季度 二季度 三季度 四季度 5 年 合 计 3年 4年 时间 产量 110 122 第一年 第二年 66 第三年上半年 74 第三年下半年 37 第四年一季度 38 第四年二季度 42 第四年三季度 49 第四年四季度 53 第五年一季度 58 第五年二季度 65 第五年三季度 72 第五年四季度 775 年合计 5 投资额 140 135 70 80 40 22 18 20 525 问:该市5年基建投资额计划完成相对数和提前完成时间? 解:计划完成相对数=525÷500=105%
从第一年的第一季度起至第5年的第三季度投资额之和505亿元,比计划数500亿多5亿元,则:提前完成计划时间=(60-57)+5÷[500
(365 × 5)]=3个月零18天
考点:用累计法来计算中长期(一年以上)计划完成相对数
计划完成相对数=(计划期间累计完成数÷同期计划规定的累计数)×100%
提前完成计划时间=(计划期月数-实际完成月数)+超额完成计划数÷平均每日计划数 说明:累计法适用于计划指标是按整个计划期内累计完成量来规定的;
[例6]某公司2000年计划完成商品销售额1500万元,1-9月止累计完成1125万元。则1-9月计划执行进度是多少? 解:1-9月计划执行进度=(1125÷1500)×100%=75%
考点:计划执行进度=(计划期内某月止累计完成数÷本期计划数)×100%
第五章 平均指标
例1 水果甲级每元1公斤,乙级每元1.5公斤,丙级每元2公斤。问:
(1)若各买1公斤,平均每元可买多少公斤? (2)各买6.5公斤,平均每元可买多少公斤?
(3)甲级3公斤,乙级2公斤,丙级1公斤,平均每元可买几公斤? (4)甲乙丙三级各买1元,每元可买几公斤? 解:(1)Hn1n331.38(公斤/元)
1112.166711.52 (2)
Hf1xff1xfn6.56.56.519.51.38(公斤/元)
1116.56.56.514.083311.5232161.24(公斤/元)
1113214.8311.52 (3)
H (4)
xx11.521.5 (公斤/元)3H11xnn1x(简单平均式)
考点:调和平均数的计算方法
H11xfff1xf(加权平均式)
例2 自行车赛时速:甲30公里,乙28公里,丙20公里,全程200公里,问三人平均时速是多少?若甲乙丙三人各骑车2小时,平均时速是
多少?
解:Hf1xf20020020060025.2(公里/小时)
11120020020023.81302820x
xff30228220215626(公里/小时)
2226例3 假定某地储蓄年利率(按复利计算):5%持续1.5年,3%持续2.5年,2.2%持续1年。请问此5年内该地平均储蓄年利率。
解:该地平均储蓄年利率G1.52.511.051.51.032.51.0221100% 51.183935100%103.43%1.几何平均数GX1•X2••Xnnn考点:几何平均数
Xi1nin
ff2.加权几何平均数Gx1f1•x2f2••xnfni1
xi1nifi例4 现检测某厂生产的一批电子产品的耐用时间,得到资料如下表所示: 耐用时间 600以下 600-800 800-1000 1000-1200 1200-1400 1400以上 产品个数(个) 84 161 244 157 36 18 合计 中位数为:
700
f700Sm1245MeL2i=800+2200=886.07(小时)fm244或者f700Sm121122MeUi=1000-200=886.07(小时)fm244众数为:
或者 183M0=Li=800200=7.65(小时)128387 187MoUi=1000200=7.65(小时)128387考点:中位数和众数的计算方法:
中位数:
(上限公式)MoU(下限公式)MoLff12iUi(ff1)(ff1)12 ff11iL+i(ff1)(ff1)12f以上累法:MeU众数:
2Sm1fmi
f以下累法:MeL2Sm1fmi第六章 变异度指标
(例1)甲车间300工人,日产量资料如表所示: 日产量(件) 工人数组中值x (人) 50以下 50-60 60-70 70-80 80-90 90-100 100-110 110以上 合计 求偏态系数
11 13 70 120 50 30 5 1 300 45 55 65 75 85 95 105 115 xf495 715 (xx)2f9900 5200 7000 0 5000 12000 4500 1600 45200 4550 9000 4250 2850 525 115 22500 xxf2250075(件)f300=xx2ff4520012.27(件)300M0L解:
1(12070)i701074.17(件)12(12070)(12050)SKpxM07574.170.0712.27
考点:偏态系数的计算方法:
SKpxM0
说明:表明甲车间日产量的分布右偏,偏斜程度为0.07。其偏态系数较小,说明工人日产量的众数接均数水平。 例2
日产量(件) 工人数组中值x (人) 50以下 50-60 60-70 70-80 80-90 90-100 100-110 110以上 合计 求偏态系数
11 13 70 120 50 30 5 1 300 45 55 65 75 85 95 105 115 3xx (xx)f495 715 4550 9000 4250 2850 525 115 22500 9900 5200 7000 0 5000 12000 4500 1600 45200 x75(件)解:
(12.27)31847.2818000m360f300m360偏度系数0.0321847.28
xxf3考点:用动差法来计算偏态系数:
=说明:
m33m3m22
(m2)常采用三阶中心动差作为测定偏度的依据,当0时,表明分布数列是对称分布; 当0时,表明分布数列是正向偏态;当<0时,表明分布数列是负向偏态。
第七章 抽样检查
(例1)设一个盒子里装有编号为①②③的三个球,若按重复与不重复方式、考虑顺序与不考虑顺序方法从中随机抽出两个球,问有多少种组合方式?其样本可能数目各为多少?
解:共有4种组合形式。已知N=3,n=2,则:
(1) 考虑顺序的不重复抽样数目为:nANN!3!6(种可能)(Nn)!(32)!
(2) 考虑顺序的重复抽样数目为:nBNNn329(种可能)(3) 不考虑顺序的不重复抽样数目为:nCNN!3!3(种可能)n!(Nn)!2!(32)!(4) 不考虑顺序的重复抽样数目为:(Nn1)!(321)!nnDNCN6(种可能)n1n!(N1)!2!(31)!(例2)某外贸公司出口5万包小包装名茶,与外商签订的合同规定每包茶叶的平均重量不能低于150克,现采用简单随机不重复方式抽取千分之二进行检验,检验结果如下表所示: 每包茶叶重量(克) 包数 组中值xi xifi xix (xx)2fi 152.10 .15 0.50 88.20 84.05 379.00 148以下 148~150 150~152 152~1 1以上 合计
10 15 50 20 5 100 147 149 151 153 155 — 1470 2235 7550 3060 775 15090 -3.9 -1.9 0.1 2.1 4.1 — 根据上述资料,在95.45%的概率保证度下:(1)试估计该批茶叶的平均重量;(2)试推断该批茶叶是否符合合同规定的要求;(3)试推断该批茶叶总重量区间范围;(4)试推断抽样估计的精确度。解:
(1)样本平均数:xxfi1nniifi115090150.90100i即估计该批茶叶的平均重量为150.90克。xi-xfi379.00^2(2)样本方差:i1n3.79100fii1抽样平均误差:xn2^^^2n3.79(克)10.0020.19451nN100
抽样极限误差:tx2*0.19450.30x区间范围:Xx150.900.30x即在95.45%的概率保证度下,该批茶叶的平均重量在150.51~151.29克之间。因为最低重量都超过150克,所以符合合同规定的要求。~(3)总体总值估计:(x)NX(x)N,即(150.51~151.29克)50000,xx或者在7.5255~7.55吨之间。0.30'(4)抽样误差系数:x0.0026x150.9x抽样估计精度为:A1'10.002699.74%xx
(例3)在例2中,其他条件不变,只是抽极限误差可放宽到1克,在95.45%的概率保证度下,做下一次抽样检验,需抽多少包茶叶?
解:nNt2x2^2^2Nt250000223.79758000 15.1616(包)250000123.7950015.16(例4) 在例2中的外商于数月后再次向该外贸公司进口小包装名茶,仍执行原先每包茶叶平均重量不能低于150克的合同。该次从5万包茶叶中随机抽取16包,测得每包重量分别为151、150、149、1、152、148、151、151、150、153、150、151、150、149、150、150克。根据上述资料,在95%的概率保证程度下,试推断该批茶叶是否符合合同规定的要求,与上次相比,质量是否稳定?解:该题为n30的抽样检验2490150.56(克)n16即估计该批茶叶的平均重量为150.56克。样本平均数:xi1n
xi
(例5)某县有产粮耕地6500公顷,按平原、丘陵和山区面积等比例抽样819平方米进行实割实测,计算结果如下表所示。 按地势分组 全部面积(公顷) 抽样面积(米2) 抽样平均(千克/米产量标准差(千克/样本中高产田的比2) 符号 Ni ni xi 0.70 0.55 0.40 — 米2) 重 i 0.15 0.25 0.23 — pi 0.8 0.5 0.3 — 平原 丘陵 山区 合计
4000 1500 1000 6500 504 1 126 819 根据上述资料,在95.45%的概率保证程度下(1)试估计该县粮食平均每平方米产量的区间范围;(2)试推断该县粮食总产量的区间范围。
解:(1)抽样平均数xxnii1kkini1ki1k0.705040.5510.401260.6192(千克/米2)819
i2i12iinn0.1525040.25210.2321260.038192i抽样平均误差:x^n0.0381911(千克/米2)0.0067nN81965000000^抽样极限误差:tx20.00670.0134(千克/米2)x区间估计:Xx0.61920.0134(千克/米2)x即在95.45%的概率保证度下,该县粮食平均每平方米产量的区间范围为:0.6058~0.6326千克。(2)全县粮食总产量的区间范围为:XxNx0.61920.013465000000米2,即在95.45%的概率保证度下,全县粮食总产量的区间范围为:39377~41119吨。
(例6)在例5中,已知该县有产粮耕地6500公顷,现确定按平原、丘陵和山区面积共抽819平方米进行实割实测,试分别采用平均法、比例法、适度法和最优法分配样本量,并分别计算其平均每平方米产量、抽样平均误差和总费用
~
解:(1)平均法n1n2n3n1819273k3平均产量:xxinii1kkni10.702730.552730.402730.5500(千克/米2)819
i2i1ki1k2iinin20.152730.252730.232730.2100819222抽样平均误差:n0.2100819(千克/米2)110.0160nN81965000000总费用:Cc1n1c2n2c3n310273202733027316380(元)x^(2)比例法n1nN1Ni1k819i40005046500n2N2Ni1k819i 150016500n3N3Ni1k819i10001266500(3)适度法n1nN11Nii1k819i40000.1560081940840000.1515000.2510000.231205n2nN22Nii1k 15000.25375819819250000.1515000.2510000.231205in3nN33Nii1k819i10000.23230819150000.1515000.2510000.231205(4)最优法n1nN11C1ik819Nii1Ci40000.15/1040000.15/1015000.25/1010000.23/101.7492315.6NC215000.25/10n2nk2281940000.15/1015000.25/2010000.23/30NiiCi 819i1118.6218315.6NC310000.23/30n3nk3381940000.15/1015000.25/2010000.23/30NiiCi 819i1 819
42.0109315.6
(例7)某城市社会经济调查队欲对该市30万户居民(96万人口)的生活消费水平进行抽样调查,采用按街区每隔1000户抽取1户的等距抽样方法,共调查了300户。其居民家庭人均消费支出额数据如下表所示: 人均消费支出额(百元调查户数(户)组中值 /人年) 40以下 40~50 50~60 60~70 70~80 80~90 90以上 合计
根据资料,在95.45%的概率保证程度下(1)试估计该市居民家庭人均消费年支出额的区间范围;(2)试推断该市居民家庭总消费额的区间范围。
xini 350 1125 2750 4225 6750 3825 1425 20450 ni 10 25 50 65 90 45 15 300 xi 35 45 55 65 75 85 95 — xix (xix)2ni -33.17 -23.17 -13.17 -3.17 6.83 16.83 26.83 — 11003 13421 8673 653 4198 12746 10798 61492 解:(1)样本平均数:xxni1nniini12045068.17(百元/人年)300ixxni614922i^样本方差:i1n204.97300nii1^2n2
抽样平均误差:xn204.9730011nN300300000 0.8262(百元/人年)^^x抽样极限误差:tx20.82621.6524(百元/人年)区间范围:Xx68.171.65x在95.45%的概率保证度下,该市居民家庭人均消费年支出额为(单位:百元/人年)为66.52~69.82百元。~(2)总体总量估计:xNXx66.52~69.82百元N,xx96万,即该市居民家庭总消费额为63.8592~67.0272亿元。
(例8)某工厂大量连续生产,为了掌握某月份某种产品的一级品比率,确定抽出5%的产品,即在全月连续生产的720小时中,按每隔20小时抽取1小时的全部产品进行检查。根据抽样资料计算结果,一级品率为85%,各群间的方差为6%。在95.45%的概率保证程度下,试估计该厂产品一级品比率的区间范围。
解:2R720小时,r7205%36小时,p85%,p6%,则抽样平均误差:p^pRrn^^2rR10.06720360.0398367201
抽样极限误差:ptp20.03980.0796一级品比率区间:pp0.850.0796即在95.45%的概率保证度下,该厂产品一级品比率为77.04%~92.96%。
第八章 假设检验
(例1)某电风扇厂根据历史资料统计结果得知,其电风扇平均使用寿命为25000小时,标准差为1900小时。现在从新批量生产的电风扇中随机抽取400台做试验,求得样本平均寿命为者它们属于同一总体的假设是否成立。
解:本题是关于总体平均数的双侧检验问题,大样本Z检验。 (1)设立假设。
原假设H0: 备择假设H1:
x25000小时。试按5%的显著性水平判断新产电风扇的平均使用寿命有没有显著的差异,或
(2)给定显著性水平:α=0.05
两边拒绝区间概率各为α/2=0.025,接受区间概率为1-0.05=0.95,查表得:上临界值Z0.025=1.96, 下临界值为:Z-0.025=1.96 (3)根据样本资料,计算检验统计量Z的实际值。 (4)检验判断。
实际的Z值3.16>上临界值Z0.025=1.96,拒绝原假设H0 ,接受备择假设,即新批量生产的产品质量有明显提高,或者说,新批量生产的产品和原来的产品并非同一总体
(例2)某公司年度财务报表的附注中声明,其应收帐款的平均计算误差不超过50元。审计师从该公司年度内应收帐款账户中随机抽取17笔进行调查,结果其平均计算误差为56元,标准差为8元。试以0.01的显著性水平评估该公司应收帐款的平均计算误差是否超过50元。 解:本题是关于总体平均数的右单侧检验问题。 (1)设立假设。
原假设H0: 备择假设H1:
(2)给定显著性水平。小样本,须用t检验,给定显著性水平α=0.01是单侧的要求。 ν=n-1=17-1=16,tα(ν)= t0.01(16)=2.583。
(3)根据样本资料,计算检验统计量t的实际值。
(4)检验判断。t=3.092>tα(ν)= t0.01(16)=2.583,检验统计量的样本观测值落入拒绝区域,所以在0.01显著性水平下,拒绝原假设。也就是说,该公司应收帐款的平均计算误差超过50元,原声明不能成立。
(例3)某电池厂生产的某号电池,历史资料表明平均发光时间为1000小时,标准差为80小时。在最近生产的产品中抽取100个电池,测得平均发光时间为990小时。若给定显著性水平为0.05,问新生产的电池发光时间是否有明显的降低。 解:是关于总体平均数的左单侧检验问题。 (1)设立假设。
原假设H0: 备择假设H1:
(2)给定显著性水平。方差已知,大样本,Z检验。α=0.05,单侧的要求为α=0.05,则双侧的概率为2*0.05=0.1。F(Zα)=1-0.1=0.9,查表得
Zα=1.5,即临界值-Zα=-1.5
(3)根据样本资料,计算检验统计量Z的实际值。
(4)检验判断。计算得到的Z值>临界值-Zα,因此不能拒绝原假设H0,即认为现在生产的电池发光时间比正常生产的没有显著降低。
(例4)某牛奶厂生产盒装牛奶,按规定自动装罐的标准盒装净重为1000克。现在从装罐车间生产中抽取10盒,实测每盒净重(克)的结果如下:1010,1024,994,986,1016,1030,1004,990,980,1020。给定显著性水平α=0.01,问罐装车间的生产是否正常。 解:本题是关于总体平均数的双侧检验问题,小样本的t检验。 (1)设立假设。
原假设H0: 备择假设H1:
(2)给定显著性水平。α=0.01,双侧检验,自由度ν=n-1=10-1=9,tα(ν)= t0.005(9)=3.25,上临界值为3.25,下临界值为-3.25。 (3)根据样本资料,计算样本的各项指标值。
样本平均数: xxi1ninn1005.4(克)2xix17.28样本方差: Si1(克) n1^S17.2817.28样本平均误差:x5.468(克)n103.16检验统计量: txX0S/n1005.4100015.468(4)检验判断。由于t的实际值t=1<临界值t0.005(9)=3.25,因此不能拒绝原假设,即认为该牛奶厂的装罐车间的生产属于正常。
第九章 相关与回归
1.推导过程:
设x为自变量,y为因变量,y与x之间存在某种线性关系,yiabxi其简单直线回归方程为:可以通过最小平方法来求其参数,满足Q(yiyi)(yiabxi)最小值和(yiyi)0分别对a、b求偏导得
22i1i1i1nQ2(yiabxi)0ai1nQ2b(yiabxi)0bi1nnn整理得yi1ni1ninabxii1nnn2xyaxbxiiiii1i1联合以上两条式可以得到ayi1ninni1bxi1n
innni1i1bnxiyixiyinxi2(xi)2i1i1nn 第十章 时间数列分析指标
例1. 某商业企业2002年各月商品销售额资料如下表所示,试计算每个季度产品平均销售额。
300400380360(万元)3440480520第二季度月平均销售额480(万元)30600660解:第一季度月平均销售额 600(万元)3760700820第一季度月平均销售额760(万元)33004003804404805200600660760700820全年月平均销售额=550(万元)12第一季度月平均销售额例2. 某企业2002年4月上旬职工出勤人数如下表,试计算平均每日出勤人数。
解:4月上旬职工人平均每日出勤人数25032622258226612722 260(人)32212例3. 某企业2002年第四季度职工人数资料如下表所示,计算该企业第四季度平均职工人数。
解:第四季度平均职工人数
例4. 某商场2002年库存情况 如下表所示。计算该商场2002年的月平均库存额。
2502422422462462442502442422462222245(人)233
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- howto234.com 版权所有 湘ICP备2022005869号-3
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务