
出版社: 科学
原售价: 46.00
折扣价: 36.80
折扣购买: 统计学(普通高等教育十三五规划教材)
ISBN: 9787030494207
第一章 统计与数据
统计是认识社会最有力的武器之一,只有真正拥有统计思想,形成统计思维,才能很好地应用统计方法解决实际问题。为了更好地领会统计思想,灵活地应用统计方法来认识客观现象的数量规律,本章首先介绍统计学的基本问题,主要包括统计的含义及特点,统计学的基本要素,统计学的类型,统计数据的计量尺度及其类型、统计数据的表现形式,统计数据的来源等。
第一节 统计与统计学
一、统计的含义
“统计”一词在各种实践活动和科学研究领域中经常出现。然而,不同的人或在不同的场合,对其理解是有差异的。比较公认的看法是,统计有三种含义,即统计工作、统计资料和统计学。
1. 统计工作
统计工作(statistical work)即统计活动,是指搜集、整理和分析统计数据,并探索数据内在数量规律性的活动过程。它的产生与发展已有几千年的历史。统计工作一般说来是由统计设计、统计调查、统计整理和统计分析构成的。统计设计是对所做统计工作的通盘考虑和安排,表现为各种设计方案。统计调查则是根据统计设计的要求,对调查对象中个别事物的特征进行的资料搜集过程,其结果为各种杂乱无章的个体资料,它是统计工作的基础。统计整理是根据统计研究目的,对统计调查搜集的个体资料进行的加工,并使之条理化、系统化的过程,是统计工作的中间环节。它是统计调查的延续,又是统计分析的前提。统计分析是对统计整理的资料进行的数量分析,从而揭示客观现象数量规律的过程,它是统计工作的中心环节。
2. 统计资料
统计资料或称统计数据(statistical data),是统计工作过程所取得的各种数字资料和其他资料的总称,表现为各种反映客观现象数量特征的原始记录、统计台账、统计表、统计图、统计分析报告、政府统计公报、统计年鉴等各种数字和文字资料。
3. 统计学
统计学(statistics)是阐述统计工作基本理论和基本方法的科学,是对统计工作实践的理论概括和经验总结。它以客观现象总体的数量方面作为研究对象,阐明统计设计、统计调查、统计整理和统计分析的工作理论与方法,是一门方法论科学。
统计工作、统计资料和统计学之间有着密切联系。统计工作同统计资料之间是工作过程同成果的关系,统计资料是统计工作的直接成果。就统计工作和统计学的关系来说,统计工作属于实践范畴,统计学属于理论范畴。统计学是统计工作的理论概括和科学总结,它来源于统计工作,又高于统计工作,反过来又指导统计工作,两者相辅相成,统计工作的现代化同统计科学研究的支持也是分不开的。
统计工作、统计资料和统计学相互依存、相互联系,共同构筑了一个完整的整体,这就是我们所说的统计。
二、统计的特点
统计研究不同于其他学科的科学研究,它具有自己的特点。
(一) 数量性
数量性是统计的基本特点,统计是从数量方面入手认识客观现象的工具。可以说,没有数量就没有统计。常言道:“数字是统计的语言”指的就是这个意思。
数量性具体包括三方面的内容:
(1) 数量特征。即研究客观现象的总规模、总水平等。
(2) 数量关系。即研究客观现象的内部结构、比例关系、相关关系等。
(3) 数量界限。即引起客观现象质变的数量。例如,完成计划与未完成计划有质的差别,计划完成程度100%?就是质与量互变的界限。
(二) 总体性
统计学以客观现象总体的数量方面作为自己的研究对象,因此,总体性是统计的又一重要特点。所谓总体性,是指统计从整体上反映和分析客观现象的数量性,而不是着眼于个别事物的数量,因为事物的本质和发展规律只有从整体上观察,才能作出正确的判断。例如,只有对大量的出生人口进行观察才能得出合理的人口性别比例,若只对个别家庭的出生人口进行观察是很难得出正确结论的。
(三) 具体性
统计研究的是客观现象在具体时间、地点、条件下的数量,而不是抽象的数量,这是统计学与纯数学的一个重要区别。
任何客观现象都是质与量的统一体。一定的质规定一定的量,一定的量又表现出一定的质。例如,100万这个数字,在纯数学中只是一个抽象的数字,而统计学中则必须明确它所对应的客观现象是谁,是以什么单位计量的,是什么时间条件下的数量等。
三、统计学的类型
统计研究方法已广泛应用于自然科学和社会科学的众多领域,统计学也已发展成为由若干分支组成的学科体系。由于不同的视角或不同的研究重点,人们常对统计学科体系作出不同的分类。根据统计学是方法论科学这一特点,一般有两种基本的分类:一是从方法的功能看,统计学可分为描述统计学和推断统计学;二是从方法研究的重点看,统计学可分为理论统计学和应用统计学。
(一) 描述统计学和推断统计学
描述统计学(descriptive statistics)是研究如何取得反映客观现象特征的数据,并利用统计分组方法对所搜集的数据进行加工整理,以统计图表形式加以显示,从而确定数据的分布形态,进而通过综合计算分析得出客观现象最基本的数量规律性的统计学分支。描述统计学的内容包括统计调查方式和资料搜集方法,统计数据的分组、显示方法,数据分布基本特征的计算分析方法等。
推断统计学(inferential statistics)是研究如何根据样本数据去推断总体特征的统计学分支,它是在对样本数据进行描述统计的基础上,对总体未知分布或参数作出的概率形式的推断。推断统计学的主要内容包括参数估计和假设检验等。
描述统计学与推断统计学的划分,反映了统计方法发展的前后两个阶段和使用统计方法探索客观现象总体内在数量规律性的不同过程。统计研究过程的起点是个体统计数据,终点是探索出客观现象总体内在的数量规律性。在这一过程中,如果搜集到的是总体数据(如普查数据),那么运用描述统计就可以达到认识客观现象总体内在数量规律性的目的;如果获得的只是研究总体的一部分数据(如样本数据),那么要得出总体内在的数量规律性,就需要运用概率论的理论和样本信息,对总体进行科学的推断。显然,描述统计学和推断统计学是统计学的两个重要分支。描述统计学是整个统计学的基础,推断统计学则是现代统计学的核心内容。推断统计学在现代统计学中的作用和地位越来越重要,因为在对现实问题的研究中,所获得的数据主要是样本数据,但这并不等于说描述统计学不重要。如果没有描述统计搜集可靠的统计数据并提供有效的样本信息,再科学的统计推断方法也难以得出切合实际的结论。从描述统计学发展到推断统计学,既是统计学发展的巨大成就,也是统计学发展成熟的重要标志。
(二) 理论统计学和应用统计学
理论统计学(theoretical statistics)是以抽象的数量为研究对象,研究一般的数据搜集、整理和分析数据方法的统计学。理论统计学以数学中的概率论为基础,对统计方法加以推导证明,其中心内容是以归纳方法研究随机变量的一般规律,如统计分布理论、参数估计和假设检验理论、方差分析理论、相关与回归分析理论等。理论统计学的特点是计量不计质,具有通用方法论的理学性质。理论统计学是统计方法的理论基础,没有理论统计学的发展,统计学也不可能发展成为像今天这样一个完善的科学知识体系。
将理论统计学的方法原理应用于各个具体研究领域,就形成了应用统计学(applied statistics)。因此,应用统计学是以各个研究领域的具体数量为研究对象的统计学。应用统计学重在研究一般统计方法的应用,也包括各研究领域实质性科学理论的应用,它既需要进行定量分析,又需要结合研究的客观现象理论进行定性分析。所以,应用统计学是在定性分析基础上的定量研究。例如,统计方法在经济领域的应用形成了经济统计学及其若干分支,在管理领域的应用形成了管理统计学,在社会学研究和社会管理中的应用形成了社会统计学,在人口学中的应用形成了人口统计学,等等。应用统计学除了包括各领域通用的方法,如参数估计、假设检验、方差分析等,还包括某领域所特有的方法,如经济统计学中的指数分析法、现代管理决策法等。应用统计学着重阐明这些方法的统计思想和具体应用,而不是统计方法数学原理的推导和证明。
第二节 统计学的基本要素
一、总体、个体和样本
(一) 总体和个体
统计工作就是通过对所研究的对象进行观测取得其数据资料,并对这些数据资料加以整理和分析研究的过程。构成统计工作研究对象的全部事物所组成的整体,称为统计总体(population),简称为总体或母体;而总体中的每个个别事物则称为个体。总体中全部个体的数量称为总体容量,通常用表示。
在实际研究中所遇到的总体,一般有下列两种:一种总体是由自然物体所组成的总体。例如,要研究全国人口状况,则全国人口是总体,每一个人是个体。又如,要了解某地区的工业生产情况,则该地区的全部工业企业构成总体,每个工业企业是个体。另一种总体是由变量值所组成的总体。例如,要研究某企业职工的平均工资,则该企业每个职工的工资水平的集合构成总体,每个职工的工资水平是个体。又如,要了解某个射击运动员的运动水平,则该射击运动员的每次射击结果的集合构成总体,每次射击结果是个体,等等。这两种不同类型的总体,分别属于不同的研究对象和目的。一般来说,由自然物体所组成的总体能够满足多方面的研究需要,而由变量值所组成的总体主要是满足对该变量的研究需要。在推断统计学中主要使用变量值所构成的总体,并且主要关心变量值的分布,称为分布总体。
如果总体中只包括有限个个体,即总体容量是一个有限数,则称为有限总体;如果总体中包括有无数个个体,即总体容量为无穷大,则称为无限总体。例如,全国人口、某地区工业企业、某企业职工人数都是有限总体;而宇宙中的星球、海洋中的鱼等则可看作无限总体。
确定统计总体就是确定统计活动的研究对象及范围,这需要根据统计研究的目的来进行。研究目的不同,统计总体往往也不同。例如,研究目的是了解工业行业的生产经营状况,则总体就是该行业的全部工业企业所组成的集合;而假若研究目的只是了解工业行业的职工生活情况,则总体就是工业行业的全体职工所组成的集合。
需要特别指出的是,在实际应用中,有时总体中的个体是很不明显的,要区分个体往往十分困难。例如,要考察某地所生产的小麦的出粉率,则总体是该地区所生产的全部小麦,而个体却很不明确;又如,要考察某一段河流的水质污染情况,则总体就是该段河流中的全部水,而个体也很不明确。在上述情况发生的条件下,一般是将每个观察单位看作一个个体,而观察单位的大小以及计量方法则根据观察手段而定。比如,或许将每一千克小麦看作一个个体,将每立方米水或者每升水看作一个个体。
(二) 样本
样本(sample)是指从总体中随机抽取并作为总体的代表的那一部分个体所组成的子集。构成样本的个体数目称为样本容量,简称为样本量,通常用表示。虽然样本中的个体数量相对于总体而言只是较少的一部分,但样本是从总体中随机抽取并用来代表总体的,基于这种关系,总体又可称为母体,而样本则称为子样。样本是由总体中的一部分个体构成的,假如我们将总体看作由研究对象的所有个体组成的集合,则样本就是总体的一个子集。
样本具有如下特点:
(1) 样本中的每个个体都必须取自于总体的内部。
(2) 样本具有不唯一性。总体是唯一确定的,而样本则是不唯一确定的,一般情况下,从一个总体中可以抽取多个样本容量相同的不同样本。
(3) 样本是总体的代表。抽取样本的目的在于用它的信息来推断总体特征。样本对总体的代表性高低直接影响到用样本信息推断总体特征的误差大小。一般情况下,样本的代表性与样本容量的大小、抽样方法以及抽样技术等方面有关。如何提高样本的代表性来减少抽样误差,这是统计学需要研究解决的重大课题之一。
(4) 样本抽取具有随机性。从