概率论与数理统计(第2版21世纪高等院校教材)
作者简介
内容简介
第1章 概率与古典概型
在自然界和社会中存在着各种各样的现象,这些现象一般可以分为两类.一类是在一定条件下必然要发生的现象.例如,向上抛一石子必然下落,在标准大气压下,水温度达到100℃就要沸腾等.这类现象称为确定性现象.另一类现象则与此不同.例如,在相同的条件下抛一枚硬币,其结果可能是正面朝上,也可能是反面朝上,并且在每次抛掷之前都无法确定会出现哪种结果;掷一枚骰子,可能会出现的点数有1、2、3、4、5、6,但是未抛之前我们无法确定会出现哪种情况.这类现象,在一定条件下可能出现这样的结果,也可能出现那样的结果,而在试验或观察之前却不能预知确切的结果.但是,人们在经过长期的观察和深入研究后,发现其在大量的重复试验或观察下,结果却呈现某种规律性.例如,多次重复抛掷硬币发现正面朝上大约有一半,将一枚骰子反复抛掷后发现出现各种点数的次数大约是相同的.这种大量重复试验或观察中所呈现出来的规律性,就是我们后面所说的统计规律性.这种在个别试验中结果呈现出不确定性,而在大量重复试验中结果又具有统计规律性的现象称为随机现象.
对于随机现象,人们很早就注意到它的存在了.从亚里士多德时代开始,哲学家们就已经认识到随机现象在生活中的作用,他们把随机现象看成是破坏生活规律,超越了人们理解能力范围的东西,他们没有认识到有必要去研究这些随机现象,也没有意识到不确定性也可以度量.后来,许多数学家都曾研究过随机现象,如帕斯卡、伯努利、高斯等.而将不确定性数量化则是近代的事,在这一领域取得的成果已经给人类生活的诸多领域带来了一场深刻的革命.概率论与数理统计是研究随机现象及其统计规律性的一门数学学科.
概率论与数理统计有着广泛的应用.例如,金融、信贷、医疗、保险等行业策略的制定,流水线上产品质量检验与质量控制,食品保质期,弹药储存分析,电器与电子产品的寿命分析等.概率问题与我们的生活如此密切相关,正如法国数学家拉普拉斯所说:“生活中最重要的问题,其中绝大多数在实质上只是概率问题.”
1.1 随机试验与随机事件
1.1.1 随机试验
为了研究随机现象及其统计规律,必须对随机现象进行观察或试验.以下把对随机现象所进行的观察或试验称为随机试验.如下所示的4个例子:
(a)掷一枚骰子,观察出现的点数;
(b)掷一枚硬币,观察出现正面、反面的情况;
(c)一射手进行射击,直到击中目标为止,记录射击次数;
(d)在一批灯泡中任取一只,测试它的寿命.
上面列举的4个例子,具有以下共同的特点:
(1)试验在相同的条件下可以重复进行;
(2)试验的可能结果不止一个,并且所有可能的结果是可以预先知道的;
(3)在试验之前不能确定具体哪一个结果会出现.
我们把具有以上3个特点的试验称为随机试验,简称试验,记为E.
1.1.2 样本空间
随机试验E中,试验的所有可能结果组成的集合称为随机试验E的样本空间,一般用字母S表示.S中的元素,称为样本点,常用e表示.
在例(a)中,试验的所有可能结果有6个:1点,2点, ,6点.因此样本空间为
S1={1,2,3,4,5,6};
在例(b)中,试验的所有可能结果有两个:正面、反面.因此样本空间为
S2={正面,反面};
在例(c)中,试验的所有可能结果为全体正整数,从而样本空间为
S3={1,2,3, };
在例(d)中,试验的所有可能的结果为非负实数,因此样本空间为
S4={t|t≥0}.
在上述的例子中,例(a)、例(b)试验的样本空间都只有有限个样本点,称之为有限样本空间.例(c)中样本空间有可列无穷多个样本点,而例(d)中样本点也是无穷多个,但它们充满区间[0,+∞),这时我们称样本点数为不可列无穷多个.
1.1.3 随机事件
在随机试验中,人们关心的是那些可能发生也可能不发生的事情,称为随机事件.它实际上是样本空间的子集.随机事件常用大写的英文字母A,B,C等来表示.例如,在例(a)中,“点数为偶数”;例(b)中,“出现正面”;例(c)中,“次数不多于10次”;例(d)中,“灯泡的寿命为1500小时”,“灯泡的寿命在2000到3000小时之间”等等,都是随机事件.对一次试验来说,它们可能发生,也可能不发生,因而都是随机事件.这些事件可以分别记为
A={2,4,6};
B={正面};
C={1,2,3,4,5,6,7,8,9,10};
D1={t|t=1500};
D2={t|2000≤t≤3000}.
在一次试验中,若属于事件A的某一个样本点出现,称事件A在这次试验中发生了.对于一个随机试验来说,它的每一个可能的结果,也就是样本空间中的每一个样本点,显然都是随机事件,它们是随机试验中最简单的随机事件,称为基本事件,如B,D1.它们显然都是单点集.除了基本事件外,还有复合事件,它是由试验的若干可能结果组成的.例如,A,C,D2都是复合事件.
在随机试验中,每次试验必定发生的事件称为必然事件;每次试验都必定不发生的事件称为不可能事件.一般地,必然事件用S表示,不可能事件用表示.显然,S就是样本空间,它是自身的子集,在一次试验中,必有至少一个样本点出现,从而S必然发生.而是空集,它不含任何样本点,在试验中自然不可能发生.
必然事件和不可能事件本质上不是随机事件.为了今后研究问题方便,把必然事件和不可能事件作为两个极端形式的随机事件.
1.1.4 事件的关系与运算
随机事件是样本空间的子集,因此事件间的关系和运算与集合的关系和运算是一致的.下面给出事件间的关系和运算在概率论中的提法.
设试验E的样本空间为S,而A,B,Ak(k=1,2, )是S的子集.
(1)若,则称事件B包含事件A,这表示事件A的发生必然导致事件B的发生.也可记为,它们的几何表示如图1.1所示.
若事件B包含事件A,并且事件A包含事件B,则称事件A与事件B相等,记为A=B.
(2)表示事件A与事件B中至少有一个发生的事件,称为事件A与事件B的和事件,亦称为事件A与事件B的并,记为A∪B,它们的几何表示如图1.2所示.当且仅当A和B至少有一个发生时,事件A∪B发生.
事件的并,可以推广到有限多个事件甚至无穷但可列个事件的情形.
表示事件A1,A2, ,An至少有一个发生.
表示事件A1,A2, ,An, 至少有一个发生.
(3)表示事件A与事件B同时发生的随机事件,称为事件A与事件B的积事件,亦称为事件A与事件B的交,记作A∩B或AB,它们的几何表示如图1.3所示.
与事件的和类似,事件的积也可以推广到有限个甚至无穷可列个事件的情形.
表示事件A1,A2, ,An同时发生.
表示事件A1,A2, ,An, 同时发生.
(4)表示事件A发生而事件B不发生的事件,称为事件A与事件B的差事件,记为A-B,它们的几何表示如图1.4所示.
(5)当,我们称事件A与事件B是互不相容的,或互斥的.它表示事件A与事件B不可能同时发生,它们的几何表示如图1.5所示.显然基本事件是两两互斥的.
(6)当时,则称事件A与事件B互为对立事件,或称事件A与事件B互为逆事件.它表示在一次试验中事件A与事件B有且仅有一个发生.A的对立事件记为A,它们的几何表示如图1.6所示.显然A=S-A.
图1.1
图1.2
图1.3
图1.4
图1.5
图1.6
与集合的运算规律相对应,在进行事件的运算时,经常用到下面的运算规律.
(1)关于事件的和的运算规律.
A∪B=B∪A;(交换律)
A∪(B∪C)=(A∪B)∪C;(结合律)
A∪A=A;(幂等律)
A∪S=S.
(2)关于事件的积的运算规律.
A∩B=B∩A;(交换律)
A∩(B∩C)=(A∩B)∩C;(结合律)
A∩A=A;(幂等律)
A∩S=A.(吸收律)
(3)关于事件的积与事件的和的混合运算规律.
A∪(B∩C)=(A∪B)∩(A∪C);(分配律)
A∩(B∪C)=(A∩B)∪(A∩C);(分配律)
A∪B=A∩B,A∩B=A∪B.(对偶律)
对偶律对于任意有限个事件或者是可列无穷个事件和、积都是成立的.
可见,概率论中的事件与集合论中的集合,以及它们的关系和运算是一致的.为了便于对照,列出关系如表1.1所示.
表1.1
1.2 随机事件的频率与概率
上节介绍了随机试验、样本空间和随机事件等基本概念.对于一个随机事件来说,它在某一次试验中可能发生,也可能不发生.人们常常希望知道某些事件在一次试验中发生的机会有多大.例如:为了确定保险费,保险公司希望知道某些意外事故发生的可能性,同时人们也望找到一个合适的数来描述事件在一次试验中发生的可能性大小.本节将要给出的概率这一概念正是对随机事件发生的可能性大小的一种度量.为此,先来介绍一下频率的概念.
1.2.1 频率
定义1.1 在相同的条件下,进行了n次随机试验,在这n次试验中,事件A发生了m次,称比值,为事件A在这n次随机试验中发生的频率.
经验告诉我们:在一般情况下,如果一个事件在试验中发生的频率越大,则事件发生的可能性就越大,也就是说频率在一定程度上反映了随机事件发生的可能性的大小.但是,对于同一个试验,不同的试验者可能会得到不同的结果,即使是同一个试验者,其在不同时间得到的结果也很可能是不同的.而一个事件发生的可能性大小应该是确定的.由于频率具有波动性,因此,频率虽然在一定程度上反映了事件发生可能性的大小,却不能用它作为事件发生可能性大小的客观度量.另一方面,虽然频率不能作为表示概率的度量,但是频率的一些性质对引入概率的概念还是很有帮助的.因此下面先来讨论一下频率的性质.
由频率的定义可得到它有以下性质.
(1);
(2);
(3)若A1,A2, ,Ak是两两互不相容的事件,则
为了更好地理解频率的性质,先来看下面的例子.
例1.1 考虑“抛硬币”这个试验,把一枚硬币抛掷50次、500次,各做5遍,得到如表1.2的结果(其中nH表示正面H发生的频数,fn(H)表示正面H发生的频率).
表1.2
表1.3是历史上抛硬币试验的结果.
表1.3