生物统计学(第5版普通高等教育十一五规划教材)

生物统计学(第5版普通高等教育十一五规划教材)
作者: 编者:李春喜//姜丽娜//邵云//张黛静
出版社: 科学
原售价: 45.00
折扣价: 36.00
折扣购买: 生物统计学(第5版普通高等教育十一五规划教材)
ISBN: 9787030375025

作者简介

内容简介

第一章 概论
  本章提要
  生物统计学是把数学的语言引入具体的生命科学领域,运用数理统计的原理和方法对生物有机体开展调查和试验,目的是以样本的统计数估计总体的参数,对所研究的总体进行合理的推论。生物统计学主要包括试验设计和统计分析两部分内容,其作用主要有4个方面:提供整理、描述数据资料的科学方法并确定其数量特征,判断试验结果的可靠性,提供由样本推断总体的方法,提供试验设计的原则。统计学的发展经历了古典记录统计学、近代描述统计学和现代推断统计学3个阶段。本章还介绍了统计学中几组常用的术语。
  第一节 生物统计学的概念
  统计学(statistics)是把数学的语言引入具体的科学研究领域,将所研究的问题抽象为数学问题的过程,是搜集、分析和解释数据的一门科学。生物统计学(biostatistics)是数理统计(mathematical statistics)在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。随着生物学研究的不断发展,生物统计学的应用也越来越广泛。
  生物学研究的对象是生物有机体,与非生物相比,它具有特殊的变异性、随机性和复杂性。生物有机体的生长发育、生理活动、生化变化及有机体受外界各种随机因素的影响等,都使生物学研究的试验结果有较大的差异性,这种差异性往往会掩盖生物体本身的特殊规律。在生物学研究中,大量试验资料内在的规律性也容易被杂乱无章的数据所迷惑,从而被人们忽视。因此,在生物学研究中,应用生物统计学就显得特别重要。生物学研究的实践证明,只有正确地应用生物统计学的原理和分析方法对生物学试验进行合理设计,对数据进行客观分析,才能得出科学的结论。
  生物统计学是在生物学研究过程中,逐渐与数学的发展相结合而形成的,它是应用数学的一个分支,属于生物数学的范畴。生物统计学是把数学的方法引入具体的生命科学领域,把生命科学领域中具体的研究问题抽象为数学问题,从大量试验数据中探寻其规律的过程,以数学的概率论和数理统计为基础,涉及数列、排列、组合、矩阵、微积分等知识。作为一门工具课,生物统计学一般不过多讨论数学原理,而主要偏重于统计原理的介绍和具体分析方法的应用。
  第二节 统计学发展概况
  人类的统计实践是随着记数活动而产生的。因此,对统计发展的历史可追溯到远古的原始社会。但是,使人类的统计实践上升到理论予以总结和概括成一门系统的统计学,起源于17世纪英国,其代表人物W.Petty(1623~1687)是政治算术学派的奠基人,代表作是《政治算术》。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究,为统计学的发展开辟了广阔的前景。由于W.Petty对统计学的形成有着巨大的贡献,马克思称他为“统计学的创始人”。统计学的发展经历了古典记录统计学、近代描述统计学和现代推断统计学3个阶段。
  一、古典记录统计学
  古典记录统计学(record satistics)形成于17世纪中叶至19世纪中叶。在最初兴起时,通过用文字或数字如实记录与分析国家社会经济状况,初步建立了统计研究的方法和规则。概率论被引进之后,逐渐成为一种较为成熟的方法。
  瑞士数学家J.Bernoulli(1654~1705)系统论证了大数定律。后来,J.Bernoulli的后代D.Bernoulli(1700~1782)将概率论的理论应用到医学和人类保险。
  法国天文学家、数学家、统计学家P.S.Laplace(1749~1827)发展了概率论的研究,建立了严密的概率数学理论,并在天文学、物理学的研究中进行了推广应用。他研究了最小二乘法,提出了“拉普拉斯定理”(中心极限定理的一部分),初步建立了大样本推断的理论基础,为后人开创了抽样调查的方法。
  正态分布理论对研究生物统计学的理论十分重要,它最早是由法国数学家De Moiver于1733年发现的。德国天文学家和数学家G.F.Gauss(1777~1855)在研究观察误差理论时,也独立推导出测量误差的概率分布方程,并提出了“误差分布曲线”。这条分布曲线称为Gauss分布曲线,也就是正态分布曲线。
  二、近代描述统计学
  近代描述统计学(description statistics)形成于19世纪中叶至20世纪上半叶,这个时期也是统计学应用于生物学研究的开始和发展时期,其“描述”特色是由一批原来研究生物进化的学者们提炼而成的。英国遗传学家F.Galton(1822~1911)自1882年起开设“人体测量实验室”,分析父母与子女的变异,探寻其遗传规律,应用统计方法研究人种特性和遗传,探索了能把大量数据加以描述与比较的方法和途径,引入了中位数、百分位数、四分位数,以及分布、相关、回归等重要的统计学概念与方法,开辟了生物学研究的新领域。尽管他的研究当时并未成功,但由于他开创性地将统计方法应用于生物学研究,后人推崇他为生物统计学的创始人。
  F.Galton和他的继承人K.Pearson(1857~1936)经过共同努力于1895年成立了伦敦大学生物统计实 室,1889年发表了《自然界的遗传》一文,并于1901年创办了Bi-ometrika(《生物统计学报》或《生物计量学报》)这一权威杂志。在该杂志的创刊词中,F.Galton和K.Pearson首次为他们所运用的统计方法明确提出了“生物统计”(biometry)一词,F.Galton解释为:所谓生物统计学,就是应用于生物学科中的统计方法。在《自然界的遗传》一文中,K.Pearson提出了相关与回归分析问题,并给出了简单相关系数和复相关系数的计算公式。1900年,K.Pearson在研究样本误差效应时,提出了χ2检验,它在属性资料的统计分析中有着广泛的应用。
  三、现代推断统计学
  现代推断统计学(inference statistics)形成于20世纪初至20世纪中叶。随着社会科学和自然科学领域研究的不断深入,各种事物与现象之间繁杂的数量关系以及一系列未知的数量变化,单靠记录或描述的统计方法已难以奏效。因此,要求采用推断的方法来掌握事物之间的真正联系并对事物进行预测。从描述统计学到推断统计学,这是统计学发展过程中的一个巨大飞跃。
  K.Pearson的学生W.S.Gosset(1876~1937)对样本标准差进行了大量研究,于1908年以笔名“Student”在Biometrika 杂志上发表了论文《平均数的概率误差》,创立了小样本检验的理论和方法,即t 分布和t 检验法。t 检验已成为当代生物统计工作的基本工具之一,它也为多元分析的理论形成和应用奠定了基础。因此,许多统计学家把1908年看成是统计推断理论发展史上的里程碑,也有人推崇W.S.Gosset为推断统计学(尤其是小样本研究理论)的先驱者。
  英国统计学家R.A.Fisher(1890~1962)于1923年发展了显著性检验及估计理论,提出了F 分布和F 检验,创立了方差和方差分析。在从事农业试验及数据分析研究时,他提出了随机区组法、拉丁方法和正交试验的方法。1915年,R.A.Fisher在Biometrika上发表论文《无限总体样本相关系数值的频率分布》,被称为现代推断统计学的第一篇论文。1925年,R.A.Fisher发表了《试验研究工作中的统计方法》,对方差分析及协方差分析进一步作了完整的解释,从而推动和促进了农业科学、生物学及遗传学的研究与发展。自方差分析问世以来,各种数理统计方法不但在实验室中成为研究人员的析因工具,而且在田间试验、饲养试验、临床试验等农学、医学和生物学领域也得到了广泛应用。
  J.Newman(1894~1981)和E.S.Pearson进行了统计理论的研究工作,分别于1936年和1938年提出了一种统计假设检验学说。假设检验和区间估计作为数学上的最优化问题,对促进统计理论研究和对试验作出正确结论具有非常实用的价值。
  另外,P.C.Mabeilinrobis对作物抽样调查、A.Waecl对序贯抽样、K.Mather对群体遗传学、F.Yates对田间试验设计等都作出了杰出的贡献。
  我国对生物统计学的应用始于1913年顾澄教授翻译的英国统计学家G.U.Yule在1911年出版的关于描述统计学的名著《统计学之理论》,这标志着英国、美国数理统计学传入中国的开始。之后,许多生物学研究工作者积极从事统计学理论和实践的应用研究,使生物统计学在农业科学、医学科学、生物学、遗传学、生态学等学科领域发挥了重要作用。应用试验设计方法和统计分析理论,进行农作物品种产量比较试验、病虫害的预测预报、动物饲养试验、饲料配方、毒理试验、动植物资源的调查与分析、动植物育种中遗传资源及亲代和子代遗传的分析等都取得了较好成果。
  近年来,生物统计学发展迅速,从中又分支出群体遗传学、生态统计学、生物分类统计学、毒理统计学等。由于数学与生物学、医学和农学的应用,使生物数学成为一门新的学科,生物统计学只是它的一个分支学科。1974年,联合国教育、科学及文化组织在编制学科分类目录时,第一次把生物数学作为一门独立的学科列入生命科学类中。随着计算机的普及和网络技术的发展,SAS(statistical analysis system)、SPSS(statistical package for the social science)等国际通用统计软件的开发和应用,以及生命科学研究领域的不断深入,生物统计学的研究和应用必将越来越广泛,越来越深入。
  第三节 常用统计学术语
  一、总体与样本
  具有相同性质的个体所组成的集合称为总体(population),它是指研究对象的全体,而组成总体的基本单元称为个体(individual)。
  总体按所含个体的数目可分为有限总体和无限总体。个体极多或无限多的总体称为无限总体(infinite population)。例如,某一棉田棉铃虫的头数,可以认为是无限总体。另外,也可从抽象意义上来理解无限总体。例如,通过临床试验来推断某种药品比另一种药品治愈率高,这里无限总体是指一个理论性总体。个体有限的总体称为有限总体(finite population)。例如,对某一班学生身高进行调查,这时总体是指这一班中每位学生的身高。
  要研究总体的性质,一般情况下我们无法对总体中的个体全部取出进行调查或研究。因为在实际研究过程中,常会遇到两种难以克服的困难:一是总体 个体数目较多,甚至无限多;二是总体的数目虽然不多,但试验具有破坏性,或者试验费用很高,不允许做更多的试验。在这种情况下,只能采取抽样的方法,从总体中抽取一部分个体进行研究。
  从总体中抽出的若干个体所构成的集合称为样本(sample),构成样本的每个个体称为样本单位(sample unit),样本中个体的数目称为样本容量(sample size),记为n。样本的作用在于估计总体。例如,可以调查某一地区棉田100株棉花上的棉铃虫头数,来推断该地区棉铃虫的发生状况,以采取相应的对策。一般在生物学研究中,n<30的样本称为小样本,n≥30的样本称为大样本。在一些计算和分析检验方法上,大、小样本是不同的。
  在对事物的研究过程中,人们常通过某事物的一部分(样本)来估计事物全部(总体)的特征,目的是为了以样本的特征对未知总体进行推断,从特殊推导一般,对所研究的总体作出合乎逻辑的推论,得到对客观事物的本质和规律性的认识。在生物学研究中,我们所期望的是总体,而不是样本。但是在具体的试验过程中,我们所得到的却是样本而不是总体。因此,从某种意义上讲,生物统计学是研究生命过程中以样本来推断总体的一门学科。
  二、参数与统计数
  参数(parameter)也称为参量,是对一个总体特征的度量,常用希腊字母表示