
出版社: 清华大学
原售价: 39.80
折扣价: 29.90
折扣购买: 问题驱动的中学数学课堂教学(概率与统计卷大学师范生与中学师生参考用书)
ISBN: 9787302517665
曹广福:男,1960年出生,江苏海安人,博士,博士后,教授,博士生导师。主要从事数学研究与数学教育工作,在国内外重要刊物上公开发表研究论文100余篇,连续主持了六项国家自然科学基金项目,三项教育部高等学校博士点专项(博导类)基金项目,2003年获得首届国家高等学校教学名师奖,2016年入选国家“万人计划”领军人才。长期关注基础教育,以讲座、同课异构等形式经常与中学师生交流,发表了一系列关于基础教育的研究论文,是广州市教育名家工作室负责人,多次获得省级、国家级教学成果奖。
第3章统计——数理统计 还是社会统计 3.1统计学简史 严格说来统计学与概率论是相生相伴的,正如第2章所说,即使是古典概型中的等可能性假设也是基于人的经验,而这种经验无疑是反复试验的结果。虽然统计的思想与方法自古就有,但作为专门的知识,统计学的产生比概率论稍微晚一些,距今300年左右的时间。 统计学产生于17世纪的欧洲,最早用于国情调查,1662年,格兰特(John Graunt,1620—1674)发表了他第一本也是唯一一本手稿《基于死亡账单的自然与政治观察》(natural and politics observations upon the bills of mortality),分析了生男孩和女孩的比例。 19世纪中叶,统计学形成了两个主要的学派,数学统计学派与社会统计学派。随着概率论的成熟,为统计学的发展奠定了数学基础。比利时的阿道夫·凯特勒(Quetelet,1796—1874)主张用自然科学的方法研究社会现象,把古典概率论引入了统计学,使得统计学进入了一个新的发展阶段。不过凯特勒将自然科学的观点与方法机械套用到犯罪、道德等社会问题,混淆了自然现象与社会现象之间的本质区别。尽管如此,凯特勒把概率论引入统计学至少使得统计学在“政治算术”的“算术”方法基础上往准确化道路迈进了一大步,他为后期数理统计学的形成与发展奠定了基础。 社会统计学派比数理统计学派的形成稍晚一些,19世纪后半叶,德国经济学家、统计学家克尼斯(Knise,1821—1889)以及恩格尔(Engel,1821—1896)、梅尔(Mayr,1841—1925)等人沿着凯特勒的“基本统计理论”继续向前发展,认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学。从那时开始,数理统计学与社会统计学便形成了两个相互对立的阵营,社会统计学派认为,由于社会现象的复杂性和整体性,需要进行整体的大量观察和分析,研究其内在联系,才能揭示现象内在规律,这就是该学派所谓“实质性科学”的显著特点。 社会统计学与数理统计学的根本区别在于前者在统计研究中以事物的质为前提,强调认识事物质的重要性,后者则不关心事物的质。 传统的统计学(也称为记述统计)通常是对所收集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,如编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述。 随着科学技术的发展,统计学的研究方法也有了很大的变化,到了20世纪,人们在收集整理观测的样本数据基础上对有关总体做出推断,这就是所谓的推断统计。推断统计的典型特征是根据随机的样本数据以及问题的条件和假定,以概率形式表述对未知事物做出的推断,现在所谓的科学统计方法主要指推断统计。 3.2统计学分类 3.2统计学分类 随着社会科学与自然科学的发展,统计学与各个学科相结合,产生了五花八门的分支。从大的方面看,统计主要有三个分支: 数理统计、经济统计与应用统计。美国大学的统计学设置则涵盖四个方面: 生物统计、金融统计、应用统计与数理统计,有些学校下设统计系,有些学校在数学系下设统计学。我国大学统计学的设置情况与此类似, 在2011年的学科目录调整中统一将统计学归类到理科,但在授予学位时除了可以授予理学学位,依然可以授予经济学学位。 统计学与数学一样涉及几乎所有的自然科学与社会科学,如果将统计学进行细分,可以分出众多的方向: 1. 数理统计学 2. 经济统计学 3. 生物统计学 4. 商务统计学 5. 化学统计学 6. 数据挖掘(使用统计学和模型来发现数据中的规律和知识) 7. 人口统计学 8. 数量经济学 9. 能源统计学 10. 金融统计学 11. 工程统计学 12. 卫生统计学 13. 地理统计学 14. 图像统计学 15. 心理统计学 16. 社会统计学 17. 农业统计学 18. 风险管理 19. 精算学 20. 保险学 21. 统计核算 22. 统计监督 23. 统计预测 24. 统计逻辑学 25. 统计法学 26. 描述统计学 27. 科学技术统计学 28. 教育统计学 29. 司法统计学 30. 社会福利与社会保障统计学 31. 生活质量统计学 32. 人口统计学 33. 环境与生态统计学 34. 自然资源统计学 35. 国际统计学 等等,几乎每一个科学分支都可以与统计学发生联系,统计的范畴已覆盖了社会生活的所有领域,几乎无所不包,成了普适的方法被广泛应用于社会科学和自然科学的各个方面。 随着社会的发展,统计的意义已经不仅局限于对已经发生和正在发生的事物进行统计,提供统计资料和数据,它还担负着一个重要使命: 统计预测与统计决策,统计学也吸收了信息论、控制论即系统论的思想方法,使得其内容得到了极大的丰富。特别是计算机技术的发展使得统计数据的收集、处理、分析、存储、传递等过程有了革命性的变化,计算机科学已经成为统计学不可分割的组成部分。如今的统计学无论是理论还是实践的深度与广度都是过去所不可比拟的。 3.3概率为先还是统计为先 3.3.1概率与统计的逻辑梳理 3.3概率为先还是统计为先 中学阶段的统计学应侧重于什么方面?是数理统计还是社会统计?两者无论是方法还是思想都是不同的,不把这个问题弄清楚,统计学的教学就可能不着要点,甚至带来逻辑上的混乱。 既然中学的统计学作为数学课程的一部分,而且与概率论放在一起,说明是以概率论作为基础的,所以应该属于数理统计的范畴。比较好的方案是将选修23中的概率调整到必修3中,将必修3的统计内容调整到选修23,这样的调整有利于内容的连贯性与逻辑的严谨性。但有意思的是,中学数学必修3将统计放在了概率论之前,而在选修23中又将统计放在了概率论之后。也难怪在概率论章节不介绍样本空间,在统计学中却讲到了抽样统计与样本概念,是不希望概念混淆?的确,概率论中的样本点与样本空间与统计中的样本值的确有所不同,也正是因为概念上有所差别,更应该加以辨别。简单地说,统计上一个容量为n的简单随机样本来自某个随机变量X的分布函数F。 定义1设X是具有分布函数F的随机变量,若X1,X2,…,Xn是具有同一分布函数F的相互独立的随机变量,则称X1,X2,…,Xn为来自分布函数F(F称为总体或X称为总体)得到的容量为n的简单随机样本,简称样本。它们的观察值x1,x2,…,xn称为样本值,又称为总体X的n个独立的观察值。 从上述定义可以看出,这里的样本值与随机试验的样本点有关但又有所不同,从随机试验的角度看,所谓总体实际上是随机试验所有可能的结果,也就是样本空间,由于随机变量是样本空间到实数域的映射,所以也把随机变量称为总体。这里的随机样本指的是n个随机变量的笛卡儿积,所以也可以说随机样本是一个随机向量(X1,X2,…,Xn),且每一个随机分量都有相同的分布函数。这样说可能会让人难以理解,通俗点说,所谓随机样本就是从总体中随机抽取的n个样本点构成的集合。 必修3中统计章节包含抽样方法(简单随机抽样、系统抽样、分层抽样)、总体分布的估计(频率分布表、频率分布直方图与折线图、茎叶图)、总体特征数的估计(平均数及其估计、方差与标准差)、线性回归方程。选修23中章节包含独立性检验(χ2统计量)、回归分析(随机误差、线性回归模型、相关系数)。 传统的数理统计的内容包括哪些呢?虽然不同的教科书编排上有所不同,但大同小异,主要包括: 样本及抽样分布(随机样本、直方图、统计量、抽样分布)、参数估计(参数的点估计、估计量的评选标准、参数的区间估计、正态总体均值与方差的区间估计、置信区间)、假设检验(正态总体均值与方差的假设检验、分布拟合检验)、方差分析和回归分析(单因素试验的方差分析、一元回归分析)。 从上述比较可以看出,中学统计内容摘取了大学传统统计中最基础的部分,包括抽样方法、χ2分布、方差分析及回归分析等内容,编写风格依然是弱化理论,强调例解。传统数理统计之所以作为概率论的后续内容,是因为需要以概率论作为工具,例如数理统计中的样本来自随机变量,研究对象的总体可能是无限的,但通过随机抽样可以得到频率直方图,简单地说,对连续型随机变量做抽样统计可以得到频率直方图。从这个角度看,将统计建立在概率论基础上可以帮助学生更好地理解统计与概率之间的关系。 3.3.2线性回归分析 首先,我们不主张在中学阶段介绍回归分析,事实上,线性回归方程的系数估计需要最小二乘法进行估计,由于涉及两个参数的估计,通常需要多元微积分的偏导数才能计算其估计公式,也就是教材中系数a与b的估计。某个教材是这样阐述这部分内容的: 在实际问题中,变量之间的常见关系有如下两类: 一类是确定性函数关系,变量之间的关系可以用函数表示。例如,圆的面积S与半径r之间就是确定性函数关系,可以用S=πr2表示。 一类是相关关系,变量之间有一定的关系,但不能完全用函数来表达。例如人的体重y与身高x有关。一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系。 用怎样的数学模型刻画两个变量之间的相关关系? 身高与体重之间是一种什么关系?教材没有将本质问题揭示出来,却抛出了一个讳莫如深的问题,此后再也没回头关心过这个问题,甚至连简单的说明都没有。紧接着转向了另一个问题: 某小卖部为了了解热茶销量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表(表241)。 表241 气温/℃261813104-1 杯数202434385064 如果某天的气温是-5℃,那么你能根据这些数据预测这天卖出热茶的杯数吗? 这个数表显然是杜撰出来的,杜撰数据本来并无不可,但至少应该有一定的生活价值。如果是某个饮料加工厂做这样的统计倒是有一定的可信度,当然样本量绝不可能是短短的6天。有哪一家小卖部会做这样无聊的事?小卖部最多每天统计一下收入了多少,不会专门去统计一个数据来进行分析。即使想估算销量,也只会估算未来几天的销量,而且如此小的样本量,凭直觉就可以判断,何须如此复杂的理论?教材为什么不针对开始时的身高与体重的关系接着往下讨论呢?例如可以将某个学校的学生身高与体重做一个统计,哪怕是随机杜撰一个数据表也未尝不可,这样的统计要有价值得多。身高与体重问题是一个经典的问题,也有一定的社会价值。令人疑惑的是,为什么教材欲言又止地把一个有价值的问题抛出来又扔掉,转而讨论一个莫名其妙的问题? 在给出上述数表后,接着给出了散点图以及最小二乘法的概念,即计算散点坐标到直线y=bx+a的“整体距离”Q(a,b)=∑ni=1(yi-bxi-a)2,并给出了参数估计公式: 接下来,需要计算使Q(a,b)取得最小值的a 和b,我们可以用公式 b=n∑ni=1xiyi-∑ni=1xi∑ni=1yin∑ni=1x2i-∑ni=1xi2, a=y--bx-。(*) 这里xi,yi是观察数据,i=1,2,…,n,其计算过程如下: …… a的计算公式不难解释,b的计算公式从何而来?教材甚至连来历都不作介绍,就这么堂而皇之地摆在那里?或许编写者像金庸笔下的武林高手一样,要学生先把“武功秘诀”背下来,待到武功修为达一定境界后自然就会领会。问题是学生将来如果学习相关的专业,这些对于他们就是不值一提的常识性问题,如果不学习相关专业,这些就是很快就会被遗忘的毫无价值的东西,因为,他们不仅不知其所以然,甚至不知其然,如何让他们在忘记公式之后还能领会蕴含在其中的思想方法?教材用一句“推导公式比较复杂,这里不作要求”一带而过。这个公式的推导还真的非常简单,只是学生还没有学习微积分而已。 在选修23中介绍了随机误差、线性回归模型后,引出了相关系数的概念,此处也是“科普”式的处理方法,只是在“链接”中解释了相关系数为什么越接近1,两个量之间的线性相关程度越强。 纵观必修3与选修23中的回归分析部分,存在两个方面的问题: (1)回归分析的本质没有解释清楚,这个问题下一节会作说明; (2)原理解释不清,几乎都是“拿来主义”式的介绍,至于怎么来的一概不作解释,参数估计公式便是个典型的例子。 3.4统计学教学策略 3.4.1随机样本与频率直方图 3.4统计学教学策略 本书与传统的教育理论及数学教育理论书籍很不相同,既不是从教育学的视角,也不是从心理学的视角谈数学教育,而是基于数学内容的思想性来探索数学教育的本质,指出数学思想是数学课堂教学的灵魂,合适的问题则是承载数学思想的最好载体,课堂教学应在对问题的分析过程中散发出数学思想光芒的过程。书中通过大量案例说明在课堂教学中如何设计和分析问题,以展现其数学思想性,为中学数学教师提供了具有借鉴性及很强可操作性的教学方案。