你一定爱读的极简统计学
作者简介
小岛宽之,生于1958年,*本帝京大学经济学系副教授,经济学博士,知名数学随笔作家。1958年出生于东京,毕业于东京大学理学院数学系,同大学经济学研究所博士课程修毕。著有《几率的思考方式》《方便运用!几率的思考》《世界**简单微积分》《从零开始学习微积分》以及《专为文科设计的数学教室》等多部作品。
内容简介
**部分解说过的“母群体”**重要,所以这 里让我们再次回顾一下。 我们以数据的形式,观测相同的不确定现象生出 的各种数字的情况。比 如,观测相同种类的蝴蝶各不相同的体长数值,或者 在选举中选民对各个人 物进行投票。*具体一些,比如投掷36枚硬币时,正 面枚数是从0枚到36枚各 不相同的数值。再举例子的话,比如同一家店铺营业 额每天都不同,还有股 票的*经平均指数每天反复涨跌。 我们可以假想出一个潭子,相同现象的数据都从 相同的潭子中出现。 这个假想之潭叫作“母群体”。可以这样想,蝴蝶体 长的数据,从装满蝴 蝶体长数值的潭中出现,店铺营业额的数据从装满店 铺营业额数值的潭中 出现。 选举的情况,将“开票处整体”比作潭子会*容 易理解。因为某人投 了谁的票,与观测开票处1张投票用纸是**相同的 。一次选举的全部数 据,是与(包括弃权的)选民人数一致的,这是有限的 数,因此叫作“有 限母群体”。 与此相对,(像神一样超常存在地)计测古今中外 、现在未来所有蝴 蝶的体长,将写有计测结果的无限张数的纸投入潭中 ,就有了无限个的数 据数,因此叫作“无限母群体”。对于投掷硬币的情 况,无限次投掷36枚硬 币,将出现正面枚数的全部数据放入潭中(从0到36的 37种数字各有无限个被 放入其中),这也是无限母群体。假设进行了无限次 交易,那么店铺的营业 额和股票的*经平均指数也属于无限母群体。 本书考虑的是一般性的问题,所以不针对有限母 群体,而只针对无限母 群体来思考(出现选举例子的时候,也请当作无限母 群体来看待)。 推论统计的目标,是从(无限)母群体得出的几个 数据中,对母群体总 体进行推测。**部分中解说过,这是“从部分推论 总体”。慎重的读者也许 会觉得不可思议:怎么可能有这种事情? 但是,好好回想一下我们*常生活就会发现,这 些事情平时就有。比 如下面这件事。我们做酱汤的时候,需要判断味道( 咸味等)是否合适。 当然把一锅酱汤全都喝掉确实可以进行判断,但就没 有了尝味道的意义。 于是,我们用勺子喝一点,没问题的话就说明可以。 这就是根据部分判断 总体。 为什么以此就能大概知道味道如何呢?因为可以 认为“经过充分混合,一汤勺可以反映全体”。 推论统计也是同样。从母群体这一假想之潭中出 现的数据,不是谁都可 以随意控制的,而是反映母群体总体情况的,所以在 从部分判断总体上与尝 酱汤的例子相同。 但是,尝酱汤的时候,必须想到偶尔会尝到“稍 有些浓”的地方,或是 “稍有些淡”的地方,所以酱汤总体的味道与尝到的 味道多少有些偏差也是 正常的。同样,也必须做好推论统计也并非“**一 致”,而是有一定的偏 差的思想准备。 2.随机抽样法和总体均值 我们已经将母群体当作潭子一样的东西。那么让 我们详细地说一下潭子里面的内容。 (无限)母群体的一例如图11-1。数据数值只有① 、⑤、⑨3种,每个数据在潭中有无数个。 请想象一下这种情况。潭中有3种池子:“有无 数数据①在池子 里游泳”“有无数数据⑤在池子里游泳”“有无数数 据⑨在池子里 游泳”。 池子的大小(幅度)不同,假设面积各为0.6、0.3 、0.1(以后母群体中 “池子”面积必须像这样按照合计为l来设定)。请将 池子大小的差别看作 各数据是否容易从母群体这个潭子中出来的差别。对 母群体来说,观测到的 数据是①、⑤、⑨中的任意一个,观测到的相对频数 是池子大小的数字(面 积)0.6、0.3、0.1。 就是说,数字①的出现比数字⑨容易6倍,数字 ⑤的出现比数字⑨容易3倍。 实际上为了明白地说明此问题,必须用到“概率 ”的表达。就是说,观 测到①、⑤、⑨的概率分别为0.6、0.3、0.1,它们 每次按照各自的概率独立 (不影响其他观测值的出现)出现。 但像序章说过的,本书会避开概率,只谈数据分 布,毕竟本书只是统计学入门读本。P107-109