
出版社: 电子工业
原售价: 69.00
折扣价: 50.40
折扣购买: 白话统计
ISBN: 9787121335181
冯国双,北京大学医学部博士,具有十多年的数据统计分析经验,知名统计学平台“小白学统计”的创始者与维护者。已主编多部统计学专著,出版《小白学SAS》,同时兼任多个与统计有关的学术委员会委员。 兴趣爱好:在热爱统计分析之余,还对古玩奇石、盆景制作和诗词鉴赏略有心得。
7.3 假设检验中的两类错误 当我们根据假设检验思想最终计算出结果并做出 结论时,谁也不敢保证结论一定是正确的,任何结论 都有错误的可能。比如,你做出嫌疑人有罪的结论, 就存在冤枉好人的风险;你做出嫌疑人无罪的结论, 就存在纵容恶人的风险。这实际上就是假设检验中的 两类错误,我们通常称之为I型错误和II型错误。下 面通过一个例子来更详细地说明这两类错误。 有一家化工厂,一直在排放污染物。环保署接到 举报,于是派调查人员前去展开调查。根据环保署的 标准,排放浓度的上限是万分之三。所以调查人员就 进行抽样调查,随机抽取了几个排放点,检测排放的 污染物的浓度。经过调查人员的努力,调查结果出来 了,排放浓度是万分之四,高于排放标准上限。那么 现在问题来了:要不要让它关门整顿? 如果你直接说“当然让它关门了,都超出上限了 ,还等什么”,那说明你还没有真正理解统计学。因 为工作人员只是做了抽样调查,既然是抽样,就有可 能存在误差。因为这家工厂排放的污染物的浓度有可 能并没有达到上限,只是抽样的地方恰好浓度高而己 。 要判断该工厂的排污浓度是否超标,就要利用假 设检验思想,先设定原假设,即这家工厂的排污浓度 没有超标,然后根据收集的数据进行统计推断,最后 计算统计量和P值,做出统计学结论。结论只可能有 两种:一是认为超标;二是认为没有超标。而事实也 有两种:一是实际上真的超标了;二是实际上并没有 超标。这两个结论一组合,就会生成图7.4所示的样 式。 从图7.4中不难看出,所谓I型错误,就是环保署 冤枉了该厂,本来该厂的排污浓度并未超标,但环保 署认为它超标了。在这种情况下,该厂吃亏了(无缘 无故被勒令停工好几个月)。所谓II型错误,就是你 放纵了该厂,本来该厂的排污浓度超标了,环保署却 认为它没有超标。在这种情况下,附近老百姓吃亏了 (继续忍受污染)。 I型错误和II型错误通常又称为假阳性错误和假 阴性错误,一般用α和β来表示。它们在不同领域有 不同的含义。如在医学诊断中,I型错误就是误诊, 即本来未患病却被错误地诊断为患病;II型错误就是 漏诊,即本来患病了却没有被诊断出来。在质量控制 领域,I型错误又称为生产者风险,相当于产品本来 没有瑕疵,结果被错误地认为有瑕疵,这种风险由生 产者来承担;II型错误又称为消费者风险,相当于产 品本来有问题,结果却没有发现,这种风险就由消费 者来承担。 I型错误和II型错误是一种此消彼长的关系,I型 错误增大,II型错误会减少;反之,I型错误减少, II型错误会增大。这一点可通过图7.5来说明。 图7.5显示的是一组高血压人群和一组非高血压 人群的收缩压分布情况,黑色曲线下代表非高血压人 群,蓝色曲线下代表高血压人群。可以看出,这两个 人群有一定的交叉,换句话说,有一部分高血压人群 会被误判为非高血压,有一部分非高血压人群会被误 诊为高血压。 如果我们以红色线条(147mmHg)作为划分标准 ,即大于147mmHg认为是高血压,否则认为是非高血 压。此时误诊率较高,因为在非高血压人群中大于 147mmHg的人还有不少(黑色曲线中红线右侧面积) ,这些人都被划分到高血压人群中,从而造成误诊。 如果我们以绿色线条(152mmHg)作为划分标准 ,即大于152mmHg认为是高血压,否则认为是非高血 压。此时漏诊率较高,因为在高血压人群中低于 152mmHg的人还有不少(蓝色曲线中绿线左侧面积) ,这些人都被划分到非高血压人群中,从而造成漏诊 。 因此,如果提高标准,让标准更为苛刻,则可以 降低假阳性,但同时会提高假阴性。同样,如果降低 标准,让标准更为宽松,则可以降低假阴性,但同时 会提高假阳性。 那这两种错误到底哪个更严重?这 取决于你站在哪一方。从环保署的角度来看,可能I 型错误更严重,因为错误地控告该工厂,可能导致该 工厂恶狠狠地反咬一口,环保署需要支付高额的赔偿 金。从附近居民的角度来看,II型错误更严重,因为 如果该工厂的排污浓度超标但环保署没有发现,那该 工厂会继续排放污染物,危害居民健康。 在很多情况下,我们可能很难确定到底哪种错误 严重,比如癌症的诊断,如果犯I型错误,把本来非 癌症的误诊为癌症,则可能会导致他心理压力剧增, 甚至真的得病;如果犯II型错误,把癌症患者漏诊为 非癌症,则可能会丧失早期治疗的最佳时期,从而导 致病情的延误。所以有时我们不得不从专业角度综合 考虑,到底把假阳性和假阴性设为多少合适。 目前一般习惯上把I型错误设为0.05,把II型错 误设为0.1或0.2。但这并非固定的,如果你发现犯I 型错误特别严重,那就可以降低I型错误的标准,如 设为0.01。这些只能根据自己的专业知识和研究目的 来决定。 P73-75