数学与决策(数学教你做决定)/万物皆数学

数学与决策(数学教你做决定)/万物皆数学
作者: (西)维森斯·托拉|责编:张静|译者:吕红艳
出版社: 中信
原售价: 48.00
折扣价: 31.68
折扣购买: 数学与决策(数学教你做决定)/万物皆数学
ISBN: 9787521722352

作者简介

维森斯·托拉,瑞典于默奥大学计算机科学系教授,日本筑波大学客座研究员。欧洲人工智能协会(EurAI)会员,美国电气电子工程师学会(IEEA)会员。研究领域为数据隐私、机器决策、模糊理论等。著有《人工智能基础》《从算盘到数字革命》《数据隐私》等作品。

内容简介

前 言 我们每天做出的各种决策影响着我们自己和其他人的生活。把决策方法作为研究对象的决策学,已广泛应用于经济学、统计学、心理学,以及当前受益于人工智能的信息技术领域。本书主要从最优方案的数学模型角度探讨在决策过程中会遇到的问题。 我们在决策过程中会碰到种种困难。比如,决策准则可能互相矛盾,决策环境可能包含某些风险或存在不确定性;又或者,决策过程中还有其他决策对手,对手的优选决策必然对其有利而可能对我方不利。 另外,本书还会通过实际案例探讨多标准决策。在多标准决策环境中,决策者必须添加偏好—结合许多偏好—以及效用函数。我们将探讨综合考量的几种方法,以及纳入多个决策程序的社会选择方法。 本书的另一个话题是对抗型决策过程,探讨了对手与我方是共时决策,还是交替决策。对于共时决策,我们将通过博弈论进行探讨;对于交替决策,鉴于该类问题属于需要利用计算机来处理的博弈论问题,我们将通过人工智能技术的过程描述工具进行探讨。 最后,本书还探讨了选举制度。选举制度允许选举人表达自己的偏好,并对选举结果进行统计,以达到选择候选人或进行议会选举的目的。因此,它们与决策学之间关系密切;具体来说,它们与第一章所研究的社会选择方法有对应关系。 第四章 不确定型决策 正如第一章所述,在有些情况中,我们不确定自己所做的决策会产生何种影响。举两个例子: 1. 假设我们有100 欧元,并打算用其购买彩 票,以期中奖。在这一案例中,我们有两种选择:买彩 票或不买彩 票。假设只有10 个彩 票号码,而奖金为500 欧元。如果不买彩 票, 那么结果显而易见,我们什么也没赚到。如果真的买了彩 票, 我们确信自己可能会有些收获。然而中奖概率也一目了然(假设开奖过程没有黑幕):只有一个号码能中此大奖。 2. 为了能够以旅游来庆祝学年结束,班级决定举办一场聚会来募集资金。聚会定于下个月,即2 月。我们面临两种选择: 在户外举办聚会还是在室内举办聚会。如果我们办户外聚会, 当天天气晴朗,那么筹得的资金就很多;反之,如果下雨或天气太冷,聚会很可能变为一场灾难,而筹得的资金就会很少。如果我们办室内聚会,当天下雨或太冷,筹得的资金也还行, 但如果当天天气晴朗,资金就会比在户外少很多。彼时正值元旦,今年的天气反复无常,我们无法预测2 月的天气走势,也无法预测在上述任意一种情况下筹得资金的具体数目。 经典决策理论侧重于区分不确定型决策和风险型决策。当决策涉及风险,可以通过概率分布(如概率分布为已知) 这一方法来表示我们不确定的事物,而如果我们不知道这种风险的概率分布,那我们的决策就具有不确定性。例1 中的彩 票决策问题,其概率分布是已知的,所以这是风险型决策。例2 中的聚会决策问题,因为我们没有信息,既不知道天气状况概率也不知筹得的资金的具体数额,所以这是不确定型决策。 总体来说,在决策问题中,不确定性是由多种原因造成的,因此形成了各种类型的不确定性,每种类型都有对应的决策工具。 由于数据信息不精确,我们的决策会产生不确定性。例如,我们不精确的信息可以表现为只知道气温在20℃和25℃ 之间。在这种情况下,如果有人问气温是否为23℃,我们只能说有这可能性。虽然该问题完全精确,但由于信息不精确, 我们无法给出精确的答案。此外,我们所拥有的信息可能是模糊的,比如气温在22℃左右,这一信息是模糊的。我们可以利用弥散集合来表示此类不精确问题。 随机性是不确定性的另一种类型。人们通常使用概率模型,以解决不确定性中的随机性问题。 以下是不确定型决策的经典模型,以及以概率分布为核心的风险型决策。 概率解释 概率的公理化没有说明其意义或释义,也没有说明该如何被确定。目前,对概率含义的解释数不胜数,主要分为两大类别:客观概率和主观概率。 客观概率 客观概率也称物理或频率概率,该概率具有物理意义。客观概率由一个随机的物理系统确定,该系统使我们得以从大量相似事件序列中得出结果的频率极限。比如在轮盘赌博中选择数字时考虑的概率。值得注意的是,上述关于彩 票的案例就属于客观概率。 主观概率 主观概率是指特定个体的信念度量。面对相同的事件时, 我们不能预设不同的人对此一定会持同等度量的判断。从这层意义上说,这一信念度量是“个人”的。 意大利人布鲁诺·德·芬内蒂(Bruno de Finetti,1906—1985)就主观概率的存在问题,建构了第一个理论证明。该证明基于个人对一组事件的投注以及其对这些事件的偏好。德·芬内蒂根据人们在投注中的偏好,构建了一个存在向量概率的定理,即主观概率定理。 之后, 美国人伦纳德· 萨维奇(Leonard Savage,1917—1971)证明了另一个包括效用函数和概率分布的类似定理。同时, 萨维奇还确立了主观期望效用理论。该理论基于前面所述的布鲁诺·德·芬内蒂理论以及约翰·冯·诺伊曼(John Von Neumann) 和奥斯卡·摩根斯坦(Oskar Morgenstern)的效用定理,并引入了效用函数(期望效用模型)。下文会讲述萨维奇的研究成果。 除了主客观概率外,还有其他概率类型,如逻辑概率。逻辑概率是有一定确定性的主观概率,但具有一定的理性。也就是说当面对相同的事件时,所有的个体对该事件都有同等程度的确定性。主观概率和逻辑概率构成了一组证据概率,与物理概率或客观概率形成对比。 不确定性、风险、客观及主观概率 回顾上文提到的风险型决策,其概率分布都为已知,而不确定型决策的概率分布则不明。 按照这个说法,彩 票的例子属于风险型决策,因为我们已知相关可能性选项带来的利益概率分布。 总而言之,当遇到客观概率事件时,我们会发现自己处于风险型决策中,在这种情况下,冯·诺伊曼和摩根斯坦的期望效用模型就可以给出有针对性的建议;而在不确定型决策中, 之所以可以应用萨维奇的主观期望效用理论,是因为在这种情况下,起决定性作用的是主观概率。 期望效用经典模型 在经典风险型决策模型中,概率分布为已知。由冯·诺伊曼和摩根斯坦创建的期望效用模型,在公理化假设的基础上, 推导出了一个效用函数,具体细节如下: 设有一组选项X,如果个体要在X 中做出决策,那么此个体对X 中的概率分布肯定存在某种偏好关系,这种概率分布被称为“博彩”。我们对X 的形式没有要求,它可以是金钱奖励, 也可以是非金钱的其他奖励。 以下举两个例子说明这种情况,第一个例子的奖励为奖金,而第二个例子的奖励为旅行。 例一:艾丽西亚与奖金 艾丽西亚的选择有三种可能的结果:赢0 欧元、赢100 万欧元、赢500 万欧元。现在她面前有两张彩 票,她必须从中挑选出自己偏爱的。选第一张彩 票肯定会赢100 万欧元,因为它中奖概率分布为(0,1,0)。而第二张彩 票的中奖概率分布为(0.01,0.89,0.10),也就是赢得0 欧元、100 万欧元和500 万欧元概率分别为0.01、0.89 和0.10。基于上述情况,艾丽西亚当然会选择100% 赢100 万欧元的彩 票。 例二:贝塔与旅行 有三个旅行地点可供贝塔选择:雷乌斯、巴黎和伦敦。雷乌斯之旅为期一天,且旅行项目是去那里的餐厅就餐;巴黎之旅为期一周;伦敦之旅为期一个月。当有人问及对这三个地方偏好的概率分布时,贝塔说,她比较想毫无悬念地去巴黎一周, 但也想碰碰运气,去巴黎后再去伦敦,最后去雷乌斯就餐。 冯·诺伊曼和摩根斯坦的实验结果表明,如果艾丽西亚和贝塔对概率分布(彩 票或选择)的偏好满足一组特性,那么就应该有一个关于选择的效用函数,艾丽西亚和贝塔在表达对概率分布的偏好时,就是希望将期望效用最大化。 我们先看具体定义,然后再分析原因。首先来看冯·诺伊曼和摩根斯坦两人对概率偏好所表现的逻辑属性的推测。在此用字母P、Q 和R 分别表示彩 票的概率分布情况,即概率P、概率Q 和概率R。若P≥Q,则说明艾丽西亚或贝塔相较概率Q,更倾向于概率P。 为了给出公式,我们需要对这些概率进行组合。随机配对一组概率,如P 和Q,其在(0,1)区间的值为α,这时该组 概率[α P +( 1 – α)Q]即为X的概率,这组概率也可以表示为: [αP +( 1–α)Q](x) = αP(x) +( 1–α)Q(x) 以下是冯·诺伊曼和摩根斯坦推测的几种情况: 1. 理性偏好。这里的偏好关系指理性偏好关系,该偏好关系具有完全性、传递性及自反性。本书第一章已讲述该偏好关系的定义。 2. 独立性偏好。对于所有概率P、Q 和R 以及区间(0,1) 中的任意数α,那么, 当且仅当 αP+(1–α)R ≥ αQ+(1–α)R 时,P ≥ Q 3. 连续性偏好。对于任意概率P、Q 和R,如果P > Q 且 Q > R,那么在区间(0,1)中存在α 和 β,满足: αP +(1-α)R > Q 且 Q > βP +(1-β)R 接下来分析一下形成这三种情况的原因。第一种是理性偏好关系,第一章已讨论过。第二种是说概率P 和概率Q 之间的偏好与概率R 无关。当我们偏好P 时,若将P 和Q 与另一种偏好R(任意数α)结合,其结果不影响主观偏好。第三种讲述的是概率的微小变化不会改变严格偏好。注意这些方程针对的是严格偏好,而非一般偏好。 根据冯·诺伊曼和摩根斯坦的定理艾丽西亚和贝塔关于概率的偏好关系满足这三种情况,那就能说明她们是利用选项的效用函数来表示自己的偏好。或者更确切地说,艾丽西亚的奖金选项以及贝塔的旅行之选都具效用性。此外,定理还指出,如果给艾丽西亚两种概率,并让其做出选择,她所做的决策是基于期望效用最大化的一种心理过程。这就是我们称其为“ 期望效用理论”的原因。 在定义该理论前,我们先要明白何为期望效用。因此,我 们需要一组关于选项的效用函数。如第一章所提,此函数定义为:设x 为集合X 中的任一选项,那么通过函数u 可以得出一个效用值。所以,若集合X 上存在概率分布P,则期望效用EU(u,P)的公式如下: EU(u,P)=Σx p(x)u(x) 冯·诺伊曼和摩根斯坦定理所建立的关系符合理性偏好、独立性以及连续性条件,当且仅当存在效用函数u,使得每个概率分布P 和Q 满足: P ≥Q,当且仅当 EU(u,P)≥EU(u,Q) 如前所述,该定理表明,如果艾丽西亚的偏好满足上述公式,那么她做的决策也就在意料之中了。因为艾丽西亚的效用函数选项使其在期望效用P 大于期望效用Q 时,仍偏向于P。 ·决策是每个人的难题,选举与投票是人类社会的难题,如何快速、科学、有效地决策,是任何人都试图达成的理想状态。作者用经典案例和详实分析解答决策难题,和读者一道分享决策中的数学故事。 ·将数学与日常生活建立连接,发现您身边的数学。作者从决策的各个方面逼近主题,阐述了决策方法、多标准决策、对手决策和影响人类社会的选举制度,从微观和宏观两头解读决策话题。只有理解了决策的各个面孔,普通人才能做好决策,把好的决策落到人生实践中。 ·科普专栏作家撰写,将专业知识以平易近人的风格说出。 ·用故事线索链接数学知识,而非单一的专业思考,情节丰富,用趣味启发的方式拉近数学、决策与人生三者的距离。