别相信直觉
作者简介
谷歌公司前数据科学家,宾夕法尼亚大学沃顿商学院客座讲师,《纽约时报》特约专栏作家。他在斯坦福大学获得哲学学士学位,并以美国大学优等生的身份毕业,之后获得哈佛大学经济学博士学位。他用新的大数据源揭示了不为人知的行为和态度,这一研究发现登上了《公共经济学》杂志和其他著名刊物。他的图书代表作是《人人都在说谎》。
内容简介
:前 言 数据极客的自助书 你可以做出更好的人生选择。大数据会帮助你。 感谢互联网的发展和所有网络数据,我们对人生最重要之事的看法正在悄然发生巨变。过去几年,专家在形式多样、体量庞大的数据集中不断挖掘,如大型在线相亲网站 OkCupid 上的各种消息、维基百科上的所有资料,还有脸书上的感情状态。他们应该也是第一次在数以亿计的数据点中,找到关于人生基本问题的可靠答案。这些问题包括下面这些。 ? 如何成为一名好家长? ? 隐形富豪都是谁,为什么是他们? ? 一个人成为名人的概率有多大? ? 为什么有些人非常幸运? ? 婚姻幸福的征兆是什么? ? 什么寻常小事能让人开心? 对于这些问题,你可能猜不到大数据给出的答案。大数据会建议你做出你之前可能不会做的决定。原因很简单,海量的新数据会对问题做出新的解答,让你或者你认识的人更好地做出选择。 下面举三个例子。这些例子均来自研究人员对人生不同境遇的研究。 第一个例子,假设你是一个单身青年。目前,你的约会次数并不如你所愿。于是,你用了别人建议的各种方法让自己的外表看上去更好看:下功夫打扮自己,美白牙齿,花大价钱换一个新发型。但是,你依然没能成功约会。 大数据分析可能会帮你成功约会。 克里斯蒂安·鲁德尔是一名数学家兼作家,他研究了在OkCupid 上收获“喜欢”的数千万种情况,以了解该网站上最成功的约会者具有哪些特征。鲁德尔发现,那些最受欢迎的约会者都拥有像布拉德·皮特和娜塔莉·波特曼那样大家公认的美貌。这个发现并不让人感到意外。 但是,通过大量数据,鲁德尔发现,有一类约会者的表现令人惊讶。他们通常拥有不同于常人的外表,比如,他们可能染一头蓝发、展现身体艺术、戴着造型夸张的眼镜或剃光头。为什么会这样?这些不走寻常路的约会者的成功秘诀在于,虽然很多人不会特别关注他们,甚至对他们根本不感兴趣,但还有一部分人就是喜欢他们。 而在约会中,这种“就是喜欢”的感觉至关重要。 在约会这件事上,除非你本人明艳得不可方物,否则包装 自己的最好方法,用鲁德尔的话来说,就是“要么很多人爱你, 要么很多人不爱你,但是不要让人觉得‘嗯……还可以’”。鲁 德尔发现,这样改变之后,人们在网站上被打招呼的次数增加 了 70%。数据表明,发掘并展现自己的特别之处,会让一些人特别喜欢你。 第二个例子,假设你刚刚有了宝宝 。为了抚养他长大,你需要选一个社区居住。你知道怎么选社区——咨询朋友、上网查基本信息、实地看房,好啦,你为自己家选了一个满意的住所。你以为这里不会有什么门道。 不过,选择居住地现在有了科学依据。 利用最新的数字化纳税记录,研究人员研究了数亿名美国人的生活轨迹。他们发现,如果一个人从小在某些城市生活, 或者说在这些城市的某几个社区生活,那么他就更有可能取得更高的成就。这些社区不是人们通常认为好的那些社区,也不是房价昂贵的那些社区。基于对大量数据的广泛分析,研究人员绘制了一份地图,其中记录了美国所有社区的品质。 数据分析的作用远不只是这样。研究人员继续深挖数据, 寻找最适合孩子成长的社区所共有的特征。在这个过程中,他 们的发现颠覆了很多传统育儿理念。感谢大数据,我们终于能 够告诉家长,要想培养出一个成功的孩子,什么最重要(比如, 成年人行为的榜样作用),而什么远没有那么重要(比如,学 费高昂的学校)。 第三个例子,假设你是一个怀才不遇的画家。你购买了绘 画领域的各类书籍,听取了朋友们的反馈,反复调整作品价格, 但你依然没能出人头地,也不知错在何处。 大数据发现了一个人们很可能会犯的错误。 近期,塞缪尔·P. 弗雷伯格及其团队针对数十万名画家的职业发展路径开展了一项研究。 该研究发现了一种潜在模式,揭示了为什么有些画家功成名就,而另一些画家没有成功。那么,著名画家和无名小卒之间的区别到底是什么? 区别就在于画家如何展示自己的作品。大数据告诉我们, 那些没有任何突破的画家往往倾向于在几处地点反复展示作 品;相反,那些功成名就的画家会在更多的地点展示作品,以 便抓住偶然的成功机会。 很多人都强调过在工作中展示自己的重要性。但是,数据科学家发现,这种“展示”是指在尽可能多的地方展示自己。尽管本书给单身人士、新手父母或拥有雄心壮志的画家提 供了更多的建议,但本书并不只针对他们。我的目标是将全新 的大数据结论告诉你,希望对你人生的任一阶段都有所帮助。本书将会使用数据科学家最新的研究成果,告诉你如何更加快 乐、如何更加亮眼、如何更快地晋升等等。而我撰写本书的契机是某晚的一场棒球比赛。 生活中的魔球 我和其他棒球球迷一样,都察觉到现在的棒球比赛和 30 年前的棒球比赛相差甚远。我在青年时代追捧纽约大都会队, 那时棒球队凭直觉打球;经理靠感觉确定棒球队要打触击还是 偷垒;棒球队在选秀时依据的是球员青年时期的表现。 但是,从 20 世纪下半叶开始,种种迹象表明,棒球比赛可以变得更加精彩。在我小时候,我父亲每年都会买一本比尔·詹姆斯写的新书。詹姆斯曾是美国堪萨斯州一家黄豆猪肉罐头厂的夜班保安,也是一名狂热的棒球球迷。他用一套非常规的方法——当时刚上市的计算机和数字化的比赛数据,来分析棒球比赛。人们称詹姆斯和他的同行为棒球数据分析师。根据他们的数据分析结果,我们可以看出,球队依靠直觉做出的决定往往会酿成大错。 球队应该打几次触击?棒球数据分析师的回答是:尽量少打。球队应该偷几次垒?几乎不用。如果一名球员能够制造很多保送,那么他身价多少?远超预期。球队在选秀时应该选哪些人?多从大学联赛的投球手中进行选择。 对詹姆斯的理论感兴趣的不只我父亲一个人,还有比利·比恩。比恩曾是一名棒球运动员,后转做棒球教练。在他成为奥克兰运动家队的总经理后,他用棒球数据分析师的策略运营球队。 结果无比成功。奥克兰运动家队用棒球联赛历史上最少 的资金,分别在 2002 年和 2003 年打入季后赛。 这段经历也被写入《魔球》一书,之后这本书被改编成电影《点球成金》, 闻名世界。自那时起,数据分析在棒球比赛中变得无比重要。 坦帕湾光芒队,一度被称为“比魔球奥克兰运动家队更具魔球特点的球队” ,凭借联赛第三少的球队资金成功闯入美国职业棒球大联盟(MLB)2020 年世界大赛。 之后,魔球理论及其核心观点——数据可以纠正偏见,改变了其他很多机构,比如其他体育项目的机构。NBA(美国职业篮球联赛)各球队越来越依赖数据分析,比如追踪记录投篮轨迹。 通过研究 3 亿次投篮数据,球队发现了大量非最佳投篮选择。上述分析发现,在 NBA 跳投手投丢的所有球中, 过近投篮次数是过远投篮次数的二倍。球员在底角投篮时,或 许因为担心砸到篮板,投篮总是偏向远离篮板的一侧。球员已 经开始利用这些信息调整投篮以提高自己的命中率了。 在很大程度上,硅谷的公司也开始依赖魔球理论。我之前 在谷歌做数据科学家,我的前东家显然非常相信数据在做重大 决策时的作用。之前有一件很出名的事情,即一位设计师从谷 歌离职,原因是谷歌经常会忽视专业设计师的直觉,而选择相 信数据。当时,让这位设计师下定决心离职的是一个实验。为 了确定谷歌邮箱里哪种蓝色的广告链接能获得最高的点击量, 该实验设计了 41 种蓝色并搜集对应的点击量数据。 这位设计师可能对这种做法感到很无奈,但这一实验给谷歌带来了每 年 2 亿美元的额外广告收入。 在发展到市值 1.8 万亿美元的过程中,谷歌始终相信数据的力量。正如谷歌前 CEO(首席执行官)埃里克·施密特所说:“我们只相信上帝,其他所有人都必须用数据说话。” 世界顶级数学家、文艺复兴科技公司创始人詹姆斯·西蒙斯将严谨的数据分析带到了华尔街。他和一个定量分析师团队一道做了一次前所未有的尝试,即建立一个包含股价和真实事件的数据集,并深入分析其中的规律。在公司财报公布后,股价会怎么样?经济下行时呢?新闻曝光后呢? 文艺复兴科技公司自创立以来,其旗下的王牌基金产品大 奖章基金完全依靠数据模型进行交易,扣除管理费前的回报 率为每年 66%。 同期标准普尔 500 指数回报率仅为每年 10%。研究有效市场假说的经济学家肯尼思·弗伦奇认为,任何产品的回报率几乎都不可能高于标准普尔 500 指数。他将文艺复兴科技公司的成功解释为“它就是比其他公司好” 。 但是,在个人生活中,我们如何做出重大决定?我们如何选择与谁约会,与谁步入婚姻殿堂?我们如何生活?我们是否需要找一份工作? 我们的选择更像 2002 年的奥克兰运动家队,还是那时的其他棒球队?更像谷歌公司,还是零售店?更像文艺复兴科技公司,还是传统的资金管理者? 我想说,在一生绝大多数的时间里,大多数人在做出重大决定时,都非常依赖直觉。我们会咨询身边的朋友、家庭成员或所谓的人生赢家。我们或许听过信口开河的建议,又或许窥见了一些统计学基础知识。然后,我们会做一些自我感觉良好的事情。 当我观看那场棒球比赛时,我非常好奇,如果我们以数据为基础做出人生的重大选择,会发生什么?如果我们以比利·比恩运营奥克兰运动家队的方式度过一生,又会发生什么? 近些年来,我觉得人们越来越有可能用数据决定人生。我的上一本书《人人都在说谎》讲述了互联网提供的所有新数据是如何改变我们对社会的理解和思维方式的。数据革命率先在棒球比赛中进行,要感谢那些痴迷于数据的棒球球迷,他们搜集并分析了各类数据。“人生之球”的革命则要归功于我们的智能手机和电脑搜集的所有数据。 让我们思考一个重要的问题:什么让人快乐? 20 世纪,能够严谨且有条理地回答这个问题的数据并不存在。当棒球界开始“魔球革命”时,每场棒球比赛的数据都 被完整地记录了下来,所以,棒球数据分析师可以逐场分析比赛数据。但在当时,数据科学家并没有像记录每场比赛那样, 记录人生的选择和随之产生的情绪。与棒球比赛不同,严谨的 定量分析无法分析快乐。 但现在可以了。 两位杰出的研究人员——乔治·麦克隆和苏珊娜·莫拉托利用 iPhone(苹果手机)等智能手机建立了一个前所未有的有关快乐的数据集,他们把这个项目称作“快乐地图” 。他们招募了上万名手机用户,每天向用户发送消息,问一些简单的问题,比如他们在做什么,与谁在一起,开心程度如何。由此,一个包含 300 多万个快乐数据点的数据集形成了,而之前的相关研究只有几十个数据点。 在根据几百万个数据点分析得出的结论中,有些非常具有启发性。比如,当体育迷支持的球队输掉比赛时,他们的痛苦程度高于球队赢得比赛时的快乐程度。有些结论与人们的直觉完全相反。比如,你做家务时喝点儿酒,此时获得的快乐比社交时喝酒获得的快乐要多。有些结论非常深刻。比如,工作让人痛苦,除非你与朋友一起工作。 由数据得出的大多数结论都非常实用。你是不是也曾好奇过,天气如何影响我们的心情?在快乐程度上,哪些活动会系统性地欺骗我们?金钱在让人快乐中到底扮演着什么角色?周遭环境在多大程度上影响我们的感受?感谢麦克隆、莫拉托等一众科学家的研究,上述所有问题现在都有了可靠的答案,本书的第八章和第九章将会细致地阐述它们。事实上,我会以从数百万条智能手机信息中发现的快乐方案来结束本书,我将其称为“数据对生活之问的回答”。 所以,在受到那场棒球比赛的启发后,我在过去 4 年进行了深入的研究。我与研究人员对话,阅读了大量的学术论文, 还仔细研读了论文的附录。而且我确信,研究人员肯定想不到 我使用的研读方式。同时,我自己也做了一些相关研究和解读。我的工作就像是在婚姻、育儿、运动天赋、财富积累、创业、运气、外貌和快乐等领域中发现比尔·詹姆斯这类人,同时让 阅读这本书的你成为自己生活中的比利·比恩。现在,我已经做好了准备,向大家展示我学习到的一切内容。我将其称为“生活中的魔球理论”。 赛思·斯蒂芬斯-达维多维茨曾经是谷歌的数据科学家,专门用数据发现社会的真相,这本新书也是如此。此书跟他的上一本书《人人都在说谎》不同的地方在于,它综合了很多人的研究,讲的道理更加实用,都是像婚姻、教育、发家致富这样的日常话题。此书的每一个结论背后都有扎实的研究和数据的支持,很多时候不是一项,而是很多项研究的综合结果。所以,不管你在这本书里读到什么离奇的说法,我都建议你先想想为什么是这样。也许就是非得经过大数据分析,我们才能发现这些规律。 ——万维钢 科学作家,“得到”App《精英日课》专栏作者 这本书的作者不仅是一位数据科学家,更是一位预言家。他告诉我们如何利用数据革命重新想象生活。《别相信直觉》是一部杰作,融合了数据分析、幽默文风和人性的考量。 ——丹尼尔·平克(Daniel H. Pink) 未来学家,趋势专家与商业思想家 看待大数据有两种方式:一种是把它看作对你直觉的威胁,另一种是把它看作检验你直觉的资源。赛思·斯蒂芬斯-达维多维茨是数据驱动思维方面的专家,而这本引人入胜的书中充满了令人惊讶的实用见解,可以帮助你利用触手可及的信息做出更好的决策。 ——亚当·格兰特(Adam Grant) 沃顿商学院组织心理学教授 我喜欢作者解释我们如何通过生活中的小优势来更好地生活的方式。在篮球场上,我的事业就是寻找这些小优势。我发现,生活中大多数成功的人都重视小优势的积累。最后,这些小优势加起来会给生活带来巨大的益处。 ——肖恩·巴蒂尔(Shane Battier) 迈阿密热火队两届NBA总冠军球队球员