决战大数据(大数据的关键思考升级版)

决战大数据(大数据的关键思考升级版)
作者: 车品觉
出版社: 浙江人民
原售价: 56.90
折扣价: 31.30
折扣购买: 决战大数据(大数据的关键思考升级版)
ISBN: 9787213072277

作者简介

车品觉,畅销书《决战大数据》作者,红杉资本中国基金专家合伙人,全国信标委大数据标准工作组副组长。 阿里巴巴集团前副总裁,首任阿里数据委员会会长;拥有十几年丰富的数据实战经验,并在实践中形成了独特的数据化思考及管理方式,对大数据未来趋势有独到的见解。亲自领导阿里数据团队在大数据实践领域取得了一系列重要成果,包括为阿里建立集团各事业群的业务及决策分析框架,开发智能化的数据产品,成立了驱动集团数据化的运营团队,成功发起了公共与专有数据资产管理体系,还发布了数据安全规范等。 现担任中国信息协会大数据分会副会长、中国计算机学会大数据专家委员会副主任、粤港信息化专家委员、中国计算数学学会第九届理事、清华大学教育指导委员(大数据项目)、浙江大学管理学院兼职教授等职。

内容简介

有人说,大数据就像国王的新衣,每个人都在国 王面前说着动听的话,国王信以为真,其实他并不知 道自己在裸奔。 的确,网络上有很多人在谈大数据,但是他们只 会谈,不会做,因为他们根本就没有做过,包括那些 所谓的“大数据专家”,他们真的做过吗?没有。事 实上,这些人对大数据内在的问题一点儿都不了解, 更别说知道大数据的水有多深了。 目前,在大数据方面,无法深入应用的原因在于 ,从收集到使用的大数据价值链出现了问题。从理论 上来说,从收到用的螺旋式循环是一个巨大的涡轮, 只有先数据化运营,然后才能运营数据。而现在的情 况是,用数据的人不知道大数据从哪里来,做数据的 人不知道大数据如何使用。想用的人不敢用,因为担 心大数据的真实性;做的人不知道怎么用,因为大数 据的复杂性。这一问题造成的结果就是,数据量变得 越来越大,而且越来越无法有效地使用。 大数据从来不是免费的午餐 我先问一个数据管理上最现实的问题:“大数据 如何备份?”毫不夸张地说,大数据已经这么庞大了 ,如果再备份一次,你的成本起码会增加一倍。 做大数据基本上都要从大量收集数据开始,因为 这些数据在未来会大有用处。但是,你是不可能无止 境地收集下去的。在这里,你已经看到了一个再清晰 不过的伪命题:大数据的确能够备份,但是成本会增 加两三倍。然而,“以前重要的数据肯定都需要备份 啊,”你自然会问,“如果不能备份,我该怎么办? ”而这就是大数据管理中必然会遇到的一个问题。 我再问一个问题,如果你在数据使用方面一直得 心应手,整个商业链条和数据紧密相关、相辅相成。 但是,现在数据链忽然断了,或者不再有效了,此时 你该怎么办? 需要注意的是,这一问题说的不是你有没有使用 好数据,而是说曾经你可以得到的数据现在无从获得 了;或者说这些数据不能再在线上收集,只能从线下 获取,成本也就相应升高了;抑或说,这些数据存储 在其他地方,你不能使用了。在诸如此类的情况下, 你该怎么办? 当然,如果你对数据的使用本来就很生疏,而且 也觉得无关紧要,那么数据链消失了、断裂了、失效 了,你也不会有太大烦恼。但假如正当你将数据使用 得风生水起的时候,出现这样的问题,那你也只能束 手无策,眼睁睁地看着机会溜走。 大数据从来不是免费的午餐。伴随着大数据热潮 的到来,关于大数据的一些新问题层出不穷——大数 据会夹杂着虚假信息;大数据的数据量很大,但有用 的信息不一定多,甚至还会破坏核心信息;大数据的 来源是多渠道的,偏倚、随机的误差总是存在。 但是,我们也需要客观地认识到,大数据现在面 临的这些问题,其实就是把小数据中的一些问题放大 了。小数据中难道就没有噪音会破坏我们的核心信息 吗?当然也有,只不过当大数据把数据量放大和变多 的时候,噪音的破坏性也会相应变大。小数据中难道 就没有渠道偏倚和随机的问题吗?当然也有,但是在 大数据的背景下,问题被更明显地放大了。 人的断层 说了这么多,事实上还没有触碰到如今大数据面 临的最大问题:人。 很多人都会问,大数据能带来什么价值?怎么衡 量大数据创造的价值?事实上,最直接的衡量标准就 是,在经营上它为你赚了多少钱,带来了多少实际的 利润提升。 对于这一问题的解决,现在很多人倾向使用的方 法是计算“在用了大数据之后,点击率提高了多少, 转化率提高了多少”。但是要知道,转化率和点击率 能提高的数据,可能根本不是投资人或公司最高管理 者对大数据的期望。对于业务人员来说,转化率能提 升5个百分点就已经非常好了,如果将转化率从2%提 高到3%,简直就是奇迹了;但对于公司最高管理者 来说,这并不是他想要的大数据。 你需要认识到,断层才是大数据所面临的最严重 的问题。收集数据的人并不清楚未来使用数据的人要 做什么,这是目前大数据运用的一大关键命门。 在使用大数据时,我们通常的做法是先把数据收 集起来,因为我们知道在未来的某一时刻,这些数据 对我们可能有用。不过,“未来可能有用”就注定会 引发一个问题:收集数据的人不知道未来使用数据的 人要做什么。这时候,如果你再问收集数据的人“如 何才能更好地收集数据”,那么,数据的使用就会陷 入一个死循环。 事实上,不仅是收集数据的人,就连使用数据建 模的人,同样也不清楚当前的数据是如何获得的。数 据建模是数据使用的关键环节,使用数据建模,就是 根据以往的经验从中寻找到一些潜在的规则,然后把 这些规则结合起来去解决问题。 P8-11