数据预处理从入门到实战 基于SQL、R、Python

数据预处理从入门到实战 基于SQL、R、Python
作者: [日]本桥智光|译者:陈涛
出版社: 人民邮电
原售价: 89.00
折扣价: 62.30
折扣购买: 数据预处理从入门到实战 基于SQL、R、Python
ISBN: 9787115552327

作者简介

本桥智光(作者) 先后在系统开发公司担任研究员,在互联网企业担任数据科学家,目前在数字医疗初创公司SUSMED株式会社担任CTO,同时就职于HOXO-M株式会社,并以自由职业者的身份从事量子退火计算机的验证工作,拥有制造业、零售业、金融业、运输业、休闲业和互联网等多个行业的数据分析经验。曾在KDD CUP 2015中赢得亚军。爱好是开发马里奥AI。 Twitter:@tomomoto_LV3 陈涛(译者) 运筹学硕士毕业,主要从事数据库、数据分析工作,对机器学习、深度学习领域相关的理论和技术较为熟悉。因兴趣自学日语,一直致力于追求兴趣和工作的完美结合。 邮箱:victory123_456@163.com

内容简介

一本书掌握大数据、人工智能时代需要的数据预处理技术 ·KDD CUP 2015亚军得主多行业实战经验总结; ·54道例题,涵盖常见数据预处理技术; ·3个实战案例,快速提升应用能力; ·3种语言实现对比,代码优化关键点一目了然; ·配套数据+源码可下载; ·SQL的版本为Redshift,Pyhton的版本为3.6,R的版本的3.4; ·双色印刷。 数据提取/数据聚合/数据连接/数据拆分/数据生成/数据扩展 数值型/分类型/日期时间型/字符型/位置信息型 1.习题式结构,带着问题思考、学习,效果更好 本书采用问题驱动式,先抛出常见预处理任务,引导读者思考如何实现。像这样带着问题学习,可以大大提高学习效果,让理解更深入。 2.对比3种不同语言的实现,把握每种语言的特长 用SQL、R、Python对比解决相同的案例问题,可以让读者了解各语言在处理各种预处理问题时有哪些优缺点,从而根据情况选择合适的语言,提升预处理效率。 3.同时给出一般代码与理想代码,优化处理的关键一目了然 对于每道例题,都同时给出一般代码与理想代码,读者不仅可以边阅读边思考如何修改一般代码,还可以通过与理想代码的对比明白如何优化代码。