数据清洗(大数据应用人才培养系列教材)

数据清洗(大数据应用人才培养系列教材)
作者: 编者:李法平|总主编:刘鹏//张燕
出版社: 清华大学
原售价: 58.00
折扣价: 40.60
折扣购买: 数据清洗(大数据应用人才培养系列教材)
ISBN: 9787302493273

作者简介

李法平- 副教授/系统分析师,硕士,重庆电子工程职业学院软件学院移动应用开发教研室主任,主要从事高职软件类专业教学研究、教育信息化系统和企业信息化系统等应用技术研究。

内容简介

数据清洗是大数据技术不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行“清理”,把“脏”的数据变为“干净”的数据。本书详细讲解了ETL技术方法和常用工具、常用的数据清洗工具、数据抽取、数据转换与加载、对Web数据的采集、对RDBMS数据的清洗操作。目前市面上此类书还很少,对数据清洗从业人员是一本不可多得的技术参考书,也可以作为应用型院校的课程教材。