
出版社: 电子工业
原售价: 79.00
折扣价: 59.38
折扣购买: Tableau商业分析从新手到高手
ISBN: 9787121338366
“博易智讯”与“美智讯”均为“Bizinsight”旗下品牌。 Bizinsight自2006年成立以来,一直专注于数据分析与商业智能领域,为企业提供量化分析与全面数据应用的整体解决方案,是国内较早一批提供数据挖掘与大数据应用软件和服务的团队。签约客户覆盖多家世界500强公司与中国500强公司。 本书主要由我们的服务团队“美智讯”撰写。这是一个专业从事大数据版块的企业文化培养、员工技能培训、整体方案设计与技术服务外包实施团队。这个团队日常工作是协助客户做高效处理与深度分析,例如交易记录、网页点击、地理位置、物联网回传、语音语义等一切进入企业经营过程中的大数据。
2.3 拓展技术专题3:数据清理? 现实工作中,开始分析数据时,数据往往不像教科书或软件自带的数据示例那么好的质?量。即使是电商行业程序化系统自动留存的数据,大多数时候其中也会发现各种各样需要处?理的问题。 ?常见的数据质量问题包括但不限于:数据中的异常值、关键数据缺失、混合多数据源时?无法找到有效连接的关键字段等。在所有需要使用数据的场景中,无论数据可视化分析、商?业智能报表开发,还是更复杂的大数据建模,数据质量问题都是整个流程中必须面对的,并?且是最花费时间的工作。 ?Tableau提供了一些功能支持数据检查和数据预处理,包括在可视化工作区中直接隐藏?不需要的数据,以及在多表连接过程中,连接字段可以使用公式在数据源连接界面中直接对?数据进行重构。? 下面列举一些常见数据处理功能的应用。? 1.字符错误的整理 ?分类数据经常会出现大小写不一致(如tableauy-yTableau),错别字(如tableauy-y?Tableu),记录中前后存储了看不到的空格等问题(如tableauy-yyytableau)。这些错误在人?工观察时都不会造成太大困扰,我们的大脑会自动归纳和修正。但对电脑来说,这些都是不?同的记录,这和我们希望的处理方式不一致。针对此类问题,可以用Tableau公式中提供的?分组功能手动处理或者使用函数功能自动处理。 ?当有少量的记录不一致时,可以在Tableau中的“数据”面板有问题的字段上单击鼠标?右键,在弹出的菜单中选择创建组命令,手工将书写错误的相同数据记录归为一组,然后?重命名为一个正确的组名。例如:“Tableau”“Tableau工具”“Tableau软件”这三种记?录,可以重新归类为“Tableau软件”。 ?如果需要手工处理的比较多,可以创建计算字段,使用软件提供的函数来自动完成。例?如,字段中存储了很多名称,但大小写不统一,并且可能字段的首尾有不需要的空格,此类?问题,可以通过创建计算字段,输入公式“LOWER(TRIM(字段))”自动统一不规范的字段,?生成新的字段,免去大量的手工整理工作。 2.数据异常值的识别处理 ?通过散点图或者直方图可以很容易地识别数据中的“异常值”。如果数据展现的特征异?于群体,或者某条记录的值比多数值都大很多、这样的记录是不是真正的异常,需要根据业?务经验进行逻辑判断,然后再选择合适的处理方法。 一旦确定为异常值,Tableau中可以设置筛选条件过滤异常值。值的筛选有多种方式: ?(1)使用图表筛选器面板。将需要设置为筛选条件的字段拖动到筛选器面板,然后设置筛选条件,这样可以在数据表级别过滤掉一些不需要的异常记录。 (2)在数据连接源过滤数据。这样,所有使用同一数据源的数据表都会被过滤。例?如:在客户主题的优惠券分析中(在第8章会介绍),如果用券比率大于1,则为异常值,?应该过滤掉这类数据。可以在数据源视图中单击筛选器的编辑项目,对数据源总体添加一个?『用券比率』字段,并设置筛选条件“至多为1”。 (3)数据重构。数据重构就是实行行/列数据格式的转化。Tableau在数据源提供了一?个数据重构的功能。 众所周知,在2018 Gartner“分析和商业智能魔力象限”报告中,Tableau连续六年荣获“领导者”称号,并被评为直观交互式可视化分析的黄金标准。 《Tableau商业分析从新手到高手》尽量还原了一些现实商业分析场景,展现了在这些场景下如何结合数据和?Tableau的可视化技术,对多种商业问题进行探索和解答。希望通过这样的方式让读者更容?易学会使用Tableau,快速成为一名合格的分析师,而非软件操作匠人。