Python数据处理:如何又快又好
作者简介
Susan E. McGregor 是哥伦比亚大学数据科学研究所的研究员,也是该研究所数据、媒 体和社会中心的联合主管。十多年来,她一直在向非理工科的专业人士、研究生及本科 生讲授编程与数据分析课程,并不断完善自己的教学方式。 McGregor 于 2011 年加入哥伦比亚大学新闻学院及 Tow 数字新闻中心,此后,她一直在 哥伦比亚大学任教并从事研究工作。McGregor 开设了学院的首个数据新闻课程,并担任 新闻学及计算机科学双学位计划的导师。她主要研究与新闻工作者及媒体有关的安全及 隐私问题,她的第一本书 Information Security Essentials: A Guide for Reporters, Editors, and Newsroom Leaders(哥伦比亚大学出版社,2021)讨论的也是这个话题。 加入哥伦比亚大学之前,McGregor 在《华尔街日报》的 News Graphics 团队做了几年 资深程序员。她参与制作了该报的“ What They Know”系列,并由此获得 2011 年的 Gerald Loeb Award 奖。McGregor 在许多讨论安全及隐私的前沿学术会议上发言并发表 文章。她的工作受到美国国家科学基金会、奈特基金会(Knight Foundation)、Google 以 及哥伦比亚大学多个学院与机构的资助。McGregor 还关注如何运用艺术来激发批判思 维,以及如何通过艺术给技术问题带来新的思路。她拥有哈佛大学交互信息设计学士学 位及纽约大学教育传播与技术硕士学位。
内容简介
数据无处不在,它们蕴含着独特的信息和有价值的故事,本书将帮助你发掘它们。无论你已经开始处理数据,还是想要学习如何处理数据,都能通过本书中的示例与技术学会更好地清洗、评估并分析数据,以形成有意义的洞见,并制作出有说服力的可视化图表。 作者既讲解了基本概念,也给出了专业建议,并且提供了相应的资源来帮助大家学会提取、评估并分析各种数据源和数据格式。另外,作者还讲解了相应的工具,让你能够有效地与他人交流,让对方了解自己通过分析这些数据所得到的观点。本书没有艰深的术语,适合各种水平的数据从业者阅读,无论你是纯粹的新手还是有经验的专业人士,都可以通过本书学会如何驾驭数据。 通过学习本书,你将: ? 使用Python 3.8以上的版本读写和转换各种来源的数据。 ? 理解并使用基本的Python编程技术来整理大规模的数据。 ? 使用各种经验法则来组织代码的结构并为其撰写文档。 ? 从结构化数据文件、网页和API中收集数据。 ? 执行基本的统计分析,以便从数据集中得出有意义的结论。 ? 用清晰且具有说服力的方式可视化和展示数据。