Python数据分析与大数据处理从入门到精通
作者简介
朱春旭,**软件工程师,长期对企业、软件开发公司、**机构培训大数据开发与应用课程,对Python大数据处理与分析相关应用有深入研究,并编写有《极客内参-大数据开发实战》教程45篇,总共30000+字。
内容简介
Python 的创始人是Guido van Rossum。1991 年,**个用C 语言开发的Python 编译器诞生。 1996 年,Python 发行了**个公开版本1.4。由于其简单、易用、可以移植等特点,Python 得到了飞速发展。在编写本书时,*新主要版本已经是3.7 版本。 Python 版本发布进程如下。 1996 年至2000 年,发布的Python 版本是 1.4-1.6。 2000 年至2008 年,发布的Python 版本是 2.0-2.7。 2008 年至2018 年,发布的Python 版本是 3.0-3.7。 请注意,2008 年后,Python 开始同时维护2.X 和3.X 两个版本。这是因为当时很多系统都不能正常升级到3.0 版本,于是后来开发了2.7 版本作为过渡。 Python 从诞生起就具有类、函数、异常处理、表、字典等核心数据类型,同时支持用“模块”来扩展功能。在Python 的发展进程中,开发者不断加入lambda、map、 f ilter 和reduce 等高阶函数,极大地丰富了Python 的API。同时引入了垃圾回收器等**功能,简化了程序员对内存的手动管理流程。 当前的版本中,Python 已经具备了以下重要的语言特性。 (1)有多种基本数据类型可供选择:数字(浮点数、复数和无限长整数)、字符串(ASCII和Unicode)、列表和字典。 (2)支持使用类和多继承的面向对象编程。 (3)代码可以分为模块和包。 (4)支持引发和捕获异常,从而实现*清晰的错误处理。 (5)数据类型是强类型和动态类型。混合不兼容的类型(如尝试添加字符串和数字)会导致异常,从而能够*快地捕获错误。 (6)包含**编程功能,如生成器和列表推导。 (7)其自动内存管理功能使用户不必在代码中手动分配和释放内存。 (1)全面:数据分析与大数据处理所需的所有技术,包含基础理论、核心概念、实施流程,从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算等。 (2)深入:一本书讲透1种编程语言和14种数据分析与大处理工具,以及大数据分析技术及项目开发方法。 (3)丰富:包含45个“新手问答”、17个章节的“实训”、3个项目综合实战、50道Python面试题精选。