Python网络爬虫与数据分析从入门到实践
作者简介
马国俊,计算专业硕士,教授,从业20余年,主要从事大数据技术的教学、项目开发与研究工作,先后在国内外刊物发表学术论文40余篇,获取软件著作权3项;主持、参与各类项目5项,获得奖项若干。
内容简介
突出特色是实战,所有知识点都配合案例并给出详细操作,所有代码都有注释,可以说学习无障碍、无痛苦。 涉及多种流行的热门框架,包括爬虫框架如Urllib、BeautifulSoup、Scrapy,常用的数据分析库如Numpy、Pandas、Matplotlib等都进行了详细介绍。 全流程讲解,从获取数据、数据预处理到数据分析和数据可视化,面面俱到。 技术先进,除常用数据处理方法,还介绍了当前热门的中文文本处理,以及热门的机器学习算法在数据分析中的应用。 本书给出了大量示例和项目,可以帮助读者掌握一线技能,真正解决工作中遇到的问题。