数据采集与处理:基于Python

数据采集与处理:基于Python
作者: 付东普
出版社: 中国人民大学
原售价: 39.00
折扣价: 29.30
折扣购买: 数据采集与处理:基于Python
ISBN: 9787300325682

作者简介

付东普,首都经济贸易大学管理工程学院副教授,中国人民大学管理学博士,北京交通大学应用经济学博士后,高级系统架构设计师。研究领域包括电子商务、消费者行为和互联网金融,讲授课程包括数据分析理论与实践、数据采集与存储、互联网金融、管理信息系统、现代软件工程等。在《管理科学学报》《经济管理》《经济与管理研究》、Electronic Commerce Research等国内外学术期刊及国际会议发表论文20余篇,出版专著2部。有十多年软件开发、设计和管理经验,成功完成了多个数据分析项目。

内容简介

数据可视化是艺术与技术的结合。它将各种数据用图形化的方式呈现出来,为用户展示已知数据之间的规律、趋势和相关关系,帮助用户认识数据,发现这些数据反映的实质。因此,数据可视化是数据探索性分析的重要组成部分,有助于用户发现数据之间的分布特征、相互关系和总体趋势,为进一步的数据处理和分析提供直观参考。
比如,使用pyecharts可以让开发者轻松地实现大数据的可视化。例如,用pyecharts的v 1.x版本绘制四个商家衬衫、羊毛衫、雪纺衫、裤子、高跟鞋、袜子的销量的柱状图,相关代码及结果如下:
import random
import pyecharts.options as opts
from pyecharts.charts import Bar
x_vals = ['衬衫', '羊毛衫', '雪纺衫', '裤子', '高跟鞋', '袜子']
bar = (
Bar()
.add_xaxis(x_vals)
.add_yaxis('商家A', [random.randint(10, 100) for_in range(6)])
.add_yaxis('商家B', [random.randint(10, 100) for_in range(6)])
.add_yaxis('商家C', [random.randint(10, 100) for_in range(6)])
.add_yaxis('商家D', [random.randint(10, 100) for_in range(6)])
.set_series_opts(label_opts=opts.LabelOpts(is_show=True, font_size=14), markline_opts=opts. MarkLineOpts(data=[opts.MarkLineItem(y=40, name=\"达标线=40\")]))
.set_global_opts(title_opts=opts.TitleOpts(title='柱状图示例-销量', subtitle='四个商家'), xaxis_opts=opts.AxisOpts(name='商品'),yaxis_opts=opts.AxisOpts(name='单位:件')))
bar.render('柱状图.html')