Hadoop海量数据处理(技术原理与项目实践)

Hadoop海量数据处理(技术原理与项目实践)
作者: 许政|
出版社: 清华大学
原售价: 99.80
折扣价: 76.85
折扣购买: Hadoop海量数据处理(技术原理与项目实践)
ISBN: 9787302666943

作者简介

许政 毕业于哈尔滨工业大学,获硕士学位。现居深圳,任某一线大厂大数据架构师。参加工作以来,带领团队完成了多个百亿级大数据平台的建设。在实时计算方面有深厚的实践经验。熟悉多种大数据技术框架,如Hadoop、Spark、Flink、Elasticsearch、Kafka、HBase、ZooKeeper等。被CSDN评为优秀博主,撰写了大数据技术相关博文100余篇,博客访问量高达240多万。运维自己的独立博客网站。在大数据实时处理技术和人工智能算法方面有深入的研究,申请发明专利10余项。

内容简介

"国内某一线大厂资深大数据架构师多年项目实战经验的总结,理论结合实践,深入剖析Hadoop海量数据处理的核心技术。 内容全面:全面涵盖Hadoop基础知识和Hadoop分布式文件系统(HDFS),以及MapReduce分布式编程框架和YARN资源调度器等内容,帮助读者全面掌握Hadoop海量数据处理的核心技术。 讲解深入:不仅系统地剖析Hadoop海量数据处理技术原理,还从代码层面深入地分析Hadoop系统的实现过程,并分析HDFS和MapReduce的每一步操作,帮助读者洞悉其工作机制与运行原理。 实用性强:讲解理论知识时穿插100多个典型示例,帮助读者深入理解Hadoop海量数据处理技术的精髓。另外,通过Hadoop高可用集群搭建和经典的统计TopN案例构建两个实战项目,帮助读者上手实践,从而提高实际项目开发水平。 适用面广:无论是Hadoop初学者,还是开发人员、数据分析人员、大数据工程师和数据科学家等相关从业人员,都可以从本书中获得需要的知识和技能。 前瞻性强:基于Hadoop 3.x版写作,内容新颖,技术前瞻,不但介绍纠删码和NameNode Federation联邦机制等Hadoop 3.x的新特性,而且对比Hadoop不同版本之间的差异。"