Scala和Spark大数据分析（函数式编程数据流和机器学习）/大数据应用与技术丛书

出版时间 2020-06-01T00:00 其他语言 18092

作者： (德)雷扎尔·卡里姆//(美)斯里达尔·阿拉|责编:王军|译者:
出版社： 清华大学
原售价: 158.00
折扣价: 112.20
折扣购买: Scala和Spark大数据分析（函数式编程数据流和机器学习）/大数据应用与技术丛书
ISBN： 9787302551966

作者简介

\"Md. Rezaul Karim 是德国Fraunhofer FIT的研究学者，也是德国亚琛工业大学的博士学位研究生预科生。他拥有计算机科学的学士与硕士学位。在加盟Fraunhofer FIT之前，他曾作为研究员任职于爱尔兰的数据分析深入研究中心。更早之前，他还担任过三星电子公司全球研究中心的首席工程师；该研究中心分布于韩国、印度、越南、土耳其以及孟加拉。再早之前，他还在韩国庆熙大学的数据库实验室担任过助理研究员，在韩国的BMTech21公司担任过研发工程师，在孟加拉国的i2软件技术公司担任过软件工程师。 Karim拥有超过8年的研发领域工作经验，并在如下算法和数据结构领域具有深厚的技术背景：C/C++、Java、Scala、R、Python、Docker、Mesos、Zeppelin、Hadoop以及MapReduce，并深入学习了如下技术：Spark、Kafka、DC/OS、DeepLearning4j以及H2O-Sparking Water。他的研究兴趣包括机器学习、深度学习、语义网络、关联数据(Linked Data)、大数据以及生物信息学。同时，他还是Packt出版社出版的以下两本书籍的作者： ● Large-Scale Machine Learning with Spark ● Deep Learning with TensorFlow 我非常感激我的父母，是他们一直鼓励我去不断追求新知识。也想感谢妻子Saroar、儿子Shadman，以及哥哥Mamtaz和姐姐Josna，还有我的朋友们。因为他们总得长时间地忍受我关于《Scala和Spark大数据分析函数式编程、数据流和机器学习》内容的一些独白，还要鼓励我。另外，由于开源社区的令人赞叹的努力，以及Apache Spark和Scala相关的一些项目的卓越技术文档的存在，都使得《Scala和Spark大数据分析函数式编程、数据流和机器学习》的写作变得颇为容易。也要感谢Packt出版社的组稿、文稿以及技术编辑们(当然还有其他为《Scala和Spark大数据分析函数式编程、数据流和机器学习》做出贡献的出版社人员)，感谢他们真挚的沟通与协调。此外，若没有大量的研究人员和数据分析实践者们在出版物和各种演讲中分享自己的工作内容，公开自己的源代码，《Scala和Spark大数据分析函数式编程、数据流和机器学习》只怕也是无法面世的。 Sridhar Alla是一位大数据专家，他曾帮助大大小小的诸多公司解决各种复杂的问题，例如数据仓库、数据治理、安全、实时数据处理、高频率的交易系统以及建立大规模的数据科学实践项目等。他也是敏捷技术的实践者，是一位获得认证的敏捷DevOps实践者和实施者。他在美国网域存储公司，以存储软件工程师的身份开始了自己的职业生涯。然后成为位于波士顿的eIQNetworks公司的CTO，该公司是一家网络安全公司。在他的履历表中，还包括曾担任位于费城的Comcast公司的数据科学与工程总监。他是很多会议或者活动(如Hadoop World、Spark峰会等)的热心参与者，在多项技术上提供面授/在线培训。他在美国商标专利局(US PTO)也有多项专利技术，内容涉及大规模计算与分布式系统等。他还持有印度尼赫鲁科技大学计算机科学方向的学士学位。目前，他和妻子居住在新泽西州。 Alla在Scala、Java、C、C++、Python、R以及Go语言上有超过18年的编程经验，他的技术研究范围也扩展到Spark、Hadoop、Cassandra、HBase、MongoDB、Riak、Redis、Zeppelin、Mesos、Docker、Kafka、ElasticSearch、Solr、H2O、机器学习、文本分析、分布式计算以及高性能计算等领域。我要感谢我贤惠的妻子Rosie Sarkaria，在我写作《Scala和Spark大数据分析函数式编程、数据流和机器学习》的数个月中，她给了我无尽的爱与耐心，并给我写的内容进行了无数次的校订。我也想感谢父母Ravi和Lakshmi Alla，他们也在一直支持我和鼓励我。也要感谢我的朋友们，尤其是Abrar Hashmi和Christian Ludwig，他们不断地给我提供灵感并让我清晰地阐述书中的多个主题。如果没有神奇的Apache基金会，以及那些让Spark变得如此强大与优雅的大数据相关人员们，《Scala和Spark大数据分析函数式编程、数据流和机器学习》就无法付诸笔端了。我还要感谢Packt出版社的组稿、文稿以及技术编辑们(当然还有其他为《Scala和Spark大数据分析函数式编程、数据流和机器学习》做出贡献的出版社人员)，感谢他们真挚的沟通与协调。 \"

内容简介

\"近年来，Scala得以迅速流行，在数据科学和分析领域势头更盛。基于Scala的Spark被广泛应用于生产环境，海量数据的分析可瞬间完成！本书全面系统地介绍Spark应用开发的面向对象和函数式编程概念，指导你用Scala编写强大的Spark程序。本书瞄准最前沿的技术，包含Spark SQL、结构流、graphX和Spark MLib等所有API。本书面向想利用Scala和Spark执行数据分析的人士。 ? 本书包含大量精妙的、紧贴实用的大数据分析问题，并说明如何使用Hadoop生态系统上的Scala解决这些问题。 ? 一本十分有用的大块头书籍，它呈现概念，并透彻地讲述如何实现概念。 ? 本书内容丰富，讨论了PySpark、SparkR、Alixuio和Zeppelin，包罗一切。 ? 学习将函数式编程和面向对象概念融为一体的精妙Scala类型系统。 ? 处理大范围的应用，从简单的批处理、流处理乃至机器学习 ? 分析最常见的用例和一些复杂用例，使用Spark执行大规模数据分析 \"

作者简介

内容简介

猜你喜欢