作者:宋立桓/陈建平
出版社:清华大学出版社
出版时间:2019.01
ISBN: 9787302517535
格式:PDF扫描版
豆瓣评分:0.0
内容简介
对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。本书的切入点明确而清晰,从Hadoop 生态系统的明星 Cloudera 入手,逐步引出各类大数据基础和核心应用框架。 本书分为18章,系统介绍Hadoop 生态系统大数据相关的知识,包括大数据概述、Cloudera Hadoop平台的安装部署、HDFS分布式文件系统、MapReduce计算框架、资源管理调度框架YARN 、Hive数据仓库、数据迁移工具Sqoop、分布式数据库HBase、ZooKeeper分布式协调服务、准实时分析系统Impala、日志采集工具Flume、分布式消息系统Kafka、ETL工具Kettle、Spark计算框架等内容,*后给出两个综合实操案例,以巩固前面所学的知识点。 本书既适合Hadoop初学者、大数据技术工程师和大数据技术爱好者自学使用,亦可作为高等院校和培训机构大数据相关课程的培训用书。
作者简介
宋立桓,连续十届微软最有价值专家MVP、系统集成高级项目经理、大数据与云计算培训讲师、微软技术大会动手实验讲师,有20年的工作经验,曾服务于微软担任合作伙伴技术顾问。目前在腾讯,担任腾讯云解决方案架构师。
陈建平,曾担任IBM(上海)高级数据分析经理,资深技术讲师,10年相关项目经历,长期从事大数据相关研究分析工作。