Cloudera Hadoop大数据平台实战指南 pdf扫描版

内容简介

对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。本书的切入点明确而清晰,从Hadoop 生态系统的明星 Cloudera 入手,逐步引出各类大数据基础和核心应用框架。 本书分为18章,系统介绍Hadoop 生态系统大数据相关的知识,包括大数据概述、Cloudera Hadoop平台的安装部署、HDFS分布式文件系统、MapReduce计算框架、资源管理调度框架YARN 、Hive数据仓库、数据迁移工具Sqoop、分布式数据库HBase、ZooKeeper分布式协调服务、准实时分析系统Impala、日志采集工具Flume、分布式消息系统Kafka、ETL工具Kettle、Spark计算框架等内容,*后给出两个综合实操案例,以巩固前面所学的知识点。 本书既适合Hadoop初学者、大数据技术工程师和大数据技术爱好者自学使用,亦可作为高等院校和培训机构大数据相关课程的培训用书。

作者简介

宋立桓,连续十届微软最有价值专家MVP、系统集成高级项目经理、大数据与云计算培训讲师、微软技术大会动手实验讲师,有20年的工作经验,曾服务于微软担任合作伙伴技术顾问。目前在腾讯,担任腾讯云解决方案架构师。
陈建平,曾担任IBM(上海)高级数据分析经理,资深技术讲师,10年相关项目经历,长期从事大数据相关研究分析工作。

验证获取

请扫码关注微信公众号
发送“验证码”获取验证码

编程开发

.NET性能优化 pdf高清扫描

2020-2-24 12:57:24

编程开发

NB-IoT物联网技术解析与案例详解 pdf高清版

2020-2-24 13:22:40

搜索