技术教育社区
www.teccses.org

Hadoop生态系统

封面

作者:KevinSitto

页数:124

出版社:中国电力出版社

出版日期:2016

ISBN:9787512395985

电子书格式:pdf/epub/txt

内容简介

如果你的组织即将开始进入大数据的世界,那么可能不仅需要决定Apache Hadoop这个平台是否适合使用,还需要决定Hadoop中哪些组件最适合完成你的任务。本书将帮助你更容易地完成这项工作。本书将Hadoop的生态系统分解为一个个简略的、容易理解的小段内容,以便读者可以快速理解Hadoop项目、子项目及其相关技术是如何一起工作的。

作者简介

Kevin Sitto是Pivotal Software公司的领域解决方案工程师,主要为客户提供咨询服务,帮助客户理解和描述大数据需求。
Marshall Presser是Pivotal Data Engineering集团的成员。他帮助客户使用Hadoop、关系数据库和内存数据网格来解决复杂的分析问题。

本书特色

本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
数据库和数据管理。Cassandra、HBase、MongoDB和Hive。
序列化。Avro、JSON和Parquet。
管理和监视。Puppet、Chef、Zookeeper和Oozie。
分析辅助。Pig、Mahout和MLLib。
数据传输。Scoop、Flume、distcp和Storm。本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
数据库和数据管理。Cassandra、HBase、MongoDB和Hive。
序列化。Avro、JSON和Parquet。
管理和监视。Puppet、Chef、Zookeeper和Oozie。
分析辅助。Pig、Mahout和MLLib。
数据传输。Scoop、Flume、distcp和Storm。
安全、访问控制和审计。Sentry、Kerberos和Knox。
云计算和虚拟化。Serengeti、Docker和Whirr。信息

目录

前言 1
第1章关键技术 7
11 Hadoop分布式文件系统(HDFS) 8
12 MapReduce 11

13 YARN 13

14 Spark 15

第2章数据库及数据管理 17
21 Cassandra 19

22 HBase 21
前言 1
第1章关键技术 7
11 Hadoop分布式文件系统(HDFS) 8
12 MapReduce 11

13 YARN 13

14 Spark 15

第2章数据库及数据管理 17
21 Cassandra 19

22 HBase 21

23 Accumulo 24

24 Memcached 26

25 Blur 28

26 Solr 30

27 MongoDB 32

28 Hive 34

29 Spark SQL ( 前身是 Shark) 36
210 Giraph 38

第3章序列化 41
31 Avro 43

32 JSON 46

33 Protocol Buffers (protobuf) 48

34 Parquet 50

第4章管理与监控 53
41 Ambari 54

42 HCatalog 56

43 Nagios 58

44 Puppet 59

45 Chef 61

46 ZooKeeper 63

47 Oozie 66

48 Ganglia 68

第5章分析辅助 69
51 MapReduce 接口69
52 分析库 70
53 Pig 72

54 Hadoop Streaming 74

55 Mahout 76

56 MLLib 78

57 Hadoop 图像处理接口(HIPI) 80
58 SpatialHadoop 81

第6章数据传输 83
61 Sqoop 85

62 Flume 87

63 DistCp 89

64 Storm 90

第7章安全、访问控制和审计 93
71 Sentry 95

72 Kerberos 97

73 Knox 99

第8章云计算和虚拟化 101
81 Serengeti 103
82 Docker105

83 Whirr 107信息

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《Hadoop生态系统》
Article link:https://www.teccses.org/692524.html