
作者:(美)怀特(White, T.) 著,周敏奇,钱卫宁,金澈清,王晓玲 译.
页数:600
出版社:清华大学出版社
出版日期:2011
ISBN:9787302257585
电子书格式:pdf/epub/txt
内容简介
本书从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;hadoop分布式文件系统;hadoop的i/o、mapreduce应用程序开发;mapreduce的工作机制;mapreduce的类型和格式;mapreduce的特性;如何构建hadoop集群,如何管理hadoop;pig简介;hbase简介;hive简介;zookeeper简介;开源工具sqoop,最后还提供了丰富的案例分析。
本书是hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行hadoop集群。
目录
第1章 初识hadoop
数据!数据!
数据存储与分析
与其他系统相比
关系型数据库管理系统
网格计算
志愿计算
1.3.4 hadoop 发展简史
apache hadoop和hadoop生态圈
第2章 关于mapreduce
一个气象数据集
数据的格式
使用unix工具进行数据分析
使用hadoop分析数据
map阶段和reduce阶段
数据!数据!
数据存储与分析
与其他系统相比
关系型数据库管理系统
网格计算
志愿计算
1.3.4 hadoop 发展简史
apache hadoop和hadoop生态圈
第2章 关于mapreduce
一个气象数据集
数据的格式
使用unix工具进行数据分析
使用hadoop分析数据
map阶段和reduce阶段















