技术教育社区
www.teccses.org

Hadoop离线分析实战

封面

作者:聂强,付雯

页数:288

出版社:北京理工大学出版社

出版日期:2021

ISBN:9787568294898

电子书格式:pdf/epub/txt

内容简介

本书包含7个项目,项目一介绍数据管理技术的发展,项目二介绍Hadoop平台的搭建与安装,项目三介绍数据清洗技术,项目四介绍数据仓库Hive的使用,项目五介绍Flume的应用,项目六介绍海量数据传输工具Sqoop,项目七介绍Azkaban调度器。
全书以典型案例贯穿,采用任务驱动方式逐步进行教学设计,结合大赛、职业技能证书展开编写工作,知识点由浅人深、覆盖面广,适合大数据技术相关专业教学使用,同时,对专业爱好者来说也是一本不错的入门级参考资料。

作者简介

聂强,重庆电子工程职业学院院长,教授,获教学成果二等奖1项,重庆市教学成果二等奖1项;主持专业教学资源库1项,市教委课题8项;发表论文27篇,其中核心期刊20篇;出版教材4部。

目录

项目一 认识数据管理
项目描述
项目分析
任务1认识数据管理技术
任务2初识Hadoop
项目二 Hadoop平台的搭建与安装
项目描述
项目分析
任务1 Hadoop平台搭建基础
任务2 Hadoop集群规划
任务3 运行平台搭建
任务4 安装配置支持软件
任务5 安装配置:Hadoop
任务6 验证:Hadoop
项目三 数据清洗技术
项目描述
项目分析
任务1 HDFS分布式文件系统的体系架构和文件操作
任务2 MapReduce分布式计算系统的基本运行框架
任务3 YARN分布式资源管理平台的资源调度
项目四 数据仓库——Hive的搭建与应用
项目描述
项目分析
任务1 Hive搭建的准备工作
任务2 Hive组件的新增工作
任务3 用Hive来存储数据并执行查询分析
项目五 Flume的应用
项目描述
项目分析
任务1 Flume组件的安装
任务2 Flume的运行机制
任务3 Flume应用案例
项目六 Sqoop——海量数据传输工具使用
项目描述
项目分析
任务1 Sqoop组件的安装
任务2 Sqoop的数据导入与导出
项目七 Azkaban调度器
项目描述
项目分析
任务1 Azkaban的安装部署
任务2 导入数据库
任务3 验证Azkaban
任务4 构建工作流

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《Hadoop离线分析实战》
Article link:https://www.teccses.org/1297056.html