技术教育社区
www.teccses.org

Hadoop大数据平台构建与应用

封面

作者:米洪,陈永

页数:179

出版社:高等教育出版社

出版日期:2021

ISBN:9787040491005

电子书格式:pdf/epub/txt

内容简介

本书基于Hadoop大数据平台,讲解大数据平台的搭建与运维、大数据的采集与存储、大数据的处理、数据的分析、数据的可视化等完整的大数据应用案例,讲述Hadoop、MapReduee、HDFS、Hive和Sqoop等技术的相关知识,并讨论了Mahout大数据分析中的常用算法——K—means聚类算法、Canopy聚类算法、欧氏距离算法、余弦距离算法、皮尔逊相关系数算法、TF—IDF加权算法等的使用及相关学情分析系统中算法的实现等。

目录

项目1 认识大数据,实现学情分析系统设计与环境搭建
学习目标
学习情境
任务1.1 设计学情分析系统
任务描述
任务目标
知识准备
任务实施
项目实训
任务1.2 构建学情分析系统开发环境
任务描述
任务目标
知识准备
任务实施
项目实训
项目小结
项目2 Hadoop大数据平台的构建
学习目标
学习情境
任务2.1 搭建Ambari Hadoop系统
任务描述
任务目标
知识准备
任务实施
项目实训
任务2.2 使用Apache Ambari管理Hadop集群
任务描述
任务目标
知识准备
任务实施
项目实训
项目小结
项目3 就业岗位数据的采集和存储
学习目标
学习情境
任务3.1 使用网络爬虫采集岗位招聘数据
任务描述
任务目标
知识准备
任务实施
项目实训
任务3.2 将采集的数据上传到HDFS
任务描述
任务目标
知识准备
任务实施
项目实训
任务3.3 使用Sqoop转换MySQL中的学生数据到Hive中
任务描述
任务目标

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《Hadoop大数据平台构建与应用》
Article link:https://www.teccses.org/1245472.html