作者:郭胜,余鹏,段平
页数:228
出版社:湖南师范大学出版社
出版日期:2020
ISBN:9787566717801
电子书格式:pdf/epub/txt
内容简介
本书共分三个部分18个实验章节。第一部分是大数据技术基础篇,讲解了Linux操作系统的安装与常用命令操作,Hadoop系统的安装与部署,HDFS常用命令操作与基础编程,MapReduce初级编程实践,HBase的安装,命令操作和基础编程,数据仓库Hive的安装与使用,数据转换工具Sqoop的安装与使用,网络爬虫技术基础实践。第二部分是数据挖掘技术篇,主要围绕数据挖掘处理算法进行算法实现实训练习,包括:WEKA的使用与数据准备、基于关联规则的数据挖掘、分类与回归方法的数据挖掘、基于聚类分析的数据挖掘、K-Means聚类算法实现、DBSCAN算法实现、ID3算法实现、贝叶斯算法实现、Apriori算法实现。第三部分是应用案例篇,主要讲解了一个典型的网络购物体验行为分析的综合应用案例。















