
作者:侯勇
页数:240
出版社:西南交通大学出版社
出版日期:2020
ISBN:9787564374341
电子书格式:pdf/epub/txt
内容简介
随着数据获取和计算技术的发展,大数据已成为一种新的国家战略资源。大数据专业人才的培养是世界各国新一轮科技较量的基础,高等院校承担着大数据人才培养的重任,需要及时建立起大数据课程体系,为社会培养和输送一大批具备大数据专业素养的高级人才,满足社会对大数据人才日益旺盛的需求。本书首先讲述大数据概念、特点、价值、重要性,接着介绍Hadoop、HBase、Hive、Spark,然后详细讲解大数据技术在机器学习中的应用,包括大数据基础理念和常见工具,大数据处理流程、方法和技术等。本书主要作为高等院校计算机专业、信息管理专业、经济类专业、管理类专业相关本科生专业基础课的教材,也可以作为干部培训、职业技术教育以及职业培训机构的云计算与大数据分析技术专业训练教材。
作者简介
侯勇,博士,安徽蚌埠学院计算机工程学院副教授;出版教材3部,发表多篇文章被中国科学引文数据库(CSCD)收录或被EI检索;获大数据与人工智能类比赛(本科组)省赛一等奖、华信智原杯大学生程序设大赛三等奖。
目录
大数据技术篇
第1章 Hadoop
1.1 大数据概述
1.2 大数据解决方案
1.3 Hadoop简介
1.4 环境设置
1.5 多节点集群安装
1.6 HDFS概述
1.7 HDFS操作
1.8 命令参考
1.9 MapReduce
1.10 MapReduce在Hadoop上的实现
1.11 MapReduce分区器
1.12 COmbiner
1.13 Hadoop管理
1.14 应用程序接口
1.15 HadoopStreaming
第2章 HBase
2.1 HBase概述
2.2 HBase的架构
2.3 HBase的安装
2.4 HBaseShell
2.5 HBase的常用命令
2.6 Admin API
2.7 创建表
2.8 列表
2.9 禁用表
2.10 启用表
2.11 Describe与Alter命令
2.12 Exists命令
2.13 删除表
2.14 Exit命令
2.15 客户端API
2.16 创建数据
2.17 更新数据
2.18 读取数据
2.19 删除数据
2.20 扫描
2.21 Count和Truncate
2.22 安全
……
第3章 Hive
第4章 Spark
第1章 Hadoop
1.1 大数据概述
1.2 大数据解决方案
1.3 Hadoop简介
1.4 环境设置
1.5 多节点集群安装
1.6 HDFS概述
1.7 HDFS操作
1.8 命令参考
1.9 MapReduce
1.10 MapReduce在Hadoop上的实现
1.11 MapReduce分区器
1.12 COmbiner
1.13 Hadoop管理
1.14 应用程序接口
1.15 HadoopStreaming
第2章 HBase
2.1 HBase概述
2.2 HBase的架构
2.3 HBase的安装
2.4 HBaseShell
2.5 HBase的常用命令
2.6 Admin API
2.7 创建表
2.8 列表
2.9 禁用表
2.10 启用表
2.11 Describe与Alter命令
2.12 Exists命令
2.13 删除表
2.14 Exit命令
2.15 客户端API
2.16 创建数据
2.17 更新数据
2.18 读取数据
2.19 删除数据
2.20 扫描
2.21 Count和Truncate
2.22 安全
……
第3章 Hive
第4章 Spark
大数据技术应用篇
参考文献















