技术教育社区
www.teccses.org

大数据技术基础实验

封面

作者:欧中洪,宋美娜,鄂海红编著

页数:248页

出版社:北京邮电大学出版社

出版日期:2020

ISBN:9787563558735

电子书格式:pdf/epub/txt

内容简介

本书主要包括大数据关键技术和系统软件, Linux操作系统的安装方法, Hadoop分布式框架的安装和使用方法, HDFS分布式文件系统的编程方法, HBase分布式数据库的安装和基础编程方法, No—SQL数据库的安装和基础编程方法, MapReduce分布式框架的基础编程方法, Hive数据仓库的安装和使用方法, Spark基于内存的分布式计算框架的安装和基础编程方法, 典型可视化工具的安装和使用方法, 数据采集工具的安装和使用方法, 大数据课程综合实验等。

作者简介

欧中洪,北京邮电大学计算机学院副院长,副教授;科技部现代服务业共性服务联盟副秘书长,中国通信标准化协会TC11 VR/AR子工作组副组长,中国互联网协会青年专家。长期从事大数据分析、人工智能与深度学习、云计算与分布式系统等方面的研究工作。研究成果曾被BBC News,ACM TechNews,The Registry等国际知名媒体报道。主持或承担国家重点研发计划、国家科技支撑计划、国家自然科学基金项目等多项,发表高水平学术论文60余篇,其中SCI检索20余篇。担任多个国际知名期刊的审稿人,多个国际知名学术会议的程序委员会主席或委员。

目录

第1章大数据存储:分布式文件系统及NoSQL数据库实验教程1

1.1HDFS常用操作1

1.2HBase的安装6

1.3HBase的Shell连接与数据操作7

1.4Redis数据库的安装和使用11

1.5MongoDB数据库的安装和使用17

1.6Neo4j数据库的安装和使用22

第2章大数据处理:MapReduce处理框架实验教程27

2.1实验目的27

2.2实验要求27

2.3预备知识27

2.4实验内容(5个实验)28

2.5实验作业64

2.6扩展资料65

2.7参考答案78

第3章大数据处理:分布式处理框架Spark实验教程79

3.1Spark安装79

3.2Spark瞫hell83

3.3Spark Scala87

3.4Spark Python99

3.5Spark MLlib103

第4章大数据处理:实时处理框架实验教程110

4.1Storm伪分布式部署及其基本操作110

4.2Flume安装及其基本操作124

4.3Kafka安装及其基本操作131

4.4Spark Streaming安装及其基本操作135

4.5Flink安装及其基本操作150

第5章大数据分析:分布式数据查询实验教程164

5.1Hive的数据导入与数据查询164

5.2Druid的安装171

5.3Druid的数据摄入与数据查询175

5.4Drill的部署181

5.5Drill命令行与PyDrill的基础使用183

第6章大数据分析:Kylin多维分析实验教程186

6.1Kylin的安装186

6.2Demo案例实战189

6.3多维分析的Cube创建实战193

6.4通过RESTful访问Kylin208

第7章大数据可视化实验教程215

7.1ECharts数据可视化215

7.2Plotly数据可视化218

7.3D3.js绘制知识图谱222

第8章大数据综合实验案例231

8.1案例简介231

8.2实验步骤232

8.3数据集下载232

8.4数据集导入数据仓库Hive233

8.5Hive数据分析237

8.6数据挖掘240

参考文献247

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《大数据技术基础实验》
Article link:https://www.teccses.org/1111075.html