
作者:宋旭东主编宋亮
页数:320
出版社:清华大学出版社
出版日期:2020
ISBN:9787302557531
电子书格式:pdf/epub/txt
内容简介
本书系统介绍了大数据基础知识和相关技术,全书分为大数据概述篇、大数据存储与管理篇、大数据采集与预处理篇、大数据分析与挖掘篇、大数据平台Hadoop实践与案例分析篇。全书共15章,主要内容包括大数据基本概念、大数据存储与管理概念及技术、大数据采集及预处理技术、大数据计算模式、大数据分布式并行处理框架Hadoop、大数据分布式文件系统HDFS、大数据分布式数据库系统HBASE、大数据Hadoop平台操作实践及具体大数据预测应用案例分析。
作者简介
宋旭东,男,博士,大连交通大学软件学院教授,计算机科学与技术、软件工程专业硕士生导师,美国伍斯特理工学院国家公派访问学者,辽宁省高校优秀青年骨干教师,教育部学位与研究生教育评估评审专家,教育部科研基金和科技奖励评审专家。主要从事:大数据、人工智能、数据挖掘与决策支持系统等方面的研究工作,具有深厚的理论基础及较为丰富的科研经验。发表科研学术论文80多篇,出版教材9部,主持及参加过30多项科研项目。
本书特色
本书从大数据的基本概念、原理,以及存储、采集、挖掘及应用,做了详细的概述。适合于高等学校师生及技术爱好者。
目录
第一篇 大数据基础
第1章 大数据基本概念
1.1 大数据时代
1.1.1 大数据有多大
1.1.2 大数据的产生
1.1.3 大数据的发展历程
1.1.4 大数据对科学研究的影响
1.1.5 大数据对思维模式的影响
1.2 大数据的定义与特征
1.2.1 大数据的定义
1.2.2 大数据的数据特征
1.3 大数据的应用
1.3.1 大数据在科研领域的应用
1.3.2 大数据在交通领域的应用
1.3.3 大数据在通信领域的应用
1.3.4 大数据在医疗领域的应用
1.3.5 大数据在金融领域的应用
1.3.6 大数据在制造领域的应用
1.3.7 大数据在体育领域的应用
1.3.8 大数据在个性化生活领域的应用
1.3.9 大数据在安全领域的应用
1.4 大数据框架体系
1.4.1 大数据基础设施层
1.4.2 大数据采集层
1.4.3 大数据存储层
1.4.4 大数据处理层
1.4.5 大数据交互展示层
1.4.6 大数据应用层
1.5 大数据关键技术
1.5.1 数据采集与预处理技术
1.5.2 数据存储与管理技术
1.5.3 数据分析与挖掘技术
1.5.4 数据可视化技术
1.5.5 数据安全和隐私保护技术
1.6 大数据支撑技术
1.6.1 云计算
1.6.2 物联网
1.6.3 机器学习
习题
第2章 大数据平台Hadoop基础
2.1 大数据平台Hadoop概述
2.1.1 Hadoop简介
2.1.2 Hadoop项目起源
2.1.3 Hadoop发展历程
2.1.4 Hadoop特性
2.1.5 Hadoop主要用途
2.2 大数据平台Hadoop原理
2.2.1 分布式计算原理
2.2.2 MapReduce原理
2.2.3 Yarn原理
2.3 大数据平台Hadoop组件
2.3.1 HDFS组件
2.3.2 MapReduce组件
2.3.3 ZooKeeper组件
2.3.4 Yarn组件
2.3.5 HBase组件
2.3.6 Hive组件
2.3.7 Spark组件
2.3.8 Mahout组件
2.3.9 Flume组件
2.3.10 Sqoop组件
2.3.11 Kafka组件
2.3.12 Pig组件
2.3.13 Ambari组件
2.3.14 Tez组件
2.3.15 Common组件
习题
第二篇 大数据存储与管理
第3章 大数据存储与管理基本概念
第4章 大数据分布式文件系统
第5章 大数据分布式数据库系统HBase
第6章 大数据分布式数据仓库系统Hive
第三篇 大数据采集与预处理
第7章 大数据采集与预处理技术
第8章 大数据采集工具
第四篇 大数据分析与挖掘
第9章 大数据计算模式
第10章 大数据MapReduce计算模型
第11章 大数据Spark计算模型
第12章 大数据MapReduce基础算法
第13章 大数据挖掘算法
第五篇 大数据平台Hadoop实践与应用案例
第14章 Hadoop大数据平台实践
第15章 开敞式码头系泊作业缆力预测应用案例
第16章 曙光XData大数据平台及应用案例
参考文献
第1章 大数据基本概念
1.1 大数据时代
1.1.1 大数据有多大
1.1.2 大数据的产生
1.1.3 大数据的发展历程
1.1.4 大数据对科学研究的影响
1.1.5 大数据对思维模式的影响
1.2 大数据的定义与特征
1.2.1 大数据的定义
1.2.2 大数据的数据特征
1.3 大数据的应用
1.3.1 大数据在科研领域的应用
1.3.2 大数据在交通领域的应用
1.3.3 大数据在通信领域的应用
1.3.4 大数据在医疗领域的应用
1.3.5 大数据在金融领域的应用
1.3.6 大数据在制造领域的应用
1.3.7 大数据在体育领域的应用
1.3.8 大数据在个性化生活领域的应用
1.3.9 大数据在安全领域的应用
1.4 大数据框架体系
1.4.1 大数据基础设施层
1.4.2 大数据采集层
1.4.3 大数据存储层
1.4.4 大数据处理层
1.4.5 大数据交互展示层
1.4.6 大数据应用层
1.5 大数据关键技术
1.5.1 数据采集与预处理技术
1.5.2 数据存储与管理技术
1.5.3 数据分析与挖掘技术
1.5.4 数据可视化技术
1.5.5 数据安全和隐私保护技术
1.6 大数据支撑技术
1.6.1 云计算
1.6.2 物联网
1.6.3 机器学习
习题
第2章 大数据平台Hadoop基础
2.1 大数据平台Hadoop概述
2.1.1 Hadoop简介
2.1.2 Hadoop项目起源
2.1.3 Hadoop发展历程
2.1.4 Hadoop特性
2.1.5 Hadoop主要用途
2.2 大数据平台Hadoop原理
2.2.1 分布式计算原理
2.2.2 MapReduce原理
2.2.3 Yarn原理
2.3 大数据平台Hadoop组件
2.3.1 HDFS组件
2.3.2 MapReduce组件
2.3.3 ZooKeeper组件
2.3.4 Yarn组件
2.3.5 HBase组件
2.3.6 Hive组件
2.3.7 Spark组件
2.3.8 Mahout组件
2.3.9 Flume组件
2.3.10 Sqoop组件
2.3.11 Kafka组件
2.3.12 Pig组件
2.3.13 Ambari组件
2.3.14 Tez组件
2.3.15 Common组件
习题
第二篇 大数据存储与管理
第3章 大数据存储与管理基本概念
第4章 大数据分布式文件系统
第5章 大数据分布式数据库系统HBase
第6章 大数据分布式数据仓库系统Hive
第三篇 大数据采集与预处理
第7章 大数据采集与预处理技术
第8章 大数据采集工具
第四篇 大数据分析与挖掘
第9章 大数据计算模式
第10章 大数据MapReduce计算模型
第11章 大数据Spark计算模型
第12章 大数据MapReduce基础算法
第13章 大数据挖掘算法
第五篇 大数据平台Hadoop实践与应用案例
第14章 Hadoop大数据平台实践
第15章 开敞式码头系泊作业缆力预测应用案例
第16章 曙光XData大数据平台及应用案例
参考文献















