
作者:刘芳,王晓光主编
页数:165页
出版社:北京邮电大学出版社
出版日期:2023
ISBN:9787563568239
电子书格式:pdf/epub/txt
内容简介
本书介绍了大数据基础理论和Hadoop生态系统主流的大数据开发技术。全书共分9章,第1章介绍大数据的发展历程、概念和特点、关键技术和应用;第2章介绍Hadoop的起源、发展历程、特性、版本及应用;第3章介绍HDFS的概念、原理和应用;第4章介绍HBase的概念、原理和应用;第5章介绍Hive的概念、原理、架构和应用;第6章介绍分布式计算模型MapReduce的概念、工作流程和应用;第7章介绍Spark基本内容、Spark的生态系统及运行架构和Spark安装部署及编程实践;第8章介绍数据可视化的相关知识、数据可视化工具和应用;第9章介绍爬虫及词频统计的代码实现。
作者简介
王晓光,副教授,从事金融信息化的研究,主要讲授程序设计语言、软件工程、JavaEE等课程、大数据应用等课程。















