
作者:黄天春、刘振栋、宋建华、周希宸、阳攀、曹
页数:212
出版社:清华大学出版社
出版日期:2022
ISBN:9787302606932
电子书格式:pdf/epub/txt
内容简介
《大数据开发基础与实践(微课版)》从初学者角度详细介绍了大数据开发的基础知识和对应的项目开发实践。全书共七个项目开发案例。个项目是大数据集群环境搭建,包括Linux虚拟机、JDK环境、Zookeeper、Hadoop、HBase、Spark等平台的安装和配置;第二个项目是数据仓库构建,包括MySQL、Hive的安装与配置;第三个项目是Java访问Hadoop实践,包括Java访问HDFS文件系统和MapReduce编程实践;第四个项目是大数据采集实践,包括利用Python编程语言、Request库采集网页数据,并介绍利用XPath等技术对数据进行采集的方法;第五个项目是大数据清洗实践,包括利用编程方式和Kettle工具对数据进行清洗;第六个项目是大数据分析实践,包括利用Hive和Spark对数据进行清洗;第七个项目是大数据可视化实践,包括利用Excel和ECharts对数据进行可视化。
通过以上七个项目的开发与应用实践,将会提高读者的大数据开发应用实践能力。《大数据开发基础与实践(微课版)》配备教学PPT、教学视频、教学补充案例等资源。为了帮助读者更好地学习书中的内容,还提供了在线答疑。
《大数据开发基础与实践(微课版)》基础理论与实践相结合,内容深入浅出,并配合实际的项目,适合致力于大数据开发方向的编程爱好者使用,也适用于高职高专以及应用型本科学生作为大数据教程。
作者简介
黄天春,工信部项目管理师(高级)、重庆城市职业学院副教授,工信部系统集成项目经理,IBM认证的WebSphere架构师,从事软件开发和高校教学20年,主持重庆市市级重点课题5项目,主编出版大数据专业教材2本。
本书特色
《大数据开发基础与实践(微课版)》重点围绕Hadoop 3.0版本集群环境的搭建为基础,介绍Hadoop的三大组件HDFS、MapReduce、YARN,突出其原理和编程实践,通过实例介绍HDFS的存储原理,再介绍通过MApReduce来实现离线计算。此外再介绍与Hadoop紧密相联系的两个平台列式数据库HBASE和Hive数据仓库,分别介绍其安装配置、存储、分析使用原理,适合大数据专业学生作为专业教材和大数据入门爱好者作为学习指导书。并且配套资源丰富,本书提供教学大纲、教学课件、电子教案、习题解答、程序源码等多种教学资源,对重要的知识点和操作方法并提供视频讲解,扫描书中对应的二维码可以在线观看、学习。
通过七个项目的开发与应用实践,提高读者的大数据开发应用实践能力
目录
项目知识
知识1.1大数据处理框架
1.1.1大数据的基本概念
1.1.2大数据处理框架分类
1.1.3大数据处理框架的选择
知识1.2组件介绍
1.2.1Hadoop分布式系统框架
1.2.2Hadoop生态圈
1.2.3Hadoop典型应用架构
项目实施
任务1安装Linux系统
1任务简介
2相关知识
3任务实施
4任务拓展
任务2安装JDK1.8
1任务简介
2相关知识
……















