技术教育社区
www.teccses.org

Spark大数据分析与实战

封面

作者:郑述招主编

页数:279页

出版社:西安电子科技大学出版社

出版日期:2025

ISBN:9787560674858

电子书格式:pdf/epub/txt

网盘下载地址:下载Spark大数据分析与实战

内容简介

本书由教学与科研经验丰富的专任教师、企业资深工程师、全国职业技能大赛一等奖获得者共同编写。书中依据“项目引领、任务驱动”的思路,针对数据批量处理、流式处理、机器学习等Spark典型应用情境,设计了8个教学项目,涵盖Spark Core、Spark SQL、Spark Streaming、Structured Streaming、Spark Machine Learning等技术。其中每个项目细分为3~6个子任务,以保证技能提升的“平滑性”,契合初学者的认知规律。本书内容由浅入深,由实践到理论,再从理论回到实践,符合初学者的学习规律。同时,编者为了践行立德树人的时代担当,将思政元素有机融入项目教学,让读者在完成拓展项目的同时提升个人素养。
本书配套了微课视频、PPT课件、程序代码、数据集、教案、教学日历、考试样题、课程标准(大纲)等全套教学资源,以利于教师的教学。为了最大限度降低学习门槛,本书还提供了基于Linux的Spark虚拟机环境,可免去读者配置环境的烦恼。
本书可作为高等职业院校、应用型本科院校大数据相关课程的配套教材,也可作为Spark学习者的参考用书。

本书特色

Spark是Apache的顶级项目,相较于曾经引领大数据产业革命的Hadoop MapReduce框架,Spark取得了突破性的进步,在批处理、流处理、机器学习、图计算等领域高歌猛进,不断更新迭代。目前,Spark已经更新到3.5版本(本书成稿时刻),核心数据抽象由RDD过渡到DataFrame/Dataset;流式计算主推Structured Streaming,早期的Spark Streaming进入维护模式;机器学习领域主推Spark ML,以前使用的MLib进入维护模式。
为此,我们在本书再版的过程中将Spark版本升级,删除了部分陈旧的内容,新增了Structured Streaming流计算模块;同时基于“项目引领、任务驱动”的设计思想,更换了所有的教学项目,替换了80%的演示代码,重构了教材结构,重新制作了全套教学资料(含PPT、微课视频、代码、数据集等10余类),更新了知识检测题目及拓展案例,可完全满足教学需求。
本书的主要特点如下:
(1)对接国家专业教学标准及全国职业技能大赛。
本书编写团队包括大数据专业国家教学标准研制组核心成员、全国职业院校技能大赛一等奖获得者、大数据领域资深工程师,具有丰富的大数据教学、科研与应用经验。通过删繁就简,本书内容既涵盖了当前Spark应用热点,又满足了教育教学需求。
(2)采用“项目引领、任务驱动”的编写思路,蕴含项目式教法改革。
本书契合项目化教学之要求,精心设计了新能源汽车销售数据分析、碳排放数据处理、智慧交通数据处理、预测森林植被种类等8个项目;每个项目基本按照情境导入→项目分解→学习目标→任务分析→知识储备→任务实施→项目小结→知识检测→素养与拓展的过程展开,有利于教学改革的实施。
(3)提供了“教、学、做、练、用”一体化解决方案。
除了纸质教材及电子资源,本书还配套了Spark开发虚拟机平台(内含Spark、Hadoop、Kafka、Zookeeper、MySQL等组件及IntelliJ IDEA开发工具),免去了繁杂、易错的环境搭建过程,保证“轻松上手、真实体验”;每个项目最后的“素养与拓展”提供了一个拓展案例(对接真实业务场景),读者可综合利用所学知识,尝试独立完成案例实施。
(4)践行立德树人根本任务。

赞助用户下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《Spark大数据分析与实战》
Article link:https://www.teccses.org/39607.html