技术教育社区
www.teccses.org

Hadoop+Spark大数据技术

封面

作者:曾国荪 曹洁

页数:261

出版社:人民邮电出版社

出版日期:2022

ISBN:9787115583277

电子书格式:pdf/epub/txt

内容简介

本书主要讲解Hadoop的分布式文件系统、MapReduce编程模型和Spark大数据处理技术。全书共12章,具体包括大数据概述、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、HBase分布式数据库、Spark概述、基于Scala的Spark编程、Windows环境下Spark综合编程、Spark SQL结构化数据处理、Spark Streaming流计算、Spark GraphX图计算、项目实训:《平凡的世界》孙家人物关系图分析。 本书可作为高等院校计算机、信息管理、软件工程、大数据、人工智能等相关专业的大数据课程教材,也可供企业中从事大数据开发的工程师和科技工作者参考。

作者简介

同济大学计算机软件与理论专业博士,郑州轻工业大学软件学院教师。研究方向:数据分析、机器学习、并行分布式处理等。近年在软件学报、电子学报、计算机研究与发展、通信学报等核心刊物上发表学术论文10余篇,2019年7月在清华大学出版社以第一作者身份出版高等院校信息技术规划教材《Python语言程序设计(微课版)》

本书特色

1.融入应用场景,理论讲解与动手实践相结合。
2.适配大数据处理主流技术,提供大量实践案例。
3.基础知识+案例指导+综合应用。
本书结合编者多年的程序设计、系统开发与课程讲授的经验,由浅入深、循序渐进地展开,使读者能够系统、全面地掌握程序设计的理论与应用。

目录

第 1章 Python语言概述 1

1.1 Python语言特点 2

1.2 Python应用领域 3

1.3 下载和安装Python软件 3

1.4 编写和执行Python代码的方式 6

1.4.1 用命令行格式的Python Shell编写和执行代码 6

1.4.2 用带图形界面格式的Python Shell编写和执行交互式代码 7

1.4.3 用带图形界面格式的Python Shell编写和执行程序代码 8

1.5 Python注释 9

1.5.1 单行注释 9

1.5.2 多行注释 9

1.6 在线帮助 9

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《Hadoop+Spark大数据技术》
Article link:https://www.teccses.org/1398115.html