技术教育社区
www.teccses.org

大数据原理与实战

封面

作者:赵渝强

页数:476

出版社:中国水利水电出版社

出版日期:2021

ISBN:9787522600116

电子书格式:pdf/epub/txt

内容简介

6.2-大数据分析引擎Pig 6.3-大数据分析引擎Presto 6.4-大数据分析引擎Spark SQL 6.5-大数据分析引擎Flink Table & SQL 七、分布式协调服务ZooKeeper 八、数据的ETL采集框架 九、消息系统Kafka 1. 大数据核心理论基础与架构 1.1-什么是大数据 1.2-Hadoop的理论基础 1.3-大数据生态圈组件 1.4-基于大数据平台组件的平台架构2. 大数据存储系统 2.1-分布式文件系统HDFS 2.2-NoSQL数据库之HBase3. 大数据离线计算引擎 3..1-分布式计算模型MapReduce 3.2-离线计算引擎Spark Core 3.3-批处理引擎Flink DataSet API4. 大数据实时计算引擎 4.1-大数据流式计算引擎Spark Streaming 4.2-大数据流式计算引擎Flink DataStream API5. 大数据分析引擎 5.1-大数据分析引擎Hive 5.2-大数据分析引擎Pig 5.3-大数据分析引擎Presto 5.4-大数据分析引擎Spark SQL 5.5-大数据分析引擎Flink Table & SQL

作者简介

赵渝强(网名赵强),IT技术专家和培训讲师,清华大学计算机软件工程专业毕业。18年以上的IT行业从业经历,京东大学大数据学院院长,Oracle中国有限公司高级技术顾问,华为认证讲师。曾在BEA、甲骨文、摩托罗拉等世界500强企业担任高级软件架构师或咨询顾问等一搜西。

本书特色

1. 深入浅出:从基础概念入手再到原理深入;2.注重原理:通过图文详解大数据平台的体系架构与运行机制;3. 实战部署:Step by Step演示大数据环境的部署;4.案例丰富:大量大数据应用程序设计案例;5.系统全面:完整包含大数据平台生态体系内容;6.代码详尽:详细代码注释,便于理解

目录

第1章大数据核心理论基础与架构
1.1大数据概述
1.1.1大数据的基本概念和特性
1.1.2大数据平台所要解决的核心问题
1.1.3数据仓库与大数据
1.2大数据的理论基础
1.2.1Google文件系统
1.2.2MapReduce分布式计算模型
1.2.3BigTable分布式数据库
1.3大数据生态圈组件
1.3.1Hadoop生态圈
1.3.2Spark生态圈
1.3.3Flink生态圈
1.4基于大数据组件的平台架构
第2章部署大数据环境
2.1准备大数据平台环境
2.1.1安装Linux操作系统
……

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《大数据原理与实战》
Article link:https://www.teccses.org/1326106.html