技术教育社区
www.teccses.org

中国电力出版社精通AZURE数据分析

封面

作者:ZoinerTejada著

页数:384

出版社:中国电力出版社

出版日期:2017

ISBN:9787519820978

电子书格式:pdf/epub/txt

内容简介

理解如何存储超大规模数据。设计并实施可提供快速“热”查询和准确“冷”结果的解决方案。以批量数据处理、实时微批量或一次处理一个元组的方式处理实时数据。将机器学习与你的数据管道相集成。数据资产的管理、治理和安全。使用示例代码,这些代码由C#、Scala、Java,以及现代数据分析管道中各种服务所使用的原生语言编写。

作者简介

Zoiner Tejada,架构师,拥有超过18年软件行业咨询经验,在云计算、大数据、数据分析和机器学习方面拥有卓越见解。鉴于他在Azure和数据平台(Data Platform)两个方面的贡献,Microsoft在这两个领域都向他授予了MVP(Microsoft有价值专家)称号。

本书特色

Microsoft Azure在存储、处理和分析不同摄取速度、形态和大小的数据方面提供了超过25种平台即服务(PaaS)功能,用以实现数据分析管道。对于你的公司业务来说,该如何选择恰当的功能呢?针对如何建立Azure大数据分析解决方案这一问题,本书提供了极具实践性的参考框架。
本书作者介绍了包括数据湖和Lambda架构在内的基本概念,同时结合示例代码详细解释了数据分析管道中的各个阶段。为了帮助你在数据分析的各个阶段中选择适当的Azure服务,本书还通过一个案例场景对全书内容进行了扩展,对书中所涉及的各项Azure服务,以示例代码的形式展示了它们在现实世界中的真实用例。

目录

目录

序1

前言3

第1章 企业数据分析基础7

数据分析管道7

数据湖8

Lambda架构9

Kappa架构11

在Lambda和Kappa间进行选择12

Azure分析管道12

数据分析场景介绍15

示例代码和示例数据集16

小结21

第2章 将数据导入Azure22

摄取加载层22

批量数据加载24

硬盘传送24

流数据加载78

小结80

第3章 在Azure中存储摄取的数据81

文件存储81

队列存储97

小结124

第4章 Azure中的实时数据处理125

流处理125

在Azure中每次处理一个元组131

小结174

第5章 Azure中的实时微批处理176

Azure中的微批处理176

小结207

第6章 Azure中的批处理208

HDInsight上的MapReduce批处理210

HDInsight上的Hive批处理214

HDInsight上的Pig批处理228

HDInsight上的Spark批处理229

使用SQL数据仓库的批处理237

使用数据湖分析的批处理247

Azure Batch批处理258

小结260

第7章 Azure中的交互式查询261

Azure SQL数据仓库的可交互式查询263

Hive和Tez交互式查询269

Spark SQL交互式查询277

USQL交互式查询281

小结284

第8章 Azure中的冷热访问服务层285

Azure Redis缓存287

Document DB294

SQL 数据库300

SQL数据仓库308

HDInsight上的HBase309

Azure搜索314

小结315

第9章 智能和机器学习316

Azure机器学习319

HDInsight上的R服务321

SQL R服务321

Microsoft认知服务322

小结334

第10章 Azure中的元数据管理335

使用Azure数据目录管理元数据335

小结350

第11章 保护在Azure中的数据351

身份和访问管理351

数据保护353

审计355

小结356

第12章 执行数据分析357

使用Power BI进行分析357

在蓝色天际机场场景中使用Power BI批量分析报表368

展望372

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《中国电力出版社精通AZURE数据分析》
Article link:https://www.teccses.org/935229.html