技术教育社区
www.teccses.org

大数据应用开发案例实践教程

封面

作者:天津滨海迅腾科技集团有限公司

页数:267

出版社:天津大学出版社

出版日期:2021

ISBN:9787561868522

电子书格式:pdf/epub/txt

内容简介

  《2021版(新版)大数据应用开发案例实践教程》以不同类型数据的处理、分析为主线进行讲解,包含离线数据分析、实时数据分析和推荐系统制作等知识。《2021版(新版)大数据应用开发案例实践教程》知识点的讲解由浅入深,使每一位读者都能有所收获,也保证了知识深度。《2021版(新版)大数据应用开发案例实践教程》包含3个单元,即基于离线数据的处理与分析、基于实时数据的处理与分析、基于用户数据构建推荐系统。每个单元由不同的任务组成,单元1包括HBase冠字号查询系统、Hive航空公司客户价值数据预处理与分析、Pig股票交易数据处理;单元2包括ApacheFlink热门商品统计、ELK日志实时分析、StructuredStreaming职位需求信息实时统计,单元3则对SparkMLlib歌手推荐系统进行讲解。《2021版(新版)大数据应用开发案例实践教程》内容详细、条理清晰,每个任务都通过学习目标、学习路径、任务描述、任务技能、任务实施、任务总结、英语角和任务习题8个模块进行相应知识的讲解。其中,学习目标和学习路径模块对本任务包含的知识点进行简述,任务实施模块对本任务中的案例进行步骤化的讲解,任务总结模块作为最后陈述,对使用的技术和注意事项进行总结,英语角模块解释本任务中专业术语的含义,使读者全面掌握所讲内容。

目录

单元1 基于离线数据的处理与分析

任务1-1——HBase冠字号查询系统

学习目标

学习路径

任务描述

任务技能

技能点1 HBase指令

技能点2 HBase过滤器

技能点3 HBase数据导入与备份

技能点4 HBase性能优化

任务实施

任务总结

英语角

任务习题

任务1-2——Hive航空公司客户价值数据预处理与分析

学习目标

学习路径

任务描述

任务技能

技能点1 Hive数据查询

技能点2 内置函数

技能点3 引擎优化

任务实施

任务总结

英语角

任务习题

任务1-3——Pig股票交易数据处理

学习目标

学习路径

任务描述

任务技能

技能点1 Apache Pig概述

技能点2 Apache Pig配置与执行

技能点3 常用Pig L,atin操作

技能点4 关系运算符

技能点5 内置函数

任务实施

任务总结

英语角

任务习题

单元2 基于实时数据的处理与分析

任务2-1——Apache Flink热门商品统计

学习目标

学习路径

任务描述

任务技能

技能点1 Apache Flink简介与安装

技能点2 Flink批处理

任务实施

任务总结

英语角

任务习题

任务2-2——ELK日志实时分析

学习目标

学习路径

任务描述

任务技能

技能点1 Logstash数据分析软件

技能点2 Elasticsearch搜索服务器

技能点3 KJbana可视化平台

任务实施

任务总结

英语角

任务习题

任务2-3——Structured Streaming职位需求信息实时统计

学习目标

学习路径

任务描述

任务技能

技能点1 Structured Streaming简介

技能点2 Structured Streaming操作

技能点3 Structured Streaming管理

任务实施

任务总结

英语角

任务习题

……

单元3 基于用户数据构建推荐系统

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《大数据应用开发案例实践教程》
Article link:https://www.teccses.org/1235827.html