
作者:陈明编著
页数:216页
出版社:北京师范大学出版社
出版日期:2018
ISBN:9787303234509
电子书格式:pdf/epub/txt
内容简介
本书分为15章, 主要包括数据科学与大数据技术概述、数据处理与存储、数据抽取技术、数据清洗技术、数据去噪与标准化技术、大数据约简技术、数据集成技术、数据分析技术、数据挖掘技术、分析结果解释、大数据机器学习、大数据推荐技术、社会网络、大数据离线计算、大数据流式计算等。本书在内容上, 注重概念、方法介绍, 实例丰富、语言精练、逻辑层次清晰。
作者简介
陈明,博士生导师,曾任吉林大学计算机科学系副教授、教研室主任;大连理工大学计算机科学与工程系教授、系主任;中国石油大学(北京)计算机科学与技术系教授、系主任。北京高校计算机与信息类专业群专家委员会委员兼教学协作委员会委员。
本书特色
本书是《数据科学与大数据技术导论实验》课程的实验教材,可以配合主教材使用。主要内容包括:Linux环境部署、Hadoop开发环境部署、网页数据采集、大数据去重、大数据最值计算、大数据排序、大数据倒排索引、大数据平均值计算、大数据单表关联、大数据可视化。
本书选材先进、特点鲜明,注重应用。通过本书所提供的实验练习,可以提高大数据处理能力。可用于大数据实验教材,也可以作为科学技术人员学习和应用大数据的科技参考书。
目录
实验1 Linux操作系统部署
实验2 Hadoop开发环境部署
实验3 网页数据获取
实验4 大数据去重
实验5 大数据最大值计算
实验6 大数据排序
实验7 Hadoop倒排索引
实验8 大数据平均值计算
实验9 大数据单表关联
实验10 大数据可视化
参考文献
实验2 Hadoop开发环境部署
实验3 网页数据获取
实验4 大数据去重
实验5 大数据最大值计算
实验6 大数据排序
实验7 Hadoop倒排索引
实验8 大数据平均值计算
实验9 大数据单表关联
实验10 大数据可视化
参考文献














