技术教育社区
www.teccses.org

数据挖掘与R语言-(原书第2版)

封面

作者:(葡)路易斯·托尔戈(LuisTorg

页数:343

出版社:机械工业出版社

出版日期:2018

ISBN:9787111596660

电子书格式:pdf/epub/txt

内容简介

本书面向初学者,通过实践案例讲解如何用R进行数据挖掘。全书包括两部分,第 一部分介绍R和数据挖掘的基础知识,第二部分为案例研究,通过预测海藻数量、预测股票市场收益、侦测欺诈交易以及微阵列样本分类四个案例培养构建解决方案的能力,掌握工具的使用技巧。本书适合作为高校学生或业界新手了解R和数据挖掘的入门读本,其中的代码和数据均可免费下载。

作者简介

路易斯·托尔戈(Luis Torgo) 加拿大达尔豪斯大学计算机科学系教授,葡萄牙波尔图大学计算机科学系副教授,纽约大学斯特恩商学院特邀教授,人工智能和数据分析实验室(LIAAD,隶属于INESC Tec)研究员。他拥有近30年的机器学习和数据挖掘研究经验,在基于树的回归方法和基于效用的预测方法方面贡献卓著。

—译者简介—
李洪成 统计学博士,现为上海金融学院副教授,R语言和SPSS统计分析软件专家,研究方向为金融统计和数据挖掘。他的代表著作有《SPSS数据分析教程》《时间序列预测实践教程》等,译著有《R并行编程实战》《机器学习与R语言》等。

本书特色

涵盖R和数据挖掘的基础知识,通过四个案例详细讲解数据处理、预测和分类方法,提供免费代码下载

目录

推荐序

中文版序

译者序

前言

致谢

1章 简介 1

1.1 如何阅读本书 2

1.2 重现性 2

一部分 R与数据挖掘简介

2章 R简介 6

2.1 R起步 6

2.2 与R控制台的简单交互 8

2.3 R对象和变量 9

2.4 R函数 11

2.5 向量 14

2.6 向量化 15

2.7 因子 16

2.8 生成序列 18

2.9 数据子集 20

2.10 矩阵和数组 22

2.11 列表 25

2.12 数据框 28

2.13 数据框的扩展 31

2.14 对象、类和方法 34

2.15 管理R会话 35

3章 数据挖掘简介 37

3.1 数据挖掘鸟瞰图 37

3.2 数据收集和业务理解 38

3.2.1 数据和数据集 39

3.2.2 导入数据到R 40

3.3 数据预处理 45

3.3.1 数据清洗 45

3.3.2 变换变量 53

3.3.3 生成变量 55

3.3.4 降维 66

3.4 建模 74

3.4.1 探索性数据分析 75

3.4.2 使用关联规则的依赖建模 94

3.4.3 聚类 101

3.4.4 异常检测 112

3.4.5 预测分析 120

3.5 评估 147

3.5.1 Holdout和随机子抽样 148

3.5.2 交叉验证 150

3.5.3 Bootstrap估计 153

3.5.4 推荐程序 154

3.6 报告和部署 155

3.6.1 通过动态文档进行报告 155

3.6.2 通过Web应用程序进行部署 158

二部分 数据挖掘案例研究

4章 预测海藻数量 164

4.1 问题描述与目标 164

4.2 数据说明 164

4.3 加载数据到R 165

4.4 数据可视化和总结 167

4.5 数据缺失 173

4.5.1 将缺失部分剔除 173

4.5.2 尝试找到缺失值有可能的赋值 175

4.5.3 通过变量的相关关系填补缺失值 176

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《数据挖掘与R语言-(原书第2版)》
Article link:https://www.teccses.org/883831.html