
作者:吕晓玲宋捷
页数:344
出版社:中国人民大学出版社
出版日期:2019
ISBN:9787300264066
电子书格式:pdf/epub/txt
内容简介
本课程的教学内容主要包括聚类、关联、降维、变量选择、分类与预测、集成算法、图模型与推荐系统等。每一部分都是本课程授课的主要内容,都力求深入浅出,精讲细讲,不光讲解各种方法的过程与原理,还要加强学生对各种方法的深入理解。
作者简介
吕晓玲,吉林省吉林市人。现任中国人民大学统计学院教授,北京五校联合大数据分析硕士培养协同创新平台总协调人。本科与硕士毕业于南开大学数学系概率统计专业,博士毕业于香港城市大学管理科学系。曾经是奥地利约翰开普勒大学应用统计系以及美国加州大学伯克利分校统计系访问学者。一直从事数据挖掘和统计机器学习领域的理论研究,及其在消费者行为方面的应用研究。在数据挖掘以及市场营销方面的项目涉及的领域包括银行、电子商务、交通、教育、广播电视、移动互联网等。
宋捷,四川眉山人。现任首都经济贸易大学统计学院副教授。本科与硕士毕业于四川大学数学系概率统计专业,博士毕业于中国人民大学统计学院。一直从事机器学习与数据挖掘相关领域的研究工作。
目录
1.1 名词演化
1.2 基本内容
1.3 数据智慧
第2章 线性回归方法
2.1 多元线性回归
2.2 压缩方法:岭回归与Lasso
2.3 Lasso模型的求解与理论性质
2.4 损失函数加罚的建模框架
2.5 上机实践
2.6 上机实践:Python
第3章 线性分类方法
3.1 分类问题综述与评价准则
3.2 Logistic回归
3.3 线性判别
3.4 上机实践
3.5 上机实践:Python
第4章 模型评价与选择
4.1 基本概念
4.2 。理论方法
4.3 数据重利用方法
4.4 上机实践
4.5 上机实践:Python
第5章 决策树与组合方法
5.1 决策树
5.2 Bagging
5.3 Boosting
5.4 随机森林
5.5 上机实践
5.6 上机实践:Python
第6章 神经网络与深度学习
6.1 神经网络
6.2 深度信念网
6.3 卷积神经网络
6.4 上机实践
6.5 上机实践:Python
第7章 支持向量机
7.1 线性可分支持向量机
7.2 软间隔支持向量机
7.3 一些拓展
7.4 上机实践
7.5 上机实践:Python
第8章 聚类分析
8.1 基于距离的聚类
8.2 基于模型和密度的聚类
8.3 稀疏聚类
8.4 双向聚类
8.5 上机实践
8.6 上机实践:Python
第9章 推荐系统9.1 基于邻居的推荐
9.2 潜在因子与矩阵分解算法
9.3 上机实践
9.4 上机实践:Python
第10章 大数据案例分析
10.1 智能手机用户监测数据案例分析
10.2 美国航空数据案例分析
10.3 美国纽约公共自行车数据案例分析
参考文献















