
作者:常国珍
页数:171
出版社:电子工业出版社
出版日期:2015
ISBN:9787121252433
电子书格式:pdf/epub/txt
内容简介
cda数据分析师丛书按照数据分析师规范化学习体系而定,对于一名初学者,应该先掌握必要的概率、统计理论基础,包括描述性分析,推断性分析,参数估计,假设检验,方差分析,回归分析等内容,这在第一本书《从零进阶!数据分析的统计基础》中进行了专业详细的讲解。其次,数据分析需要按照标准流程进行,即数据的获取、储存、整理、清洗、归约等系列数据处理技术,这在《如虎添翼!数据处理的sas eg实现》中利用sas eg和编程技术进行了操作过程的详解。最后,经过处理的数据需要根据业务问题,利用相关方法进行建模分析,得出结果,结果检验,绘制图表并解读数据,这在《胸有成竹!数据分析的sas eg进阶》中进行了详细的讲解和操作分析。
cda数据分析师丛书整体风格是“理论>技术>应用”的一个学习过程,最终目的在于商业业务应用、职场数据分析,为欲从事于数据分析领域的各界人士提供了一个规范化数据分析师的学习体系。
作者简介
人大经济论坛:于2003年成立,致力于推动经管学科的进步,传播优秀教育资源,目前已经发展成为国内最大的经济、管理、金融、统计类的在线教育和咨询网站,也是国内最活跃和最具影响力的经管类网络社区。
人大经济论坛从2006年起在国内最早开展数据分析培训,累计培训学员数万人,在大数据的趋势背景下,作为Certified Data Analyst Institute(注册数据分析师协会,简称CDA协会)的中国唯一授权中心,根据CDA协会的数据分析师LevelⅠ(业务分析师)、Level Ⅱ(建模分析师)、Level Ⅲ(数据专家)的等级标准,致力于培养正规化、科学化、专业化的数据分析师队伍,为企事业单位输送更多优秀数据分析人才。(Certified Data Analyst Institute,亦称“注册数据分析师协会”,成立于美国特拉华州,主要宗旨为汇聚国际先进的数据分析技术,建设国际性规范化数据分析师职业标准,推进数据分析师的行业发展及认证工作,目前标准行业认证为CDA数据分析师)
常国珍,北京大学光华管理学院会计学在读博士生,北京大学人口研究所社会学硕士,河北联合大学土木工程专业学士。德勤管理咨询公司兼职咨询顾问,SAS资深培训讲师。曾以数据挖掘工程师身份就职于亚信科技(中国)有限公司市场部。具有八年的数据挖掘实战经验,主要从事电信和银行业数据挖掘工作。项目涉及客户精准营销、信用评估、欺诈侦测和流失预警等,尤其熟悉银行个人客户精准营销的建模工作。
本书特色
《胸有成竹!数据分析的sas eg进阶》共5章,涉及使用sas eg做数据分析的主要分析方法。其中,第1章为数据分析方法概述,第2章至第4章为横截面数据分析方法。第5章为时间序列分析方法。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的思考和练习题。
《胸有成竹!数据分析的sas eg进阶》是一本面向商业数据分析初学者的教材,从具体的商业数据分析案例入手,使读者掌握数据分析的目的、理念、思路与分析步骤。本书力图淡化技术,对于方法的介绍也尽量避免涉及过多的数学内容,和高等数学相关的内容只在线形回归和主成分分析这两节中涉及到,而且都辅以图形作形象的展现。因此本书的读者只需要具有高中水平的数学基础即可。
目录
第1章 数据分析方法概述 1<br>1.1 数据分析概述 2<br>1.1.1 数据分析过程 2<br>1.1.2 数据分析的商业驱动 3<br>1.2 数据分析与挖掘方法分类介绍 5<br>1.2.1 描述性——无监督的学习 7<br>1.2.2 预测性——有监督的学习 10<br>1.3 数据分析的方法论 12<br>1.3.1 数据挖掘的项目管理方法论:crisp-dm 13<br>1.3.2 数据整理与建模的方法论:semma 14<br>1.3.3 sas eg任务菜单编排与semma之间的关系 16<br>第2章 描述数据特征 18<br>2.1 认识数据类型 19<br>2.2 单变量描述统计方法 20<br>2.2.1 分类变量的描述 21<br>2.2.2 连续变量的描述 21<br>2.3 创建频数报表 31<br>2.4 生成汇总统计量 33<br>2.5 用汇总表任务生成汇总报表 35<br>2.6 绘制条形图 37<br>2.7 绘制地图 41<br>第3章 描述性数据分析/挖掘方法 45<br>3.1 客户细分方法介绍 46<br>3.1.1 客户细分的意义 46<br>3.1.2 根据客户利润贡献进行划分 47<br>3.1.3 根据个人或公司的生命历程进行划分 48<br>3.1.4 根据客户的产品偏好进行划分 49<br>3.1.5 根据客户交易/消费行为进行划分 50<br>3.1.6 根据客户的多维行为属性细分 51<br>3.1.7 展现客户/产品结构的战略细分 51<br>3.1.8 客户细分:综合运用 52<br>3.2 连续变量间关系探索与变量约减 52<br>3.2.1 多元统计基础 52<br>3.2.2 多元变量压缩的思路 56<br>3.2.3 主成分分析 58<br>3.2.4 因子分析 66<br>3.3 聚类分析 72<br>3.3.1 基本逻辑 74<br>3.3.2 系统聚类 74<br>3.3.3 快速聚类 81<br>第4章 预测性数据分析方法 87<br>4.1 构造对连续变量的预测模型 88<br>4.1.1 方差分析(anova) 88<br>4.1.2 线性回归 99<br>4.1.3 线性回归的模型诊断 111<br>4.2 构造对二分类变量的预测模型 119<br>4.2.1 分类变量之间的相关性检验 119<br>4.2.2 逻辑回归 123<br>4.3 数据挖掘流程及示例 135<br>第5章 时间序列 143<br>5.1 认识时间序列和趋势分解法 144<br>5.2 平稳时间序列(arma)模型设定与识别 147<br>5.2.1 平稳时间序列定义 147<br>5.2.2 平稳时间序列模型建模 148<br>5.2.3 arma的模型设定与识别 148<br>5.3 非平稳时间序列(arima)模型 152<br>5.4 时间序列建模步骤 153<br>附录a 数据说明 160<br>附录b cda(注册数据分析师)致力于最好的数据分析人才建设 167<br>参考文献<br>















