技术教育社区
www.teccses.org

Python数据分析、挖掘与可视化

封面

作者:毋建军

页数:340

出版社:机械工业出版社

出版日期:2021

ISBN:9787111687108

电子书格式:pdf/epub/txt

内容简介

《Python数据分析、挖掘与可视化》从大数据分析实际业务流程出发,利用案例贯穿介绍了大数据分析应具备的基础开发技术,包括Python基础、Python高级开发技术、数据采集与存储、数据预处理、数据分析、数据可视化、数据挖掘等;详细介绍了基于Python的数据分析全流程技术和相关机器学习算法;并通过社交用户画像挖掘案例,介绍了从应用场景需求分析→社交数据分析→用户画像构建的开发方法和过程,以及基于Flask框架、用户属性、神经网络挖掘的社交用户数据分析和画像构建过程。
《Python数据分析、挖掘与可视化》既可作为高等院校人工智能、计算机、大数据等专业的相关课程的教材,也可作为大数据分析人员的技术参考书。

本书特色

适读人群 :人工智能、计算机、大数据等专业学生本书特色:
★从大数据分析实际业务流程出发,利用案例贯穿介绍了大数据分析应具备的基础开发技术。
★基于Python的数据分析全流程技术和相关机器学习算法。
★从项目实战出发,介绍了从应用场景需求分析→社交数据分析→用户画像构建的开发方法和过程。

目录

前言

第1章 Python基础1

11 Python概述1

12 Python大数据应用3

121 Python与大数据技术3

122 常用行业数据集6

123 嵌入式开发应用6

124 数据挖掘及应用7

125 机器学习及应用8

126 数据分析未来发展9

13 搭建Python开发环境10

131 Python开发环境系统要求10

132 Windows系统平台下搭建开发环境10

133 Linux系统平台下搭建开发环境12

134 Mac系统平台下搭建开发环境13

14 Python集成开发平台14

15 Python常用库概述18

151 Python库简介18

152 Python库安装及集成19

153 Python数据分析工具21

16 创建Python程序21

161 在Anaconda下创建Python程序22

162 命令行创建Python程序25

163 Python运行在移动终端25

164 创建Python嵌入式程序27

习题28

第2章 Python高级开发29

21 字符串29

211 字符串及格式化29

212 字符串常用方法32

213 字符串匹配与正则表达式匹配33

214 字符串应用35

22 文本处理35

221 读写JSON数据35

222 读写CSV数据37

223 解析XML数据38

224 字典转XML数据42

225 文本处理应用43

23 文件和流45

231 打开文件及模式45

232 文件处理方法46

233 文件应用47

24 网络及Web应用48

241 创建TCP、UDP服务器48

242 RPC远程访问51

243 Python动态网站应用52

25 Python图形绘制55

251 Python GUI简介55

252 wxPython安装及配置55

253 wxPython应用55

254 PySimpleGUI及Jython应用58

26 Python测试及框架60

习题63

第3章 Python数据采集与存储64

31 数据采集简介64

311 数据源概述64

312 常用的爬虫框架66

313 社交网站信息采集75

32 Python数据存储78

321 文本格式存储78

322 文本存储应用80

323 二进制格式存储80

324 二进制存储应用81

33 数据库存储81

331 Python 常用数据库简介82

332 MongoDB及应用82

333 Redis及应用93

334 SQLite及应用102

335 PyTables 及应用108

336 社交数据存储112

34 案例:租房数据采集与存储113

习题115

第4章 Python数据预处理116

41 数据预处理及工具简介116

411 预处理基础116

412 预处理方法117

413 预处理技术118

414 垃圾短信分类预处理120

42 NumPy122

421 NumPy安装及配置123

422 NumPy的数据存取123

423 NumPy的矩阵构建126

424 NumPy 的矩阵运算128

425 NumPy的数学统计131

426 NumPy的排序运算134

427 NumPy处理缺失项136

43 pandas137

431 pandas安装及配置138

432 pandas数据结构141

433 pandas 数据加载和存储142

434 pandas数值计算与排序144

435 pandas数据索引构建147

436 pandas复杂数据结构148

437 书目信息索引149

44 SciPy150

441 SciPy安装及配置151

442 SciPy的文件输入与输出152

443 SciPy的特殊函数应用152

444 SciPy的线性代数运算153

445 SciPy的快速傅里叶变换154

446 SciPy的优化和拟合155

45 案例:社交网站数据预处理157

习题162

第5章 Python数据分析163

51 数据分析简介163

511 数据分析发展163

512 数据分析主流技术164

513 数据分析应用领域166

52 Python 数据分析库167

521 scikit-learn167

522 statsmodels170

523 Gensim172

524 Keras174

525 社交网站数据分析177

53 分类178

531 分类简介179

532 常用分类算法179

533 分类评价标准181

534 新闻分类182

54 回归184

541 回归简介184

542 常用回归算法185

543 回归评价标准187

544 房屋价格回归分析188

55 聚类189

551 聚类简介189

552 典型聚类算法189

553 聚类评价标准191

554 用户社区聚类分析192

56 机器学习基础194

561 机器学习简介194

562 常见机器学习算法195

563 主流应用框架196

564 Theano 应用198

57 案例:购物网站用户态度及情感分析199

习题201

第6章 Python 数据可视化202

61 数据可视化简介202

611 数据可视化定义202

612 数据可视化发展203

613 数据可视化分类204

614 数据可视化应用205

62 数据可视化基础206

621 数据可视化基本流程206

622 主流数据可视化分析技术207

623 人口迁移数据可视化209

63 数据可视化开发工具210

631 matplotlib210

632 NetworkX213

633 seaborn214

634 ggplot216

635 Bokeh217

636 Pygal219

637 Plotly221

638 pyecharts224

64 数据可视化分析框架227

65 案例:话题漂移可视化228

习题232

第7章 Python数据挖掘与应用233

71 数据挖掘简介233

711 Python数据挖掘基础234

712 文本分词236

713 Gensim文本主题挖掘237

714 新词发现242

72 Python视频数据处理244

721 常见视频数据处理算法244

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《Python数据分析、挖掘与可视化》
Article link:https://www.teccses.org/1292584.html