技术教育社区
www.teccses.org

PYTHON数据分析

封面

作者:王俊 著

页数:314

出版社:机械工业出版社

出版日期:2025

ISBN:9787111770671

电子书格式:pdf/epub/txt

网盘下载地址:下载PYTHON数据分析

内容简介

本书系统介绍了使用Python进行数据分析需要掌握的各项知识,涵盖了Python基础知识、网络爬虫技术、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy与Pandas处理数据、数据可视化技术、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。本书通过结合数据分析技术的理论知识与Python的实战应用,帮助读者更好地运用Python解决数据分析中的实际问题。
本书适合作为高等院校工商管理类研究生、本科生的数据分析课程教材,还适合作为金融行业人员的参考资料。

作者简介

王俊,现为西南财经大学管理科学与工程学院副教授,硕士生导师,西南财经大学金融科技国际联合实验室主任助理,金融智能与金融工程四川省重点实验室主任助理,加拿大纽芬兰纪念大学访问学者。致力于从大数据分析视角,通过大机器学习、数据分析、人工智能等方法解决金融市场的重要问题。主要研究包括多源数据对证券市场的影响性分析,大数据视角的数字化互动媒体对股票市场的影响性研究、基于大数据的证券市场量化分析研究、基于海量数据的媒体信息识别与情感量化分析研究等。迄今为止,已发表英文学术论文10余篇,参与国家自然科学基金项目3项,国家重点科研项目1项,部级、省级重点科研项目5项。同时,王俊多次受邀参加国际学术会议(全球信息系统年会-ICIS、亚洲信息系统年会-PACIS、全球管理学顶尖年会-HICSS),前往美国夏威夷、日本东京、韩国首尔、马来西亚兰卡威等地区进行论文发表讲演,还作为国内外学术期刊IEEE Network Magazine、Association for Computational Linguistics、Journal of Global Information Management(JGIM)、系统工程理论与实践的审稿人参与稿件评审。

本书特色

本书系统介绍了使用Python进行数据分析需要掌握的各项知识,涵盖了Python基础知识、网络爬虫、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy进行科学计算、使用Pandas处理数据、数据可视化、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。

目录

目 录前言第1章 数据分析导论 / 11.1 面向财经领域的数据分析 / 11.2 数据分析工作流程与案例赏析 / 21.2.1 数据分析的工作流程 / 21.2.2 数据分析的案例赏析 / 31.3 扩展阅读 / 61.3.1 大数据驱动的决策范式转变 / 61.3.2 使用大语言模型做数据分析 / 6第2章 Python基础知识 / 82.1 数据类型 / 8目 录前言第1章 数据分析导论 / 11.1 面向财经领域的数据分析 / 11.2 数据分析工作流程与案例赏析 / 21.2.1 数据分析的工作流程 / 21.2.2 数据分析的案例赏析 / 31.3 扩展阅读 / 61.3.1 大数据驱动的决策范式转变 / 61.3.2 使用大语言模型做数据分析 / 6第2章 Python基础知识 / 82.1 数据类型 / 82.1.1 数值 / 92.1.2 字符串 / 102.1.3 列表 / 132.1.4 元组 / 152.1.5 集合 / 162.1.6 字典 / 162.2 运算法则 / 182.2.1 算术运算 / 182.2.2 逻辑运算 / 192.2.3 比较运算 / 192.3 条件语句 / 192.4 循环语句 / 202.4.1 while循环 / 202.4.2 for循环 / 212.5 终止语句 / 222.6 函数构造和参数 / 222.6.1 自定义函数 / 222.6.2 自定义函数的参数 / 232.6.3 局部和全局变量 / 252.6.4 Lambda函数 / 252.7 扩展阅读 / 252.7.1 应用ChatGLM开发聊天机器人 / 252.7.2 使用ChatGPT辅助学习Python / 27第3章 网络爬虫 / 293.1 网络爬虫概述 / 293.2 网页结构 / 313.2.1 服务器与本地交换机制 / 313.2.2 HTML / 313.3 获取网页内容 / 343.3.1 通过Requests发送请求 / 343.3.2 在URL中传递参数 / 353.3.3 添加Headers / 363.4 利用爬虫获取股吧评论数据 / 363.5 扩展阅读 / 393.5.1 常见的反爬机制与解决方案 / 393.5.2 使用ChatGPT辅助开发网络爬虫 / 40第4章 正则表达式 / 424.1 初识正则表达式 / 424.1.1 什么是正则表达式 / 424.1.2 构建简单的正则表达式 / 434.2 正则表达式进阶 / 444.3 使用正则表达式解析HTML网页 / 484.4 扩展阅读 / 49第5章 BeautifulSoup和JSON / 515.1 BeautifulSoup基本语法 / 515.1.1 创建BeautifulSoup对象 / 525.1.2 提取标签信息 / 535.2 使用BeautifulSoup解析HTML网页 / 545.3 JSON / 565.3.1 JSON的特点 / 565.3.2 JSON的结构 / 565.3.3 JSON序列化与反序列化 / 575.3.4 解析在线API返回的JSON数据 / 585.4 扩展阅读 / 58第6章 词语切分 / 606.1 分词简介 / 606.1.1 最大匹配法分词 / 616.1.2 基于统计的分词 / 626.2 Jieba分词 / 646.2.1 Jieba分词简介 / 646.2.2 使用Jieba分词 / 666.3 读取文件并切词 / 696.4 下载网页数据并切词 / 716.5 扩展阅读 / 736.5.1 Jieba分词算法细节 / 736.5.2 使用大语言模型切词 / 73第7章 自然语言处理简介 / 757.1 TF-IDF / 757.1.1 TF-IDF原理 / 767.1.2 TF-IDF案例 / 777.2 词袋法 / 787.3 情感分析 / 797.3.1 定义函数创建词袋 / 817.3.2 使用Python实现词袋法 / 827.4 扩展阅读 / 837.4.1 词嵌入 / 837.4.2 使用ChatGPT做文本分析 / 83第8章 使用NumPy进行科学计算 / 858.1 创建数组 / 858.1.1 安装NumPy / 858.1.2 列表和数组 / 868.1.3 创建并探索NumPy数组 / 878.1.4 创建特殊NumPy数组 / 898.1.5 导入并查看titanic数据集 / 918.2 数组切片 / 938.2.1 索引和切片 / 938.2.2 数组切片和列表切片 / 948.2.3 数组拼接 / 958.3 数组计算 / 968.3.1 广播 / 978.3.2 数组的绝对值与均值 / 978.3.3 点积 / 978.4 词语相似度计算 / 998.5 手写数字案例 / 1018.5.1 初步探索数据集 / 1028.5.2 数据标准化 / 1028.5.3 图像翻转 / 1038.6 金融案例分析 / 1048.6.1 读取文件 / 1048.6.2 计算成交量加权平均价格 / 1058.6.3 计算最大值和最小值 / 1058.6.4 计算极差 / 1068.6.5 计算中位数 / 1068.6.6 计算方差 / 1068.7 扩展阅读 / 107第9章 使用Pandas处理数据 / 1099.1 序列和数据框 / 1099.1.1 创建序列 / 1099.1.2 创建数据框 / 1119.1.3 使用Pandas读取和存储数据 / 1129.2 用Pandas处理数据 / 1149.2.1 关于INVEST部门的投资任务 / 1149.2.2 查看数据 / 1159.2.3 数据切片 / 1169.2.4 数据类型转换 / 1189.2.5 数据的增删改 / 1209.3 用Pandas处理文本数据 / 123

赞助用户下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《PYTHON数据分析》
Article link:https://www.teccses.org/30413.html