
作者:李显 李杰 宋东桓
页数:332
出版社:首都经济贸易大学出版社
出版日期:2023
ISBN:9787563835355
电子书格式:pdf/epub/txt
内容简介
Python 在数据处理和可视化方面拥有非常成熟的模块,使用这些模块可以轻松处理科研数据以及绘制丰富的图表。本书以打造实战型Python科学计量与知识图谱工具书为目标,力求使读者可以通过书中案例提供的解决思路,快速完成与科学计量相关的科研实践。本书一共分为三部分,共8章内容。第一部分包含第1、2章,重点介绍Python软件下载、安装、使用以及Python基础语法讲解;第二部分包含第3、4章,主要介绍5类科学文献数据的检索与下载方式,并结合MySQL和Navicat软件对5类文献数据进行综合管理案例的详解,第三部分基于科学文献数据的分析,包含了第5、6、7、8章,主要讲解了科学文献数据的描述性统计、文本挖掘与可视化以及知识网络分析。
作者简介
李显,上海海事大学博士研究生,数据分析师。著有数据分析方向书籍1本,CSDN博客专家。研究方向为船海事故数据挖掘与可视化,对科学计量学方面的应用有浓厚兴趣。发表学术论文数篇。
李杰, 博士,中国科学院文献情报中心副研究员,中国科学院大学信息资源管理系硕士生导师。北京科学技术情报学会理事,兼元科学专业委员会主任。科学计量与知识图谱丛书主编,出版有《CiteSpace科技文本挖掘及可视化》、《BibExcel科学计量与知识网络分析》以及《引文网络分析及可视化》等著作。
宋东桓,硕士,毕业于中国农业大学,现为中国科学院文献情报中心馆员。研究领域为数据采集与数据治理,并对Python语言在科学计量学方面的应用有浓厚兴趣。先后在国家级期刊发表学术论文数篇。
目录
1 Python安装与配置……………………………………………… 1
1.1
Anaconda软件的下载、安装与配置 …………………………… 2
1.2
Jupyter Notebook的配置与使用 ………………………………… 6
1.3
自带模块的使用 …………………………………………………10
1.4
第三方模块的安装与检验 ………………………………………11
2 Python基础……………………………………………………… 13
2.1
从数字开始 ………………………………………………………14
2.2
变量、语句和表达式 ……………………………………………17
2.3
常用数据类型 ……………………………………………………19
2.4
条件判断 …………………………………………………………27
2.5
循环 ………………………………………………………………29
2.6
异常处理 …………………………………………………………33
2.7
函数 ………………………………………………………………34
2.8
文件操作 …………………………………………………………35
3 科学计量数据采集 ……………………………………………… 37
3.1
Web of Science数据的采集 ………………………………………38
3.2
Scopus数据的采集 ………………………………………………42
3.3
PubMed数据的采集 ………………………………………………44
3.4
CSSCI数据的采集…………………………………………………47
3.5
CNKI数据的采集 …………………………………………………50
4 MySQL+ Navicat基础 ………………………………………… 55
4.1 资源文件及说明 …………………………………………………56
4.2 MySQL的安装与配置 ……………………………………………56
4.3 Navicat的安装与配置 ……………………………………………60
4.4 Python+MySQL+Navicat数据管理…………………………………71
5 metaknowledge文献数据分析基础 …………………………… 95
5.1 数据分析流程 ……………………………………………………96
5.2 功能模块导入 ……………………………………………………97
5.3 文献数据导入 ……………………………………………………97
5.4 数据异常处理 ……………………………………………………98
5.5 文献数据去重 ……………………………………………………99
5.6 单记录、引文及记录集合分析 …………………………………99
6 科学文献数据的描述性统计 ………………………………… 109
6.1 知识单元的频次统计与分布 ………………………………… 110
6.2 数据时间序列分析 …………………………………………… 118
6.3 地理数据可视化 ……………………………………………… 121
6.4 标准参考文献出版年谱(StandardRPYS) ………………… 128
6.5 多维参考文献出版年谱(MultiRPYS) ……………………… 132
7 科技文献数据内容挖掘与可视化 …………………………… 135
7.1 关键词的挖掘与可视化 ……………………………………… 136
7.2 标题及摘要文本术语挖掘与可视化 ………………………… 145
7.3 文本主题挖掘与可视化 ……………………………………… 198
8 ………………………………211
目录
8 科学文献知识网络分析 ……………………………………… 211
8.1 网络分析基础 ………………………………………………… 212
8.2 创建和处理知识网络的方法 ………………………………… 223
8.3 知识网络分析 ………………………………………………… 224
附 录……………………………………………………………… 317
Python中的科学计量程序包 ………………………………………… 317















