技术教育社区
www.teccses.org

自然语言处理基础教程

封面

作者:王刚,郭蕴,

页数:232

出版社:机械工业出版社

出版日期:2021

ISBN:9787111692591

电子书格式:pdf/epub/txt

内容简介

本书面向初学者介绍了自然语言处理的基础知识,包括词法分析、句法分析、基于机器学习的文本分析、深度学习与神经网络、词嵌入与词向量以及自然语言处理与卷积神经网络、循环神经网络技术及应用。本书深入浅出,案例丰富,可作为高校人工智能、大数据、计算机及相关专业本科生的教材,也可供对自然语言处理有兴趣的技术人员作为参考书。

本书特色

用通俗易懂的语言、丰富的案例带你进入自然语言处理的大门

目录

前言

第1章 自然语言处理概述1

11 自然语言处理的基本概念1

111 什么是自然语言处理1

112 自然语言处理的层次2

113 自然语言处理的发展历程3

12 自然语言处理技术面临的困难6

121 歧义6

122 知识的获取、表达及运用7

123 计算问题8

13 自然语言处理的主要研究任务和应用8

131 自然语言处理的主要研究任务8

132 自然语言处理的典型应用10

14 搭建自然语言处理开发环境11

141 Anaconda11

142 scikit-learn15

143 Jupyter Notebook15

15 本章小结16

16 习题17

第2章 词法分析18

21 什么是词法分析18

22 分词19

221 中文分词简介19

222 基于词典的分词方法20

223 基于统计的分词方法21

224 实例—使用N-gram语言模型进行语法纠正24

225 中文分词工具简介27

226 实例—使用jieba进行高频词提取30

23 关键词提取32

231 TF-IDF算法32

232 TextRank算法33

233 实例—提取文本关键词34

24 词性标注40

241 词性标注简介40

242 隐马尔可夫模型41

243 Viterbi算法43

244 最大熵模型44

25 命名实体识别46

251 命名实体识别简介46

252 条件随机场模型47

253 实例—使用jieba进行日期识别48

26 本章小结52

27 习题53

第3章 句法分析54

31 什么是句法分析54

32 句法分析树库及性能评测56

321 句法分析语料库56

322 句法分析模型的性能评测59

33 概率上下文无关文法59

34 依存句法分析62

341 基于图模型的依存句法分析63

342 基于转移模型的依存句法分析63

35 中文句法分析工具简介65

36 实例—中文句法分析66

37 本章小结68

38 习题68

第4章 基于机器学习的文本分类69

41 机器学习简介69

411 scikit-learn简介71

412 机器学习基本概念72

413 机器学习问题分类73

42 朴素贝叶斯分类器76

43 逻辑回归分类器80

44 支持向量机分类器84

45 文本聚类89

46 实例—垃圾邮件分类94

47 本章小结99

48 习题99

第5章 深度学习与神经网络101

51 深度学习与神经网络简介101

52 人工神经网络102

521 生物神经元102

522 感知器103

523 激活函数105

524 神经网络110

53 前馈神经网络110

531 前馈神经网络的结构110

532 前向传播111

533 损失函数112

534 反向传播算法113

535 优化方法114

54 深度学习框架116

541 TensorFlow116

542 Keras118

543 PyTorch119

544 PaddlePaddle120

55 实例—使用MLP实现手写数字识别122

551 数据准备122

552 创建MLP122

553 模型训练123

554 模型评价124

56 本章小结125

57 习题126

第6章 词嵌入与词向量127

61 文本向量化127

62 One-Hot编码128

63 词嵌入130

631 什么是词嵌入130

632 词嵌入的实现131

633 语义信息132

64 Word2Vec133

641 Word2Vec简介133

642 Word2Vec的应用134

643 使用gensim包训练词向量136

65 Doc2Vec138

651 PV-DM139

652 PV-DBOW140

66 实例—利用Doc2Vec计算文档相似度140

661 准备语料库140

662 定义和训练模型141

663 分析文本相似度142

67 本章小结145

68 习题145

第7章 卷积神经网络与自然语言处理146

71 卷积神经网络简介146

711 深层神经网络用于图像处理存在的问题146

712 什么是卷积148

713 填充150

714 步长151

715 什么是卷积神经网络151

72 应用卷积神经网络解决自然语言处理问题152

721 NLP中的卷积层152

722 NLP中的池化层154

723 NLP中CNN的基本架构155

73 CNN在应用中的超参数选择156

731 激活函数156

732 卷积核的大小和个数156

733 dropout层156

734 softmax分类器157

74 实例—使用CNN实现新闻文本分类158

741 准备数据158

742 定义和训练模型163

75 本章小结165

76 习题166

第8章 循环神经网络与自然语言处理167

81 循环神经网络的基本结构168

82 循环神经网络应用于自然语言处理170

821 序列到类别170

822 同步序列到序列171

823 异步序列到序列172

83 循环神经网络的训练173

831 随时间反向传播算法173

832 权重的更新174

833 梯度消失与梯度爆炸175

84 长短期记忆网络175

841 细胞状态177

842 门控机制177

85 门控循环单元网络181

86 更深的网络184

861 堆叠循环神经网络184

862 双向循环神经网络185

87 实例—使用LSTM网络实现文本情感分析186

871 数据准备186

872 构建和训练模型187

88 本章小结190

89 习题191

第9章 序列到序列模型与注意力机制192

91 序列到序列模型192

911 什么是序列到序列模型192

912 编码–解码架构193

913 编码器194

914 解码器195

915 模型训练197

92 注意力机制198

921 什么是注意力机制198

922 计算语义

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《自然语言处理基础教程》
Article link:https://www.teccses.org/1310759.html