技术教育社区
www.teccses.org

自然语言处理实战 算法卷

封面

作者:陈继生

页数:265

出版社:中国铁道出版社

出版日期:2024

ISBN:9787113312114

电子书格式:pdf/epub/txt

网盘下载地址:下载自然语言处理实战 算法卷

内容简介

本书在开篇章节清晰解释自然语言与人工智能关系的基础上,结合当前自然语言处理领域主流和前沿应用,从9个实践应用场景方面讲解了自然语言处理相关算法的实践,包括文本特征提取、语言生成、语义分析与理解、信息检索与推荐系统等。对于每种实践场景的描述会先帮助读者弄懂原理,再与场景需求进行匹配,最后横向对比不同算法的特点,旨在向读者阐明,算法没有优劣之分,只有是否合适的区别,这便是实践场景的特点。二维码下载包中包含全书示例源代码,帮助读者通过调整不同参数来体会算法的实现效果。

作者简介

陈继生,硕士研究生,前百度飞桨项目发工程师,在大规模机器学习、深度学习、数据搜索、行业垂直应用、研发管理等领域拥有丰富的开发经验。现在就职于商汤科技,负责SenseAvatar 项目的研发工作。拥有多年开发经验,在企业智能化转型、业务线上化经营、拥有丰富的大规模搜索架构、个性化推荐架构、机器学习系统架构经验和技术团队管理经验。

目录

第1章 人工智能与自然语言处理基础
1.1 人工智能
1.1.1 人工智能的发展历程
1.1.2 人工智能的研究领域
1.2 机器学习和深度学习
1.2.1 机器学习
1.2.2 深度学习
1.2.3 机器学习和深度学习的区别
1.3 什么是自然语言处理
1.4 自然语言处理的挑战与机遇
1.4.1 挑战
1.4.2 机遇
第2章 文本预处理算法
2.1 分词
2.1.1 分词的重要性和基本原理
2.1.2 基于空格的分词
2.1.3 基于标点符号的分词
2.2 词干化与词形还原
2.2.1 词干化与词形还原的区别
2.2.2 词干化算法
2.2.3 词形还原算法
2.3 去除停用词
2.3.1 什么是停用词
2.3.2 基于词汇列表的停用词去除
2.3.3 基于词频的停用词去除
2.3.4 使用TF-IDF算法去除停用词
2.3.5 利用机器学习方法去除停用词
2.4 数据清洗和处理
2.4.1 处理缺失值
2.4.2 异常值检测与处理
2.4.3 处理重复数据
第3章 特征提取
3.1 特征的类型
3.2 特征选择
3.2.1 特征选择的必要性
3.2.2 特征选择的方法
3.3 特征抽取
3.3.1 特征抽取的概念
3.3.2 主成分分析
3.3.3 独立成分分析
3.3.4 自动编码器
3.4 嵌入
3.4.1 嵌入的重要应用场景
3.4.2 PyTorch嵌入层的特征提取
3.4.3 TensorFlow嵌入层的特征提取
3.4.4 Word2Vec模型
3.4.5 GloVe模型
3.5 词袋模型
3.5.1 词袋模型的实现步骤与具体示例
3.5.2 词袋模型的限制与改进
3.6 TF-IDF
3.6.1 TF-IDF关键概念与计算方式
3.6.2 使用TF-IDF提取文本特征
第4章 文本分类与情感分析算法
4.1 朴素贝叶斯分类器
4.1.1 朴素贝叶斯分类器的基本原理与应用场景示例
4.1.2 应用场景示例:垃圾邮件过滤
4.2 支持向量机
4.2.1 支持向量机的核心思想和主要原理
4.2.2 线性SVM与非线性SVM
4.3 随机森林算法
4.3.1 随机森林算法的主要原理和应用场景
4.3.2 随机森林算法应用:垃圾邮件分类器
4.4 卷积神经网络
4.4.1 卷积神经网络的发展背景
4.4.2 卷积神经网络的结构
4.4.3 卷积神经网络实战案例
4.5 循环神经网络
4.5.1 循环神经网络介绍
4.5.2 文本分类
4.5.3 循环神经网络实战案例1:使用PyTorch开发歌词生成器模型
4.5.4 循环神经网络实战案例2:使用TensorFlow制作情感分析模型
4.6 递归神经网络
4.6.1 递归神经网络介绍
4.6.2 RvNN
第5章 语言生成算法
5.1 基于规则的生成算法
5.1.1 基于规则的生成算法的优缺点
5.1.2 基于规则的生成算法在自然语言处理中的应用场景
5.2 基于统计的生成算法
5.2.1 基于统计的生成算法介绍
5.2.2 常见基于统计的生成模型
5.2.3 N-gram模型
5.2.4 隐马尔可夫模型
5.2.5 最大熵模型
5.3 基于神经网络的生成模型
5.3.1 常见的基于神经网络的生成模型
5.3.2 神经网络生成的基本原理
5.3.3 生成对抗网络
5.4 注意力机制
5.4.1 注意力机制介绍
5.4.2 注意力机制的变体
5.4.3 注意力机制解决什么问题
5.5 序列到序列模型
5.5.1 Seq2Seq模型介绍
5.5.2 Seq2Seq编码器-解码器结构
5.5.3 使用Seq2Seq模型实现翻译系统
第6章 语义分析与理解算法
6.1 词义表示
6.2 语义相似度计算
6.2.1 语义相似度的重要性
6.2.2 词汇语义相似度计算方法
6.2.3 文本语义相似度计算方法
6.3 命名实体识别
6.3.1 命名实体识别介绍
6.3.2 基于规则的NER方法
6.3.3 基于机器学习的NER方法
6.4 语义角色标注
6.4.1 语义角色标注介绍
6.4.2 基于深度学习的SRL方法
6.5 依存分析
6.5.1 依存分析介绍
6.5.2 依存分析的基本步骤
6.5.3 依存分析的方法
6.5.4 依存分析在自然语言处理中的应用
6.6 语法树生成
6.6.1 语法树介绍
6.6.2 语法树生成的基本原理
6.6.3 生成语法树的方法
6.6.4 基于上下文无关文法的语法树生成
6.7 知识图谱与图数据分析
6.7.1 知识图谱的特点
6.7.2 知识图谱的构建方法
6.7.3 图数据分析的基本原理
6.7.4 图数据分析的应用场景
第7章 机器翻译算法
7.1 常见的机器翻译算法
7.2 统计机器翻译
7.2.1 统计机器翻译的实现步骤
7.2.2 常见的SMT模型
7.2.3 SMT的训练和解码
7.3 神经机器翻译
7.3.1 NMT模型的一般工作流程
7.3.2 NMT的应用领域
7.3.3 NMT的训练和解码
7.3.4 基于NMT的简易翻译系统
7.4 跨语言情感分析
7.4.1 跨语言情感分析介绍
7.4.2 跨语言情感分析的挑战
7.4.3 跨语言情感分析的方法
第8章 NLP应用实战:智能客服系统
8.1 背景介绍
8.2 系统介绍
8.3 模型介绍与准备
8.3.1 模型介绍
8.3.2 下载模型文件
8.4 Android智能客服系统
8.4.1 准备工作
8.4.2 页面布局
8.4.3 实现主Activity
8.4.4 智能回复处理
第9章 NLP应用实战:文本摘要系统
9.1 文本摘要系统介绍
9.2 抽取式文本摘要方法
9.3 抽象生成式文本摘要方法
9.4 文本摘要生成系统
9.4.1 准备数据
9.4.2 数据预处理
9.4.3 数据分析
9.4.4 构建Seq2Seq模型
第10章 NLP应用实战:消费者投诉处理模型
10.1 需求分析
10.2 具体实现
10.2.1 数据集预处理
10.2.2 目标特征的分布
10.2.3 探索性数据分析
10.2.4 制作模型

赞助用户下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《自然语言处理实战 算法卷》
Article link:https://www.teccses.org/10493.html