
作者:余宏杰著
页数:199
出版社:中国科学技术大学出版社
出版日期:2014
ISBN:9787312034541
电子书格式:pdf/epub/txt
内容简介
《生物序列数值化表征模型的矩阵分解方法及其应用》以生物序列的数值化表征模型所涉及的矩阵分解为核心,以序列的特征信息提取为主要目标,在非序列比对(Aignment-free)的框架下,分别提出了针对DNA/蛋白质序列、基因组序列等的若干个不同的特征信息抽取模型,并将所抽取的特征信息应用于序列的相似度分析。本书取材广泛,内容新颖,理论与应用紧密结合。书中所介绍的生物序列的建模方法、矩阵分解抽取其特征信息的研究策略,可供读者在解决实际问题时予以借鉴。 《生物序列数值化表征模型的矩阵分解方法及其应用》适合生物信息学、图像处理、信号处理等领域有关科研人员参考使用。
本书特色
当前正处于后基因组时代,日益积累的海量数据亟待分析解释,生物信息学便应运而生。其研究内容十分丰富,而其中的序列相似度分析尤为重要。这必然会涉及生物序列的表征方式,其中数值化表征模型会运用到矩阵分解技术等。针对现有的一些序列数值化表征方法普遍存在的不足之处,余宏杰编著的这本《生物序列数值化表征模型的矩阵分解方法及其应用》分别从算法设计、数据应用等不同角度,提出若干种有效的用于表征序列的模型。通过与相关研究成果从理论和实验结果上分别加以比较,以期验证所提出算法的有效性。而矩阵分析法显示出的特有的、行之有效的影响力,已渗透到相关领域,并取得较好的应用效果。
目录
前言第1章 绪论1.1 生物信息学海量数据的产生背景1.1.1 生物信息学简介1.1.2 两种基本的生物序列1.2 生物序列比对概述1.3 基于序列比对的系统发育树构建方法1.3.1 分子进化研究的基本方法1.3.2 构建系统进化树的详细步骤1.3.3 构建系统发育树需要注意的几个问题1.4 生物序列数值化表征模型的矩阵分解方法的研究背景1.4.1 序列图形化表征1.4.2 基因组序列数值化表征及应用1.4.3 蛋白质序列数值化表征及应用1.4.4 有关x-mer的算法概述1.5 本书的内容安排
第2章 基于矩阵束联合对角化的DNA序列图形化表征及其应用2.1 DNA序列的图形化表征方法概述2.2 DNA序列的描述符2.2.1 相关的一些工作2.2.2 构建序列的邻接矩阵2.2.3 矩阵分解理论简介2.2.4 有关矩阵对角化的理论2.2.5 近似联合对角化(AJD)2.2.6 算法的保距性2.3 图形化表示法2.3.1 计算特征值组成的序列表征向量(EVV)2.3.2 AJD算法收敛性分析2.3.3 基于特征值组成的表征向量(EVV)的序列图形聚类2.4 相似度分析2.4.1 聚类分析基本原理2.4.2 计算成对距离2.4.3 u条卢球蛋白基因的系统谱系分析2.4.4 与相关工作的比较2.5 本章结论第3章 基于SVD的基因组序列保序变换及其应用3.1 DNA序列数值描述符3.2 从基因组序列向数值向量的保序变换3.2.1 基因组序列变换矩阵的构建3.2.2 所提出的序列变換算法具有的良好性质3.2.3 保序变换-奇异值分解(OPT-SVD)算法的过程描述3.3 保序变换算法在基因组序列相似度/相异度分析中的应用3.4 本章结论第4章 基于保距映射算法的基因组序列Map示图及应用4.1 受PCA的启发尝试对基因组序列数值描述4.2 基因组序列的“保距”变换4.2.1 特征矩阵的构建4.2.2 基因组序列变换的特性4.3 基于保距变换算法的基因组序列的相似度分析4.3.1 第一个数据集上的实验结果4.3.2 另一个更大规模数据集上的实验结果4.4 本章结论第5章 基于NFV-AAA算法的蛋白质序列相似度分析5.1 基于K-mer的组分向量法背景概述5.2 基于氨基酸(AAA)分布的蛋白质序列描述符5.2.1 描述符的范式5.2.2 蛋白质序列转换成400×(L-1)稀疏矩阵5.2.3 AAA优于SAA5.2.4 对特征矩阵M施行SVD以抽取序列的特征5.3 NFV在相似度分析中的应用5.3.1 九条ND5蛋白质序列的相似度分析5.3.2 在24条转铁蛋白序列的数据集上的应用5.4 本章结论第6章 分段K-mer算法及其在序列相似度分析中的应用6.1 K-mer分析法优劣性分析6.2 基因组序列的描述符6.3 s-K-mer在34条线粒体基因组序列数据集上的应用6.3.1 优化算法的数据准备6.3.2 对K-mer进行寻优以便获得其最优阶数K最值6.3.3 s-K-mer算法的性能6.3.4 利用s-K-mer对基因组作系统发生分析6.4 本章结论第7章 基于层级虚拟混合与投影抽取的基因组序列比较7.1 有关FFP与ICA背景概述7.2 基因组序列特征提取模型7.2.1 基于K-mer虚拟混合器的基因组序列数据预处理7.2.2 虚拟混合与投影抽取模型7.2.3 层级的VMPE模型7.3 HVMPE模型在真实基因组数据集上的应用7.3.1 先行相关数据的准备7.3.2 确定虚拟混合器(VM)的最佳阶数K最7.3.3 对HVMPIE模型进行最佳段数S最值的寻优7.3.4 层级的VMPE模型的效果分析7.3.5 基于HVMPE模型的基因组序列种系发生分析7.3.6 在另一个基因组数据集上的应用7.4 本章结论第8章 总结与展望8.1 本书的主要工作与创新点8.2 未来工作的设想8.2.1 NMF的基本原理8.2.2 序列分析中引入NMF算法的构想参考文献
第2章 基于矩阵束联合对角化的DNA序列图形化表征及其应用2.1 DNA序列的图形化表征方法概述2.2 DNA序列的描述符2.2.1 相关的一些工作2.2.2 构建序列的邻接矩阵2.2.3 矩阵分解理论简介2.2.4 有关矩阵对角化的理论2.2.5 近似联合对角化(AJD)2.2.6 算法的保距性2.3 图形化表示法2.3.1 计算特征值组成的序列表征向量(EVV)2.3.2 AJD算法收敛性分析2.3.3 基于特征值组成的表征向量(EVV)的序列图形聚类2.4 相似度分析2.4.1 聚类分析基本原理2.4.2 计算成对距离2.4.3 u条卢球蛋白基因的系统谱系分析2.4.4 与相关工作的比较2.5 本章结论第3章 基于SVD的基因组序列保序变换及其应用3.1 DNA序列数值描述符3.2 从基因组序列向数值向量的保序变换3.2.1 基因组序列变换矩阵的构建3.2.2 所提出的序列变換算法具有的良好性质3.2.3 保序变换-奇异值分解(OPT-SVD)算法的过程描述3.3 保序变换算法在基因组序列相似度/相异度分析中的应用3.4 本章结论第4章 基于保距映射算法的基因组序列Map示图及应用4.1 受PCA的启发尝试对基因组序列数值描述4.2 基因组序列的“保距”变换4.2.1 特征矩阵的构建4.2.2 基因组序列变换的特性4.3 基于保距变换算法的基因组序列的相似度分析4.3.1 第一个数据集上的实验结果4.3.2 另一个更大规模数据集上的实验结果4.4 本章结论第5章 基于NFV-AAA算法的蛋白质序列相似度分析5.1 基于K-mer的组分向量法背景概述5.2 基于氨基酸(AAA)分布的蛋白质序列描述符5.2.1 描述符的范式5.2.2 蛋白质序列转换成400×(L-1)稀疏矩阵5.2.3 AAA优于SAA5.2.4 对特征矩阵M施行SVD以抽取序列的特征5.3 NFV在相似度分析中的应用5.3.1 九条ND5蛋白质序列的相似度分析5.3.2 在24条转铁蛋白序列的数据集上的应用5.4 本章结论第6章 分段K-mer算法及其在序列相似度分析中的应用6.1 K-mer分析法优劣性分析6.2 基因组序列的描述符6.3 s-K-mer在34条线粒体基因组序列数据集上的应用6.3.1 优化算法的数据准备6.3.2 对K-mer进行寻优以便获得其最优阶数K最值6.3.3 s-K-mer算法的性能6.3.4 利用s-K-mer对基因组作系统发生分析6.4 本章结论第7章 基于层级虚拟混合与投影抽取的基因组序列比较7.1 有关FFP与ICA背景概述7.2 基因组序列特征提取模型7.2.1 基于K-mer虚拟混合器的基因组序列数据预处理7.2.2 虚拟混合与投影抽取模型7.2.3 层级的VMPE模型7.3 HVMPE模型在真实基因组数据集上的应用7.3.1 先行相关数据的准备7.3.2 确定虚拟混合器(VM)的最佳阶数K最7.3.3 对HVMPIE模型进行最佳段数S最值的寻优7.3.4 层级的VMPE模型的效果分析7.3.5 基于HVMPE模型的基因组序列种系发生分析7.3.6 在另一个基因组数据集上的应用7.4 本章结论第8章 总结与展望8.1 本书的主要工作与创新点8.2 未来工作的设想8.2.1 NMF的基本原理8.2.2 序列分析中引入NMF算法的构想参考文献



![近邻分类方法及其应用-[上册]-技术教育社区](https://image12.bookschina.com/2014/20140324/B6562604.jpg)


![近邻分类方法及其应用-[下册]-技术教育社区](https://image12.bookschina.com/2014/20140805/B6562605.jpg)






