技术教育社区
www.teccses.org

基于高通量测序的基因组分析

封面

作者:王峥峰

页数:152

出版社:科学出版社

出版日期:2022

ISBN:9787030721488

电子书格式:pdf/epub/txt

内容简介

高通量测序已成为生物学研究的重要手段,在生物多样性、物种种质资源开发利用和生物医药领域都发挥了很好重要的作用,因此,如何处理和分析高通量测序数据成为生物学研究的推荐技能之一。本书以高通量测序数据在基因组分析中的运用为例,采用分步讲解的方式,图文并茂地介绍了高通量测序数据的基本格式,利用高通量测序数据开展分析的流程、相关程序,程序执行过程及其分析注意事项。同时,对于数据分析运算中的一些中间结果,作者提供了自己编写的程序,以利于获得最终结果。书中提供了Linux操作系统安装方法,并基于Linux语言命令介绍了高通量测序数据处理过程,其中没有复杂的程序代码,不需要编程语言基础,浅显易懂,具有很强的实践操作性。
本书可供基因组学、生物信息学、遗传学、生态学及相关领域的高校师生和科研人员阅读参考。

本书特色

书中没有复杂的程序代码,不需要编程语言基础,浅显易懂,具有很强的实践操作性

目录

目录

第一章 Linux系统安装 1

第二章 Linux基本命令 6

第三章 高通量测序数据的常见格式 12

第四章 基因组组装 15

第一节 基因组大小估测  15

第二节 基于PacBio HiFi模式测序数据的基因组组装 21

第三节 基于PacBio CLR模式测序数据的基因组组装 27

第四节 基于Nanopore测序数据的基因组组装 30

第五节 去除基因组中的冗余序列 37

第六节 Hi-C组装 47

第五章 重复序列查找 66

第六章 基因预测 72

第七章 基因家族扩张和收缩  82

第八章 物种历史动态 100

第九章 群体重测序个体的SNP查找 110

第十章 遗传多样性参数计算 124

第十一章 受选择作用的SNP位点 129

第一节 PCAdapt分析 129

第二节 BayPass分析 135

第三节 合并PCAdapt和BayPass结果 140

第十二章 遗传结构分析 144

第一节 PCA分析 144

第二节 Admixture分析 146

节选

第一章Linux系统安装 Linux系统很多,我使用的是Ubuntu Linux系统,可以从网站下载。这个Linux系统已经提前安装了多类编译程序,省去很多烦琐的安装过程。登录到网站界面后,下载其中的“osgeolive-13.0-amd64.iso”文件(图1),这是Linux单机版本。如果想安装虚拟机版本,可下载“osgeolive-13.0-amd64.vmdk.7z”文件。本书介绍的是单机版本的安装。 图1“OSGeoLive-13.0”版本Linux系统下载 准备一个容量大于8Gb的空U盘,利用Rufus工具把下载的“osgeolive-13.0-amd64.iso”写入到U盘中,做成U盘启动盘(图2~图8)。请注意,这些是在Windows操作系统下完成的。 图2Linux系统安装 图3利用Rufus程序把Linux系统写入U盘—1图中数字1、2、3代表选择或执行步骤。如后图中出现类似数字,意思相同,不再提示 图4利用Rufus程序把Linux系统写入U盘—2 图5利用Rufus程序把Linux系统写入U盘—3 图6利用Rufus程序把Linux系统写入U盘—4 图7利用Rufus程序把Linux系统写入U盘—5 图8利用Rufus程序把Linux系统写入U盘—6 安装完成后,重新从U盘启动计算机。需要注意的是启动U盘时,不要选择UEFI模式启动。如图9所示,我的U盘名字是“AIMass Storage”(读者的U盘和我的名字会不同),在选择U盘启动时,不要选择“UEFI:AIMass Storage,Partition1”模式,因为安装过程可能报错。成功启动后,会出现对话框询问安装的语言,利用键盘的上下左右键进行选择,读者可按照自己的要求选择语言;之后出现对话框询问是否安装Lubuntu系统,选择“安装Lubuntu”;然后出现选择语言和键盘布局的界面;此后出现“更新和其他软件”对话框,选择“正常安装”、“安装OSGeoLive时下载更新”和“为图形或无线硬件,以及其他媒体格式安装第三方软件”;出现“安装类型”,选择“清除整个磁盘并安装OSGeolive”;最后出现对话框,点击“选择磁盘”,移动上下键,选择合适的磁盘进行Linux系统的安装,注意这一安装过程会删除被安装磁盘内的文件,所以务必选择正确的磁盘并做好备份。建议买一个容量大一些的硬盘用于系统安装。之后按照提示继续下面的安装操作,包括输入用户名和密码,这里不再一一细述。 图9安装Linux系统的U盘启动 在本书撰写期间,OSGeoLive版本更新到了14.0,读者可以下载该版本进行安装,安装过程大致和13.0版本相同。步骤如下:首先选择“中文(简体)”后回车;出现下一个界面时选择“StartOSGeoLive”,回车;出现OSGeoLive-14.0的操作界面(类似Windows操作界面),选择里面标有“InstallOSGeoLive14.0”的图标;之后出现选择安装字体的选项,可选择中文,然后点击“下一步”,选择时区,可选择“Asia”和“Shanghai”等,点击“下一步”,选择键盘语言,点击“下一步”,选择正确的磁盘,再选择“抹除磁盘”的选项,之后的安装按照提示
进行就可以。 第二章Linux基本命令 Linux常用命令包括:cd、ls、cat、paste、cut、grep、sort、uniq、sed、head、tail。现以“OSGeoLive-13.0”版本界面为例(图10),“OSGeoLive-14.0”版本和“OSGeoLive-13.0”版本界面基本一致(图11)。 安装完成后,就可以启动进入Linux界面(图10),基本和Windows界面一致。打开文件夹界面后(图12),如果觉得小图标界面不合适,对于“OSGeoLive-13.0”版本,可依次点击文件夹界面中的“视图”、“文件夹查看方式”和“紧缩视图”;对于“OSGeoLive-14.0”版本,可依次点击“查看”、“查看”和“列表视图”,就可以得到列表视图。文件夹的最大化、最小化,文件的操作,包括文件复制、粘贴等和Windows一致,不再赘述。 图10“OSGeoLive-13.0”版本Linux启动后界面

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《基于高通量测序的基因组分析》
Article link:https://www.teccses.org/1376707.html