作者:王凤刚 著
页数:164
出版社:人民邮电出版社
出版日期:2024
ISBN:9787115605054
电子书格式:pdf/epub/txt
网盘下载地址:下载深入浅出GREENPLUM分布式数据库:原理、架构和代码分析
内容简介
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的“全景图”。
本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。
本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者和学者,也可作为高校计算机类专业的分布式数据库相关课程的参考资料。
作者简介
王凤刚,分布式数据库开源项目Greenplum和HAWQ的贡献者;Greenplum相关产品工作经验9年;500强企业服务经验14年;云计算和分布式系统的开发和运维经验18年。
本书特色
实践导向:本书打破传统理论介绍模式,深入剖析Greenplum分布式数据库的工业化实现,涵盖分布式事务、计算和存储,为读者提供从理论到实践的全面解析。
源码级分析:作者凭借丰富的Greenplum一线经验,对Greenplum的架构和源码进行深入讲解,帮助读者更直观地理解分布式数据库的相关理论。
技术前瞻:探讨云原生数据库和新技术为分布式数据库带来的机遇与挑战,为数据库领域的科研工作者和开发者指明研究方向和发展趋势。
目录
第 1章 云计算时代的数据库 2
1.1 数据库的历史和发展 2
1.2 云计算带来的挑战 3
1.3 云原生数据库的主要特点 3
第 2章 分布式数据库基础理论和架构 5
2.1 分布式数据库理论概述 5
2.1.1 CAP理论和BASE理论 5
2.1.2 一致性算法 6
2.2 典型的分布式数据库 9
2.2.1 OLTP型数据库 9
2.2.2 OLAP型数据库 9
2.2.3 HTAP型数据库 9
第3章 并发控制 10
3.1 概述 10
3.2 并发控制的分类 10
3.3 基于锁的并发控制 11
3.4 基于时间戳的并发控制 12
3.5 基于验证法的乐观并发控制 13
3.6 MVCC技术 13
3.7 快照隔离技术 16
3.8 可序列化快照隔离 17
3.9 死锁管理 20
3.10 B最树和LSM树 25
第 2篇 Greenplum架构和源码分析
第4章 Greenplum总体架构 30
4.1 概述 30
4.2 数据库通信协议 33
4.2.1 启动阶段 35
4.2.2 取消请求 36
4.2.3 常规阶段 36
4.3 Greenplum的架构和核心引擎 38
4.3.1 Greenplum主要模块介绍 38
4.3.2 通用场景 40
4.3.3 Interconnect模块 42
4.3.4 gang和slice 54
第5章 分布式事务的实现 62
5.1 分布式事务的原理和两阶段提交 62
5.1.1 事务隔离 62
5.1.2 两阶段提交 65
5.2 steal/force和WAL协议 66
5.3 PostgreSQL事务处理和状态机介绍 68
5.3.1 PostgreSQL事务处理 69
5.3.2 PostgreSQL状态机 70
5.4 分布式事务状态机 72
5.5 简单完整的分布式事务 75
5.5.1 初始化和begin命令 75
5.5.2 insert命令 79
5.5.3 两阶段提交的实现 81
5.6 分布式事务如何容错 93
第6章 分布式计算的实现 100
6.1 Greenp