
作者:[荷兰]皮特因·施特伦霍尔特(Piethein Strengholt) 著
页数:356
出版社:中国电力出版社
出版日期:2025
ISBN:9787519890179
电子书格式:pdf/epub/txt
网盘下载地址:下载大规模数据管理
内容简介
本书的主要内容有:研究数据管理趋势,包括技术发展、法规要求和隐私问题。深?了解可拓展架构,学习各组件之间如何协同?作。探索数据治理和数据安全、主数据管理、?助式数据市场,以及元数据的重要性。
作者简介
Piethein Strengholt喜爱为复杂问题寻找实?且持久的解决?案。在担任战略顾问和?由职业应?程序开发?员超过?年之久后,他作为?席架构师加?了荷兰银?(ABN AMRO),推进数据管理、云计算和系统集成等领域的发展。在这个激动??的职位上,他负责监督公司的数据战略及其对组织的影响。他和家??前住在荷兰。
本书特色
编辑推荐
随着数据管理和集成持续不断地快速进化,把所有的数据存储在像数据仓库等单?位置的办法不再有可拓展性。在不久的将来,数据需要分散式存储并对多个技术解决?案提供可?性。通过这本实?指南,你将学习如何将企业从复杂且紧密耦合的数据环境迁移到?个更灵活的架构,以适应现代数据消费的需求。
企业?管、数据架构师、分析团队,以及合规与治理?员将学习如何使?可拓展架构来构建现代可拓展的数据环境。这种架构可以逐步引???需?规模的前期投?。本书作者提供了蓝图、原则、观察、最z佳实践及模式,帮助你快速掌握相关知识。
专家推荐
“这?蕴含着智慧:新旧的?法论和最z佳实践在这?被平衡地运?,这得益于长期实践的经验。最z棒的是施特伦霍尔特展?了新?代企业数据管理是?项团队活动,解决?案需要包容并对接到所有参与者。”
——Joe Hellerstein,
Trifacta的共同创始?及CSO
“在这本创新的著作中,Piethein Strengholt提出了?种全新的?法,来构建数据管理领域的架构。这本书将指导并启发那些在2020年之后负责设计数据管理架构的?们。”
——Santhosh Pillai,
荷兰银?总架构师兼
数据管理负责?
目录
目录序 1前言 3第1 章 数据管理的变革 . 111.1 数据管理121.2 分析正在分割数据景观 .151.3 软件交付的速度正在发生变化 171.4 网络变得更加快捷 181.5 隐私和安全性是重中之重 191.6 运营和事物系统需要被整合 201.7 数据商业化需要生态系统到生态系统的架构 201.8 企业受困于过时的数据架构 211.8.1 企业数据仓库和商业智能 211.8.2 数据湖 24目录序 1前言 3第1 章 数据管理的变革 . 111.1 数据管理121.2 分析正在分割数据景观 .151.3 软件交付的速度正在发生变化 171.4 网络变得更加快捷 181.5 隐私和安全性是重中之重 191.6 运营和事物系统需要被整合 201.7 数据商业化需要生态系统到生态系统的架构 201.8 企业受困于过时的数据架构 211.8.1 企业数据仓库和商业智能 211.8.2 数据湖 241.8.3 中心化视角 261.9 小结 .27第2 章 初窥可拓展架构:大规模数据管理 .292.1 普遍认可的起点 302.1.1 每一个应用程序都有一个应用程序数据库 302.1.2 应用程序都是特定的而且有独特的上下文 302.1.3 黄金数据源 312.1.4 无法摆脱的数据集成困境 312.1.5 应用程序既是数据提供者也是数据消费者 322.2 关键的理论考量 332.2.1 面向对象的编程原则.332.2.2 领域驱动设计 352.2.3 业务架构 .382.3 通信和集成模式 452.3.1 点对点 462.3.2 孤岛 462.3.3 轮辐模型 .472.4 可扩展架构 482.4.1 黄金数据源和域数据存储 492.4.2 数据交付契约和数据共享协议 .512.4.3 摆脱孤岛方案 522.4.4 企业规模的领域驱动设计 532.4.5 读优化的数据 562.4.6 从整体的视角看数据层 582.4.7 元数据和目标运营模式 612.5 小结 .63第3 章 管理海量数据:只读数据存储架构 .653.1 RDS 架构简介 653.2 命令和查询职责分离 663.2.1 什么是CQRS 663.2.2 规模化的CQRS 683.3 只读数据存储组件和服务 733.3.1 元数据 743.3.2 数据质量 .753.3.3 RDS 层级 773.3.4 数据摄取 .783.3.5 集成商业化现成解决方案 813.3.6 从外部API 和SaaS 提取数据 823.3.7 历史数据服务 823.3.8 设计的变化 863.3.9 数据复制 .883.3.10 访问层 .893.3.11 文件操作服务 903.3.12 交付通知服务 .913.3.13 匿名服务 913.3.14 分布式编排923.4 智能消费服务 .933.5 按需填充RDS 963.6 直接使用RDS 的考量 973.7 小结 .98第4 章 API 架构的服务和API 管理 994.1 API 架构简介 994.2 什么是面向服务的架构 1004.2.1 企业应用集成 1044.2.2 服务编排 1064.2.3 服务编舞 1104.2.4 公共服务和私有服务 1114.2.5 服务模型和规范数据模型 1114.2.6 SOA 与企业数据仓库架构的相似之处 . 1124.3 SOA 的现代观点 1144.3.1 API 网关 1144.3.2 责任模式 1164.3.3 企业服务总线的新职责 . 1184.3.4 服务合约 1194.3.5 服务发现 1194.4 微服务 .1204.4.1 API 网关在微服务中的作用 1224.4.2 函数 .1224.4.3 服务网格 1244.4.4 微服务的边界 .1254.4.5 在API 参考架构内的微服务 1264.5 生态系统通信 1274.6 基于API 的通信渠道 1294.6.1 GraphQL 1304.6.2 为前端服务的后端 1314.7 元数据 .1314.8 利用RDS 进行实时和密集读取 .1334.9 小结 134第5 章 事件和响应管理:流式架构 . 1375.1 流式架构简介 1375.2 异步事件模型与众不同 1385.3 事件驱动架构是什么样的 .1395.3.1 调停者拓扑 .1405.3.2 代理者拓扑 .1415.3.3 事件处理风格 .1425.4 Apache Kafka 简易入门 1435.4.1 分布式事件数据 1455.4.2 Apache Kafka 的功能 .1475.5 流式架构.1485.5.1 事件生产者 .1485.5.2 事件消费者 .1515.5.3 事件平台 1535.5.4 事件溯源和命令溯源1545.5.5 治理模型 1575.5.6 业务流 1585.5.7 流式数据消费模式 1615.5.8 事件携带状态转移 1635.5.9 扮演RDS 的角色 .1645.5.10 使用流式处理来填充RDS 1645.5.11 用来指导领域的控制措施和政策 1655.6 作为运营支撑的流式处理 .1665.7 保证与一致性 1675.7.1 一致性水平 .1675.7.2 “至少一次、恰好一次和至多一次”的处理 1675.7.3 消息顺序 1685.7.4 死信队列 1685.7.5 流式处理的互操作性1695.8 用于治理和自助服务模型的元数据1705.9 小结 171第6 章 将知识串联起来 1736.1 架构回顾.1736.1.1 RDS 架构 .1746.1.2 API 架构 1746.1.3 流式架构 1756.1.4 强化模式 1756.2 企业互操作性标准 .1776.2.1 稳定的数据端点 .1786.2.2 数据交付契约 .1816.2.3 可访问和可寻址的数据 .1826.2.4 跨网络原则 .1826.3 企业数据标准 1886.3.1 消费优化原则 .1896.3.2 元数据的可发现性 1926.3.3 语义一致性 .1966.3.4 提供相应的元数据 2006.3.5 数据来源与移动 2006.4 参考架构.2036.5 小结 204第7 章 可持续的数据治理与数据安全 2077.1 数据治理.2077.1.1 组织:数据治理的角色 .2097.1.2 流程:数据治理的活动 .2127.1.3 人员:信任与道德、社会和经济的考量 2147.1.4 技术:黄金数据源,所有权和应用程序管理 2147.1.5 数据:黄金数据源,黄金源数据集和分类 .2167.2 数据安全.2247.2.1 时下的孤岛方法 2257.2.2 架构的统一数据安全2257.2.3 身份提供者 .2277.2.4 安全参考架构和数据上下文方法 .2287.2.5 安全处理流程 .2307.3 实践指南.2347.3.1 RDS 架构 .2347.3.2 API 架构 2367.3.3 流式架构 2407.3.4 智能学习引擎 .2417.4 小结 242第8 章 从数据获取价值 2438.1 消费模式.2448.1.1 直接使用只读数据存储 .2448.1.2 领域数据存储 .2458.2 目标运营模式 2478.3 作为目标用户群体的数据专业人员2488.4 业务需求.2508.5 非功能性需求 2508.6 创建数据管道和数据模型 .2528.7 分发集成数据 2598.8 商业智能能力 2608.9 自助服务能力 2628.10 分析能力 2658.10.1 自动化部署的标准基础设施 2668.10.2 无状态模型2668.10.3 预设和配置好的工作台 2668.10.4 模型集成模式的标准化 2678.10.5 自动化 .2688.10.6 模型元数据2688.11 高级分析参考架构 2708.12 小结 273第9 章 掌握企业数据资产 2759.1 揭秘主数据管理 .2769.2 主数据管理风格 .2769.3 主数据管理参考架构 2789.3.1 设计主数据管理解决方案 2799.3.2 MDM 的分发 2819.3.3 主标识号 2819.3.4 参考数据与主数据 2829.4 确定企业数据的范围 2839.5 MDM 和数据质量即服务 2869.6 精选数据.2869.6.1 元数据交换 .2879.6.2 集成视图 2889.6.3 可复用组件和集成逻辑 .2889.6.4 数据重新发布 .2899.7 与数据治理的关系 .2909.8 小结 290第10 章 通过元数据实现数据民主化 29310.1 元数据管理 .29410.2 企业元数据模型 29510.3 企业知识图谱 30310.4 元数据管理的架构方法 30710.4.1 元数据互操作性 .30810.4.2 元数据存储库 31010.5 能提供快速访问授权数据的市场 31310.6 小结 316第11 章 结论 31711.1 交付模式 31811.1.1 完全去中心化方案 31911.1.2 部分去中心化方案 32011.1.3 构建团队 32011.1.4 内部开源策略 32111.2 文化 32211.3 技术选择 32311.4 传统企业架构的没落 .32411.4.1 蓝图和图表 32411.4.2 现代技能 32511.4.3 控制和管理 32511.5 最后的话 326术语 . 327
赞助用户下载地址
立即下载(解压密码:www.teccses.org)