统一星型模型 一种敏捷灵活的数据仓库和分析设计方法
定 价:108 元
- 作者:[美]比尔?因蒙(BillInmon);[美]弗朗切斯科?普皮尼(FrancescoPuppini)
- 出版时间:2022/4/1
- ISBN:9787111702795
- 出 版 社:机械工业出版社
- 中图法分类:TP311.13
- 页码:
- 纸张:胶版纸
- 版次:
- 开本:16开
数据模型作为仓库和集市的核心组成部分,它的价值不言而喻。而统一星型模型是一种构建分析型应用的*敏捷和灵活的设计方式,与传统的维度模型相比,它具有诸多优势。这本书是数据仓库之父BIllInmon强力推荐的,书中可看到统一星型模型作为单一星型模型的强大功能。Inmon和Francesco Pupplin在书中阐述了为什么统一星型模型是当前商业智能设计的方法,介绍了它的发展历程、背景、设计方法以及如何解决业务问题。
统一星型模型是实现业务价值的关键,从数据丢失、Chasm陷阱、多事实查询、循环、非一致粒度等方面都展示了它的优势。所以对于企业来说,不论是现在的业务还是将来的业务,统一模型都可以作为基础业务模型,为企业业务的数字化转型保驾护航。
本书原作者是数据仓库传奇人物Bill Inmon和数据仓库专家Francesco Puppini,在行业内是全球公认的权威专家,本书可帮助读者掌握用于构建分析型应用*敏捷和灵活的设计方式:统一星型模型。在国内书籍中尚无该类书籍,填补市场空缺。
本书特点:
统一星型模型是一个高性能的有效工具,能够帮助交付和使用业务信息。本书原作者是数据仓库传奇人物Bill Inmon和数据仓库专家Francesco Puppini,在行业内是全球公认的权威专家,本书可帮助读者掌握用于构建分析型应用*敏捷和灵活的设计方式:统一星型模型(USS-Unified Star Schema)。与传统的维度模型相比,统一星型模型有很多优势。在这本书里可以看到统一星型模型作为单一星型模型的强大功能,不论是现在的业务还是将来的业务,都可以作为业务基础模型来使用。
掌握用于构建分析型应用敏捷和灵活的设计方式:统一星型模型(USSUnified Star Schema)。与传统的维度模型相比,统一星型模型有很多优势。在这本书里你可以看到统一星型模型作为单一星型模型的强大功能,对于你的公司来说,不论是现在的业务还是将来的业务,都可以作为你的业务基础模型来使用。
数据仓库传奇人物Bill Inmon(比尔?因蒙)和数据仓库专家Francesco Puppini(弗朗切斯科?普皮尼)逐步解释了为什么统一星型模型方法是当今商业智能设计的方法,并通过许多示例来验证这一点。
本书分为两部分。
部分,体系结构。介绍了数据集市和数据仓库的优点,包括组织如何发展到当前的分析状态,以及当前商业智能体系结构所面临的挑战。部分共分为8章:
第1章数据集市与维度模型:了解数据仓库和数据集市背后的驱动力以及特征。
第2章维度建模概念:掌握维度模型的概念,包括事实表、维表、星型模型和雪花模型。
第3章数据集市演变:了解多个数据集市的优势,以及由于数据集市管理不当而引起的数据质量、版本控制和可信度问题。
第4章转换:了解数据提取、转换和加载(ETL)的过程,以及提取、转换和加载(ETL)为报告带来的价值。
第5章集成数据集市的方法:了解数据仓库如何为您的公司报表工作带来收益。
第6章监控数据集市环境:了解监控数据集市的动机。确定需要修改的数据,区分活跃数据和非活跃数据,以及如何清除休眠数据。
第7章数据集市环境中的元数据和文档:了解数据仓库环境中元数据的不同类型,包括简单表和元素的元数据、数据来源元数据、加载日期型元数据、组合型元数据和使用型元数据。
第8章向集成型数据集市演变:了解当前数据仓库环境的演变取得的进展。
第二部分,统一星型模型的应用。涵盖了统一星型模型方法以及它如何解决部分中讨论的挑战。第二部分包含8章:
前言第9章统一星型模型简介:熟悉统一星型模型。了解其架构和用例,以及统一星型模型方法与传统构建模型方法的差异。统一星型模型的关键概念举例,如猎人和猎物以及与电话线相连的房屋。了解去范式化的危险。
第10章数据丢失:了解数据丢失的原因,以及为什么不建议在数据集市中进行完全外连接(full outer join)的原因。根据定义,所有其他连接(内连接、左连接和右连接)均会丢弃某些数据。因此,使用这些连接构建的数据集市也只能解决一部分的问题。然而,统一星型模型方法不会创建任何连接,因此,它不会丢失任何数据。join被引入统一星型模型命名约定中,可使开发人员和终用户的日常工作更加轻松。另外,需要了解Bridge表,并了解其如何连接到其他表。跟随Spotfire的实际效果,它能让终用户在没有数据专家的情况下也很容易创建仪表盘所需要的展示内容。
第11章扇形陷阱:了解面向数据模型的规范,并通过示例学习扇形陷阱的危险。了解一对多关系的另一种表示法。区分连接和关联,并能意识到内存关联是扇形陷阱的解决方案。另外,应了解“拆分度量(Splitting the Measures)”和“将所有度量移至Bridge表(moving all the measures to the Bridge)”的技术。后了解习惯于使用JSON的相关人员遇到的陷阱及其修复方法的示例。
第12章Chasm陷阱:回顾笛卡儿乘积,会看到一个基于LinkedIn的Chasm陷阱示例,该示例说明Chasm陷阱会产生不需要的重复项。了解Chasm陷阱如何呈线性增长以及呈平方增长。了解Chasm陷阱行计数的方法,该方法有助于计算所得表的准确行数。Bridge表基于一个联合体(Union),它不会创建任何重复项。后,请参阅JSON Chasm陷阱的示例及其修复方法。
第13章多事实查询:区分直接连接的多个事实与无直接连接的多个事实。了解尽管具有多对多关系的操作是联合(Union),但该联合很难创建并且会造成混乱。探索BI工具如何能够构建聚合的虚拟行(Rows),以及统一星型模型方法在Bridge表的基础上如何自然地嵌入联合(Union)中。跟随Spotfire中的实现,了解终用户可以多么容易地构建有价值的仪表盘(Dashboard)。
第14章循环:了解有关循环和解决循环的5种传统技术的更多信息。统一星型模型方法是一种很好的循环解决方案。在SAP Business Objects实践中,说明使用统一星型模型方法,终用户可以拥有真正的“自助服务体验”。
第15章非一致粒度:通过示例了解非一致粒度。当维度不符合要求时,创建BI解决方案会带来许多挑战,这些挑战传统上是通过创建临时查询或通过构建没有集成的仪表盘来解决的。了解统一星型模型引入了一种称为“重新范式化”的解决方案。它的优势在于,只在统一星型模型的设置阶段需要开发人员,同时统一星型模型不依赖于业务需求,因此终用户可以自由地生成其个性化的报告和仪表盘(Dashboard)。
第16章Northwind案例学习:见证使用ODM检测Northwind缺陷有多么简单。验证涉及产生扇形陷阱和Chasm陷阱的表,它们的连接存在产生不正确总数的风险。
比尔?英蒙(Bill Inmon),(生于 1945 年)是一位美国计算机科学家,被许多人公认为数据仓库之父。他是个提供数据仓库课程的人,创建了数据仓库的公认定义——一种面向主题的、非易失的、集成的、时变的数据集合,以支持管理层的决策。与另一位开创性的数据仓库架构师 Ralph Kimball 的方法相比,Inmon 的方法通常被描述为自上而下的方法。1999 年,Bill 创建了企业信息工厂网站,向专业人士和决策者介绍数据仓库和企业信息工厂。此外,Bill Inmon 是政府信息工厂和数据仓库 2.0 的创建者。 Bill Inmon先生在数据仓库和企业信息工厂的构建、使用和维护方面是一位多产的作者。他的著作包括“构建数据仓库”(1992 年,以及后来的版本)和“DW 2.0:下一代数据仓库的架构”(2008 年)。
2007 年 7 月,Bill Inmon被 Computerworld 评为对计算机行业前 40 年影响*大的十位人物之一。
序言
前言
推荐语
致谢
部分体系结构 /
第1章数据集市与维度模型 /
第2章维度建模概念 /
第3章数据集市演变 /
第4章转换 /
第5章集成数据集市的方法 /
第6章监控数据集市环境 /
被频繁使用的数据与不被频繁使用的数据 /
删除不被频繁使用的数据 /
丢弃旧版本的数据集市 /
第7章数据集市环境中的元数据和文档 /
简单表和元素的元数据 /
数据来源元数据 /
加载日期型元数据 /
组合型元数据 /
使用型元数据 /
第8章向集成型数据集市演变 /
数据不一致 /
糟糕的公司决策 /
进入数据仓库:单一版本事实 /
第二部分统一星型模型的应用 /
第9章统一星型模型简介 /
架构 /
统一星型建模方法 /
猎食者与猎物 /
循环 /
中央表 /
去范式化的威胁 /
第10章数据丢失 /
基于Sales表和Products表的示例 /
延迟连接 /
统一星型模型的核心:Bridge表 /
统一星型模型命名约定 /
统一星型模型如何解决数据丢失 /
使用Tibco Spotfire实施 /
第11章扇形陷阱 /
面向数据模型的约定 /
扇形陷阱的定义 /
基于Sales表和Shipments表的示例 /
一对多关系可视化 /
统一星型模型如何解决扇形陷阱 /
使用Microsoft Power BI实现 /
你的BI工具支持关联吗 /
拆分度量 /
将所有度量移到Bridge表 /
JSON扇形陷阱 /
第12章Chasm陷阱 /
笛卡儿乘积 /
Chasm陷阱的定义 /
基于LinkedIn的示例 /
Chasm陷阱行数计算方法 /
有度量的Chasm陷阱 /
USS如何解决Chasm陷阱 /
Tableau应用 /
基于多表的Chasm陷阱 /
JSON Chasm陷阱 /
第13章多事实查询 /
直接连接的多事实查询(一对多) /
无直接连接的多事实查询(多对多) /
基于Sales表和Purchases表的示例 /
联合 /
BI工具中聚合的弹簧效应 /
统一星型模型如何解决多事实查询 /
用Tibco Spotfire实施 /
第14章循环 /
基于客户关系管理系统的例子 /
使用传统技术解决循环 /
用联合(Union)来处理循环 /
统一星型模型如何解决循环问题 /
采用SAP Business Objects实现统一星型模型 /
第15章非一致粒度 /
基于Sales表和Targets表的示例 /
了解挑战 /
重新范式化 /
统一星型模型怎样解决非一致粒度 /
QlikView实现 /
处理聚合和详细信息 /
第16章Northwind案例学习 /
Northwind的面向数据模型 /
发现问题 /
了解陷阱的影响 /
安全区 /
从即席查询到自助式商业智能 /
具有挑战性的业务需求示例 /
如何在Northwind数据库中实现统一星型模型 /
使用各种商业智能工具实施 /
总结 /