Star Schema 和 Snowflake Schema 的区别?
星型架构
星型模式是将记录组织成维度表、事实表和物化视图的会议。所有信息都存储在列中,需要元数据来识别作为多维对象的列。
星型模式是一种关系模式,其中关系模式的设计描述了多维数据模型。星型模式是显式数据仓库模式。之所以称为星型模式,是因为该模式的实体关系图再现了与主表不同的带有点的星型。模式的中间包括一个大的事实表,星号的点是维度表。
雪花架构
雪花模式是星型模式的一种变体,其中几个维度表被规范化,进一步将数据划分为更多的表。生成的模式图形成类似于雪花的形状。
雪花模式是星型模式的扩展,其中星形的每个点都分解为更多的点。它被称为雪花模式,因为雪花模式的图表模拟雪花。Snowflaking 是一种标准化 STAR 模式中维度表的方法。当它完全规范化一些维度表时,结果结构类似于雪花,中间是事实表。
雪花模型和星型模型的区别在于雪花模型的维度表可以保持规范化的形式。这样的表维护简单,也可以存储存储空间,因为当维度结构作为列涉及时,大维度表可以完全大。
由于该空间中的大部分是冗余信息,因此制作规范化结构将减少完整的空间需求。但是,雪花结构会降低浏览效率,因为执行查询需要更多连接。因此,系统性能会受到不利影响。性能基准测试可用于确定什么对这种设计有利。
让我们看看 Star Schema 和 Snowflake Schema 之间的比较。
星型架构 | 雪花架构 |
---|---|
It is a simple database design. | 这是一个复杂的数据库设计。 |
In a star schema, only a single join makes the relationship among the fact table and any dimension tables. | 雪花模式需要多个连接来检索数据。 |
Cube processing is quicker. | 由于复杂的连接,多维数据集处理可能会很慢。 |
It doesn't use normalization. | 它使用规范化和非规范化。 |
Star schema uses a fewer number of joins. | 雪花模式使用了大量的连接。 |