阅读 60

名词解释

  1. Data Warehouse,数据仓库,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间成本、质量以及控制进。

  2. OLTP:On-Line Transaction Processing联机事务处理过程(OLTP),也称为面向交易的处理过程,其基本特征是前台接收的用户数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果,是对用户操作快速响应的方式之一。有数据库即可完成。

  3. OLAP:在线分析处理(OLAP Online Analytical Processing),为业务决策提供数据分析。 OLAP系统允许用户一次分析来自多个数据库系统的数据库信息。需要建立多维数据模型。

  4. Data Mart,数据集市,也叫数据市场,为满足特定的部门或者用户需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。
    5.** 维度表**:维度表是维度属性的集合,是分析问题的一个窗口。是人们观察数据的特定角度,是考虑问题时的一类属性,属性的集合构成一个维。

  5. 事实表:事实表是数据仓库结构中的中央表,它包含联系事实与维度表的数字度量值和键。事实表包含描述业务(例如产品销售)内特定时间的数据。

  6. ETL:是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。

  7. 结构化数据:结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。

  8. 半结构化数据:半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。

  9. 非结构化数据:就是没有固定结构的数据。各种文档、图片、视频/音频等都属于非结构化数据。对于这类数据,我们一般直接整体进行存储,而且一般存储为二进制的数据格式。

  10. Json:是一种轻量级的数据交换格式

  11. 维度建模(dimensional modeling)是数据仓库建设中的一种数据建模方法,将数据结构化的逻辑设计方法。

  12. 多维矩阵:多维矩阵是一种新的理论,是一种新的处理多指标问题的方法和体系。

  13. ACID原则是数据库事务正常执行的四个,分别指原子性、一致性、独立性及持久性

  • 事务的原子性(Atomicity):是指一个事务要么全部执行,要么不执行,也就是说一个事务不可能只执行了一半就停止了。比如你从取款机取钱,这个事务可以分成两个步骤:1划卡,2出钱。不可能划了卡,而钱却没出来。这两步必须同时完成,要么就不完成。
  • 事务的一致性(Consistency):是指事务的运行并不改变数据库中数据的一致性。例如,完整性约束了a+b=10,一个事务改变了a,那么b也应该随之改变。
  • 独立性(Isolation):事务的独立性也有称作隔离性,是指两个以上的事务不会出现交错执行的状态。因为这样可能会导致数据不一致。
  • 持久性(Durability):事务的持久性是指事务执行成功以后,该事务对数据库所作的更改便是持久的保存在数据库之中,不会无缘无故的回滚。
  1. ERP:是企业资源计划(Enterprise Resource Planning )的简称,是指建立在信息技术基础上,集信息技术与先进管理思想于一身,以系统化的管理思想,为企业员工及决策层提供决策手段的管理平台。
  2. SCM(Supply Chain Management) 供应链管理,就是对企业供应链的管理,是对供应、需求、原材料采购、市场、生产、库存、定单、分销发货等的管理,包括了从生产到发货、从供应商的供应商到顾客的每一个环节。
  3. External Data : 外部数据源
  4. ODS: (Operational Data Store)是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求。常常被作为数据仓库的过渡,也是数据仓库项目的可选项之一。
  5. Staging Area: 暂存区域,临时区域,通常在很多传统集中式版本控制系统中,只有两个空间用来管理你的数据,一个是你的working copy(工作区),另一个便是datastore(版本库),然而在Git中,引入了staging area(index)这一概念,我们可以把它看做一个“码头”,你来决定其中的哪些改变可以被“运走”。
  6. HDFS: (Hadoop Distributed Filesystem), 即Hadoop分布式文件系统,简单理解就是多台机器组成的一个文件系统。

作者:求知笔记

原文链接:https://www.jianshu.com/p/20df7d82ad9e

文章分类
后端
文章标签
版权声明:本站是系统测试站点,无实际运营。本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 XXXXXXo@163.com 举报,一经查实,本站将立刻删除。
相关推荐