数据仓库和 OLAP 与数据挖掘有何关系?
数据仓库和数据集市用于广泛的应用领域。业务主管使用数据仓库和数据集市中的数据来实施数据分析并制定战略决策。在一些公司中,数据仓库被用作企业管理的计划-执行-评估“闭环”反馈系统的一个组成部分。
数据仓库广泛用于银行和金融服务、消费品和零售分销部门以及受控制造,包括基于需求的生产。通常,数据仓库使用的时间越长,它的发展就越多。这种演变发生在各个阶段。
最初,数据仓库通常用于生成文档和回答预定义的查询。它可用于分析汇总和详细信息,结果以文档和图表的形式显示。后来,数据仓库用于战略目标,实施多维分析和复杂的切片操作。
最后,数据仓库可用于使用数据挖掘工具进行知识发现和战略决策。在这个框架中,数据仓库的工具可以分为访问和检索工具、数据库文档工具、数据分析工具和数据挖掘工具。
业务用户需要有方法了解数据仓库中存在的内容(通过元数据),如何创建数据仓库的内容,如何使用分析工具测试内容,以及如何显示此类分析的结果。
数据仓库应用分为信息处理、分析处理和数据挖掘三种。
信息处理- 它使用交叉表、表格、图表或图形提供查询、基本统计分析和记录。数据仓库数据处理的最新趋势是创建低成本的基于 Web 的访问工具,然后与 Web 浏览器统一。
分析处理- 它提供基本的 OLAP 操作,包括切片和切块、向下钻取、上卷和旋转。它通常以汇总和详细结构对历史信息进行操作。在线分析处理相对于数据处理的主要优势在于数据仓库信息的多维数据分析。
数据挖掘- 它通过发现隐藏的模式和关联、构建分析模型、实施分类和预测以及使用可视化工具显示挖掘结果来提供知识发现。
数据挖掘比OLAP包含更多自动化和更深入的分析,数据挖掘有望拥有更广泛的软件。数据挖掘可以支持业务经理找到并接触到更合适的用户,并获得可以支持推动市场份额和提高利润的关键业务洞察力。