数据仓库和数据集市的区别

田野与天 田野与天     2022-09-23     223

关键词:

 见过很多人搞不清楚数据仓库和数据集市的区别,下面是我见过的最好的关于“什么是数据仓库”的回答:

  “数据仓库是一种关系数据库模式,其中保存了来自一个或者多个源数据库的历史数据和元数据。数据仓库的目的是便于将数据的报告和分析汇总到多个层次。”

或者更简单点:

  “一个存放企业各个领域的数据的单独且有组织的库。”

典型的数据仓库有以下的一些特点:

  ~~涉及多个主题域

  ~~有十分详细的信息

  ~~集合来自不同数据源的数据

  ~~不一定使用维模型,但提供维模型

另一方面,数据集市(Data Mart)是数据仓库的一个访问层,用于从数据仓库抽取相关的数据给用户,数据集市是数据仓库的一个子集,通常面向特定的业务线或者团队(财政部门有他们自己的数据集市,市场部门有他们自己的数据集市,销售部门有他们自己的数据集市等等)。

 

根据Inmon学院对数据仓库的定义,一个独立的数据集市是更大的数据仓库的一个逻辑子集或物理子集,通常是相互独立的,因为数据模式和模型彼此之间不相同。微软提出的Tabular模型则使得你可以直接从数据仓库抽取数据而无需从数据集市抽取数据。

 

所以,简单地说,我认为数据仓库包含多个主题域,数据集市仅仅是多个主题域中的一个。

 

数据集市

数据集市,也叫数据市场,是一个从操作的数据和其他的为某种特殊的专业人员团体服务的数据源中收集数据的仓库。数据集市也只是一个数据仓库,数据集市的特点:规模小,通常是面向部门的有特定的应用由业务部门定义,... 查看详情

数据仓库和数据集市新手

】数据仓库和数据集市新手【英文标题】:NewtoDataWarehousingandDataMarts【发布时间】:2015-01-1412:31:49【问题描述】:我对DataWarehousing和Marts完全陌生,想就学习和获取知识的最佳资源寻求一些建议,让我开始走上正确的道路。我有... 查看详情

数据仓库数据集市数据湖数据中台到底有什么区别?

经常看到有人问这个问题,数据玩家也看过很多解释,感觉都不够直观,这里,我尝试用一个大家都理解的例子来说明。什么是数据仓库?大家都去宜家买过东西吧,还记得一楼的大仓库不,你如果看... 查看详情

处理数据集市/仓库中的时区

】处理数据集市/仓库中的时区【英文标题】:Handlingtimezonesindatamart/warehouse【发布时间】:2013-10-1803:30:05【问题描述】:我们开始设计数据集市/仓库的构建块,我们需要能够支持所有时区(我们的客户来自世界各地)。从在线(... 查看详情

数据仓库dm dw olap之间的联系与区别

参考技术ADM-datamarket数据集市DW-datawarehouse数据仓库OLAP-onlineanalysisprocess联机数据成本分析数据仓库存放所有数据,数据集市是根据需求主题(例如:销售收入分析,采购分析),提取的数据子集,OLAP是根据需求主题在报表上展示... 查看详情

数据仓库,数据集市建模

...   维度建模(dimensionalmodeling)是专门用于分析型数据库、数据仓库、数据集市建模的方法,  维度建模是一种将数据结构化的逻辑设计方法,它将客观世界划分为度量和上下文。度量是常常是以数值形式出现,事实周... 查看详情

数据集市是什么?(代码片段)

文章目录一、数据集市简介1.1、数据集市与数据仓库二、数据集市的类型2.1.依赖数据仓库2.2.独立数据集市2.3.混合数据集市三、数据集市的特点四、数据集市的优点五、实施数据集市的步骤关注我的公众号【宝哥大数据】,... 查看详情

数据仓库上的数据集市练习

】数据仓库上的数据集市练习【英文标题】:DatamartexerciseonaDatawarehouse【发布时间】:2021-01-1716:44:08【问题描述】:这是练习的正文:让我们考虑对生产机器的监控,例如在制造业中。由唯一ID标识的机器在给定的温度、湿度、... 查看详情

第二章:数据仓库与数据集市建模

前言       数据仓库建模包含了几种数据建模技术,除了之前在数据库系列文章中介绍过的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术。       本文将详细介绍... 查看详情

数据仓库架构

数仓架构老生常谈一个数据仓库是一个统一的架构下组织不同数据源的异类集合。有两种构建数据仓库的方法:解释自上而下的方法和自下而上的方法。1.自上而下的方法: 基本组件讨论如下:外部源–外部源是从中收集... 查看详情

SQL 中物化视图和数据集市的区别?

】SQL中物化视图和数据集市的区别?【英文标题】:DifferencesbetweenmaterializedviewsanddatamartsinSQL?【发布时间】:2018-01-0903:31:35【问题描述】:我正在尝试了解两者之间的区别,以及何时使用一个而不是另一个是可取的。【问题讨论... 查看详情

bi中事实表,维度表和数据集市,数据仓库的理解

...角度分析事实表。事实表(fact)存放着一些业务产生的数据,例如:商品订购产生的订单信息,银行的流水信息,erp系统的办公信息。但它不仅存放着上述事实信息,而且存放在事实信息与维度信息关联的键值,例如订单信息... 查看详情

第二节:数据仓库系统的体系结构

1:引言 上一篇介绍了数据仓库的定义:面向主题的,集成的,不可修改的,随时间不断变化的用来更好的为企业或组织决策分析的数据集合。 数据仓库是区别于传统操作型数据库的数据集合,主要应用于分析型数据操作... 查看详情

4万字全面掌握数据库,数据仓库,数据集市,数据湖,数据中台

...着诸如互联网以及物联网等技术的不断发展,越来越多的数据被生产出来-据统计,每天大约有超过2.5亿亿字节的各种各样数据产生。这些数据需要被存储起来并且能够被方便的分析和利用。随着大数据技术的不断更新和迭代,... 查看详情

数据仓库或孤岛数据集市

】数据仓库或孤岛数据集市【英文标题】:Datawarehouseorsilodatamarts【发布时间】:2019-04-2417:23:11【问题描述】:目前我们有12个不同的数据库,其中7个是维度的。我们是一个以知识为基础的非营利组织,我们拥有基于患者所患疾... 查看详情

数据仓库中事实表的复合索引 - 数据集市

】数据仓库中事实表的复合索引-数据集市【英文标题】:Compositeindexesonfacttablesinadatawarehouse-datamart【发布时间】:2014-01-2620:38:13【问题描述】:在OracleEDW中的事实表上保留复合唯一索引是否是一种最佳实践-避免重复的数据集市... 查看详情

数据仓库之架构发展

数据仓库有很多类型的架构方式,按照发展的历程上,主要有如下几类标志性。独立的数据集市架构。在最早期的数据仓库建设中,大多是以部门为单位搭建数据仓库,也就是数据集市,供整个部门使用。这样能够很快的构建好... 查看详情

数据库 vs 数据集市 vs 数据仓库 vs 数据湖

】数据库vs数据集市vs数据仓库vs数据湖【英文标题】:DatabasevsDataMartvsDataWarehousevsDataLake【发布时间】:2020-05-1212:23:31【问题描述】:寻找高层之间的差异/比较数据库数据集市(自上而下的方法)数据仓库数据湖如果没有具体情... 查看详情