| itgoit's profileTo arrive at the simple ...BlogListsNetwork | Help |
|
January 25 Business Intelligence - Dimensional Modeling Concepts and Terminology今天开讲DW的技术基本-维度模型,有称为多维模型。英文叫Dimensional Modeling。
前面的章节已经讲到了Dimensional Modeling与Normal Form (3NF 3范式或6NF 6范式)的区别。一定要明白并理解好Dimensional Modeling,否则在你请求源系统DBA帮助的时候会被他们当作你不懂RDBMS的笑话。
Dimensional Modeling必须满足以下的以下目的:
A. 给用户呈现的信息越简单越好
B. 快速的返回信息检索结果
C. 对用户各种业务流程用不同的相关信息表达其所需要呈现的
术语1:dimensional model
简单的信息表现并不代表数据模型的简单,在DW中我们往往用多维模型(dimensional model )来替代范式模型。dimensional model 由一系列中心的因素表fact table和相关的维度表dimensions table组词。
A dimensional model is made up of a central fact table (or tables) and its associated dimensions. The dimensional model is also called a star schema because it looks like a star with the fact table in the middle and the dimensions serving as the points on the star.(The Microsoft Data Warehouse Toolkit : With SQL Server 2005 and the Microsoft Business Intelligence Toolset )
术语2:facts
维度模型的核心是因素(fact),每个fact table都包含着关联业务过程的可度量值。在fact table中的每一条记录就是一个可度量值记录,每一个商业过程活动可以表达为fact table中的记录。大多数fact是一个数字,而其中大部分fact table中的fact 记录值可以累加。比如订单的总额,你可以将本月每日的所有订单总额累加,而商品的单价就不太合适累加,也有合适半累加的,比如市场份额。
术语3:grain
粒度。不同于SQL Isolation Level, 这里的粒度回归原意是指在fact table中每条记录的粒度必须使一致的,比如不能一条记录是今天的订单总额,另一条是本月的。
术语4:dimensions
维度!如果说一个fact代表一个商业行为的动作的话,一个dimensions就代表了一个商业的对象,比如:产品、客户、工具、员工、日期...
dimension可以说类似ER中的entry,是围绕可度量因素fact的业务参与体(paticipates, parties)的对象。可度量因素的fact必须要从多个角度去衡量它,比如从客户收入分类角度看订单分布,从客户地域角度看订单分布,从销售人员年资看订单分布,从分公司角度订单分布...同样一个订单fact,可以有很多dimensions围绕他(关联他),在日后的分析统计中从这些不同角度去了解订单fact。这些角度往往作为dimension table的描述性属性(descriptive attribute)出现,比如customer table中的生日、性别、地址等。这些描述性属性可能存在树形架构关系或1-多对应关系。
在通常的关系数据库系统(RDBMS)中,我们常用规范化(normalization)来规范我们的数据模型,这往往要求我们消除数据冗余等。在DW dimension模型中我们常用反规范化(denormalization)来保持数据模型的简单,以确保今后数据查询的简单。
TrackbacksThe trackback URL for this entry is: http://itgoit.spaces.live.com/blog/cns!5FCEF8A356C9EA13!129.trak Weblogs that reference this entry
|
|
|