欢迎投稿

今日深度:

数据仓库的设计目的,数据仓库设计目的

数据仓库的设计目的,数据仓库设计目的


数据仓库设计的目的或者衡量成功的标准:


1. 数据仓库必须使组织机构的信息变得容易存取。

2. 数据仓库必须一致地展示组织机构的信息。

3. 数据仓库必须具有广泛的适应性和便于修改。

4. 数据仓库必须在推荐有效决策方面承担最基本的角色。

5. 数据仓库为业务群体所接受的前提是被认定是成功的。


数据仓库与数据库的不同

简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的。

数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。

数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。维是看问题的角度,比如时间,部门,维表放的就是这些东西的定义,事实表里放着要查询的数据,同时有维的ID。

单从概念上讲,有些晦涩。任何技术都是为应用服务的,结合应用可以很容易地理解。以银行业务为例。数据库是事务系统的数据平台,客户在银行做的每笔交易都会写入数据库,被记录下来,这里,可以简单地理解为用数据库记帐。数据仓库是分析系统的数据平台,它从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。比如,某银行某分行一个月发生多少交易,该分行当前存款余额是多少。如果存款又多,消费交易又多,那么该地区就有必要设立ATM了。

显然,银行的交易量是巨大的,通常以百万甚至千万次来计算。事务系统是实时的,这就要求时效性,客户存一笔钱需要几十秒是无法忍受的,这就要求数据库只能存储很短一段时间的数据。而分析系统是事后的,它要提供关注时间段内所有的有效数据。这些数据是海量的,汇总计算起来也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。

数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。那么,数据仓库与传统数据库比较,有哪些不同呢?让我们先看看W.H.Inmon关于数据仓库的定义:面向主题的、集成的、与时间相关且不可修改的数据集合。

“面向主题的”:传统数据库主要是为应用程序进行数据处理,未必按照同一主题存储数据;数据仓库侧重于数据分析工作,是按照主题存储的。这一点,类似于传统农贸市场与超市的区别—市场里面,白菜、萝卜、香菜会在一个摊位上,如果它们是一个小贩卖的;而超市里,白菜、萝卜、香菜则各自一块。也就是说,市场里的菜(数据)是按照小贩(应用程序)归堆(存储)的,超市里面则是按照菜的类型(同主题)归堆的。

“与时间相关”:数据库保存信息的时候,并不强调一定有时间信息。数据仓库则不同,出于决策的需要,数据仓库中的数据都要标明时间属性。决策中,时间属性很重要。同样都是累计购买过九车产品的顾客,一位是最近三个月购买九车,一位是最近一年从未买过,这对于决策者意义是不同的。

“不可修改”:数据仓库中的数据并不是最新的,而是来源于其它数据源。数据仓库反映的是历史信息,并不是很多数据库处理的那种日常事务数据(有的数据库例如电信计费数据库甚至处理实时信息)。因此,数据仓库中的数据是极少或根本不修改的;当然,向数据仓库添加数据是允许的。

数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。

补充一下,数据仓库的方案建设的目的,是为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。为了更好地为前端应用服务,数据仓库必须有如下几点优点,否则是失败的数据仓库方案。

1.效率足够高。客户要求的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析。由于有的企业每日的数据量很大,设计不好的数据仓库经常会出问题,延迟1-3日才能给出数据,显然不行的。

2.数据质量。客户要看各种......余下全文>>
 

怎设计、创建一个面向CRM的数据仓库?

1 CRM系统

  1.1 CRM简介

  一个完整的CRM主要可分成3个部分:操作型CRM、协作型CRM和分析型CRM。操作型CRM是CRM中最基本的功能系统,它提供整个CRM的流程管理功能,主要是提供以客户为中心的市场、销售,服务与支持等业务流程的自动化。协作型CRM是以客户服务中心为主要表现形式,以计算机电话集成技术为核心,使客户可以通过电话、传真、E-mail、Web站点等方式更快捷、更有效地与企业进行交互。

  分析型CRM是通过对操作型CRM、协作型CRM、其它企业应用系统和外部数据源中保存的与客户相关的数据的集成,建立以客户为中心的数据仓库,获得企业范围内客户数据的一致视图,并以集成后的客户数据为基础,通过查询与报表分析、OLAP分析和数据挖掘等手段获取关于客户的知识,为客户提供个性化的产品和服务,提高客户的满意度和忠诚度,实现客户终身价值的最大化。本文主要针对的是分析型CRM。

  1.2在CRM中应用数据仓库的必然性

  数据仓库是CRM的中心环节甚至是CRM的灵魂所在,它存储了企业内部和外部的各种数据,并将这些源数据整理成一致的、随时间变化的以及最大限度优化分析的客户信息库,通过OLAF分析和数据挖掘来发现大量客户信息中所隐藏的规律,为企业进行经营决策提供支持。另一方面,它将CRM的业务平台与分析平台进行了有效地分离,使得业务型数据库可以专注于事务处理,既提高了事务处理的效率又优化了分析处理的能力。

  传统的企业事务处理系统部是各个部门根据自身事务处理的需要保留部分数据,而且各个模块之间的联系并不紧密,虽然客户的部分信息也能从这些系统中获取,但远远不能满足需要。例如,对于一个典型的以客户行为为目标的分析,通常需要更多的日常积累的、反映历史变化的数据才有可能进行有效地分析,然而在这一点上传统的教据库系统是很难做到的(不论是从数据的存储量还是从数据的整合来考虑)。因此,数据仓库的引入是必然的。

  1.3分析型CRM的体系结构

  将数据仓库技术引入到对客户信息的管理与组织上来,即建立一个面向CRM应用系统的客户信息数掘仓库,它实现了来自企业内部及外部的多种分割应用的客户信息的集成和统一,这正是分析型CRM的基本任务。如图1所示为分析型CRM的体系结构。其中,客户信息数据仓库是分析型CRM的核心,它的任务主要是从OLTP系统中抽取数据、把抽取出的数据进行统一的格式转换,将数据加载到数据仓库环境中(以上3步称为ETL,即extract,transform,load,抽取,转换,装载),管理和维护数据仓库中的数据。最后,通过对这些数据的OLAP分析和数据挖掘,企业管理者可以得到许多有价值的信息,从而更好地为客户服务。

  建立数据仓库时,这里采用的是一种可扩展的数据仓库体系结构,即中间层包括两种类型的数据库:一种是基本的包含多个主题的数据仓库;另一种足从属的针对某一主题的数据集市。如图1所示,这里根据数据仓库中的4个主题分别设计了4千数据集市。采用可扩展的体系结构,可以缩短数据仓库的建设周期,降低费用支出,并且避免了直接建立数据集市而不建立数据仓库所存在的扩展性较差、多个教据集市间难以保持同步的铗点。

  2客户信息数据仓库的设计

  设计客户信息数据仓库的第一步就是要确立主题。主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的对象。设计数据仓库首先要从操作型环境中的数据入手,结合决策支持的实际需要,确定数据仓库的主题。根据所涉及的分析型CRM的功能,该客户信息数据仓库包含了客......余下全文>>
 

www.htsjk.Com true http://www.htsjk.com/shujukunews/3770.html NewsArticle 数据仓库的设计目的,数据仓库设计目的 数据仓库设计的目的或者衡量成功的标准: 1. 数据仓库必须使组织机构的信息变得容易存取。 2. 数据仓库必须一致地展示组织机构的信息。...
评论暂时关闭