欢迎投稿

今日深度:

北美数据仓库的四大常用技术(1)

北美数据仓库的四大常用技术(1)


数据挖掘、数据仓库,近些年在国内越来越热、越来越流行,需求比较多,应用也比较广泛,它们常服务于商务智能活动。通俗地概括来讲,我们可将它们统称作数据分析、数据计算。

我们介绍数据仓库在商业应用,主要涉及有两个方面,一个是有关数据仓库的常用技术,另一个是有关数据仓库的应用案例。同时也涉及数据仓库的两个背景,在我们经历的北美项目中,一个主要方面属于实际的商业应用项目,另一方面属于高校的学术研究领域的项目。两者在很多方面有明显的区别。我们这里主要介绍数据仓库的商业应用,因为商业应用经验存在比较大的价值。

数据仓库的商业应用技术之一:异构数据集成技术

数据仓库是集成的,数据仓库的要素包括本身是集成的、面向主题的、只读的、历史变化的。

如下图1:

例如,应用Oracle作为数据仓库的支撑环境,它有很多数据源,是由业务生产系统源源不断产生的,可能包括DB2、SQL Server、MY SQL等等不同的源数据。

异构数据集成的方法有很多,主要包括:

1. 如果Oracle作为数据仓库是基于Windows环境的,通过MS ODBC开放数据库互联;第三方ODBC开放数据库互联,如Data Direct Connect for ODBC;专用数据网关,如Transpatent Gateway;

2. 如果Oracle作为数据仓库是基于Unix或Linux环境的,通过Unix ODBC开放数据库互联;专用数据网关等。

3. 通过外部文件到数据库的导出和导入。




www.htsjk.Com true http://www.htsjk.com/shujukukf/17669.html NewsArticle 北美数据仓库的四大常用技术(1) 数据挖掘、数据仓库,近些年在国内越来越热、越来越流行,需求比较多,应用也比较广泛,它们常服务于商务智能活动。通俗地概括来讲,我们可将它...
评论暂时关闭