北美数据仓库的四大常用技术(1)
数据挖掘、数据仓库,近些年在国内越来越热、越来越流行,需求比较多,应用也比较广泛,它们常服务于商务智能活动。通俗地概括来讲,我们可将它们统称作数据分析、数据计算。
我们介绍数据仓库在商业应用,主要涉及有两个方面,一个是有关数据仓库的常用技术,另一个是有关数据仓库的应用案例。同时也涉及数据仓库的两个背景,在我们经历的北美项目中,一个主要方面属于实际的商业应用项目,另一方面属于高校的学术研究领域的项目。两者在很多方面有明显的区别。我们这里主要介绍数据仓库的商业应用,因为商业应用经验存在比较大的价值。
数据仓库的商业应用技术之一:异构数据集成技术
数据仓库是集成的,数据仓库的要素包括本身是集成的、面向主题的、只读的、历史变化的。
如下图1:
例如,应用Oracle作为数据仓库的支撑环境,它有很多数据源,是由业务生产系统源源不断产生的,可能包括DB2、SQL Server、MY SQL等等不同的源数据。
异构数据集成的方法有很多,主要包括:
1. 如果Oracle作为数据仓库是基于Windows环境的,通过MS ODBC开放数据库互联;第三方ODBC开放数据库互联,如Data Direct Connect for ODBC;专用数据网关,如Transpatent Gateway;
2. 如果Oracle作为数据仓库是基于Unix或Linux环境的,通过Unix ODBC开放数据库互联;专用数据网关等。
3. 通过外部文件到数据库的导出和导入。
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。