欢迎投稿

今日深度:

全面数据资产建模与管理,

全面数据资产建模与管理,


 “获取数据从哪里来,到哪里去”是当前企业数据中心的主要挑战。随着数据复制(Replication)、数据仓库以及其他数据集成技术的广泛采用,企业 数据集成度及依赖关系变得非常复杂,任何一个数据元素的修改都可能引起整个系统的巨大改变。数据资产就是企业数据中心建立全生命周期中所涉及的分析、设计 及实现的所有信息与文档。拥有该过程中的所有数据流信息以及数据资产的文档及报表能力,可以大大帮助用户提高变化影响度的分析与预测水平。有效建立与管理 数据资产,提供任何数据的相关信息包括设计来源与目的等,需要新一代的全面数据建模工具-PowerDesigner12.0。

数据资产管理对数据建模工具的新需求

    对于数据资产管理最重要的就是能够清楚地定义数据元素,包括数据格式,别名,统计表以及其他特性标识符等;描述数据元素定义的信息来源,及其相关数据元素 的信息(如两者之间的转换规则);记录使用信息,包括数据元素的产生及修改信息(人员及日期等),安全及访问控制信息,及访问历史记录。用户能够跟踪到数 据资产在整个分析、设计及开发流程中的所有状态,包括中间过渡状态。为了达到这个目标,对原有的数据建模工具提出新的需求:
1) 数据元素的分析、设计应与企业的业务需求及业务过程定义相结合。
2) 数据元素的定义必须支持版本管理,来记录其历史变化过程。
3) 定义数据流,即不同阶段(如分析与设计)之间或同一阶段中不同数据之间的数据转换关系能力。

“积木”- 全面数据建模工具集

    为应对上述需求,PowerDesigner提供 丰富的数据建模“积木”即工具集。使用过程建模,数据分析与设计技术来捕捉及管理数据财产之间的依赖关系。同时,PowerDesigner提供了元数据 知识库(Metadata Repository)来支持可靠的版本控制与管理,包含完整的用户历史改变记录。

    为了记录所有的需求及分析过程,PoweDesigner完全集成了的需求模型及业务过程模型。PowerDesigner需求模型建立了业务需求与其他 分析与设计模型之间的管理。理解在业务需求环境下的数据元素,可以帮助明确数据元素生成的初衷与意图。任何对业务需求的改变,都可以很容易地追踪到相关的 数据及过程元素,甚至是最终的实现。反过来,任何的分析与设计的元素都可以查询到相应的需求来源,以保证任何的设计修改不会与业务需求产生冲突。 PowerDesigner业务过程模型(BPM)提供了直观的非技术化的过程层次结构定义与过程流定义。数据与BPM中的活动及流相关联,产生了 CRUD矩阵,方便定义数据在业务过程运行中的使用状况,以及理解数据在整个业务运行中的流动及变化状况。

    为了跟踪业务需求中的数据元素最终是如何物理实现的,PowerDesigner提供了可靠的三级数据建模能力,即概念,逻辑以及物理数据建模。 PowerDesigner 概念数据模型(CDM)提供了一个与实现完全独立与具体数据库系统的数据定义方式,包括数据字典,数据格式,业务描述,键描述等。CDM可以关联不同层次 的数据实现模型(包括逻辑与物理)。PowerDesigner物理模型,提供了逻辑与物理数据建模能力。支持近60个数据库系统正向生成数据库或反向导 入数据库定义,包括Oracle,IBM(DB2, Informix, Red Brick™ WareHouse, Microsoft (SQL Server和Access),Sybase(ASE, ASA和 IQ),NCR Teradata, MYSQL等等。同时还支持数据库对象,Java™, XML,数据库中的Web服务,用户,角色以及权限管理等等。

    对于版本管理与历史记录,PowerDesigner集成了一个功能丰富且安全的企业知识库。提供了为模型与子模型提供了基于角色的访问控制,版本控制与配置管理,比较与合并,以及模型及版本之间的增量报表功能,并提供了整个知识库的全面查询功能。
搭“积木” - “链接”与“同步”

    数据资产管理的关键问题不仅仅是通过各种建模工具来记录需求,业务过程,概念、逻辑和物理数据模型,而且要能将所有这些模型的合理的集成到一块。必须能够回答如下问题:
1. 对于任一数据元素,可以知道定义信息从哪里产生的?
2. 改变该数据元素,需知道会影响多少系统?
3. 该数据元素的具体实现在哪里?在多少项目及系统里?
4. 在某个系统中该数据元素是怎样被使用的?
5. 该数据元素的真正含义是什么?

为了回答这一系列问题,PowerDesigner提供了先进的链接与同步技术(如图1)来:
• 建立数据元素与BPM的活动及活动流之间的链接关系,描述该数据元素由业务过程中哪个部分使用。
• 建立数据实体或数据项与一个或多个逻辑或物理数据表和列之间的链接关系,提供真正意义上的企业级数据定义方式,达到分析到实现的整个过程的连贯性。
• 建立数据与UML面向对象模型之间的链接,来保持数据与代码中的业务逻辑的一致性。
• 支持从任何阶段,任何模型开始的迭代式分析与设计方式,并保证各模型之间变化的同步。


PowerDesigner为记录各种不同模型提供了所有工具,适合从抽象到实现的各个层次的需求。可是拥有如此丰富的技术并不是数据资产管理面临的唯一挑战,更大的问题是“如何在现有的企业环境下达到全面数据管理的目标?

迭代式建立全面数据管理

    企业常常会提出这样的问题“我们已经有数据库系统,但是分析与设计文档比较少,我们怎么能达到这个目标呢?”。我们可以先通过反向工程,从数据库中导出数 据库定义信息,即物理数据模型,然后可以从物理数据模型生成相应的概念数据模型。PowerDesigner可以自动建立两个模型之间的双向链接关系。基 于这两个模型,可以开始数据资产的管理。不仅如此,我们还可以同时将多个不同数据库系统导入不同不同的物理数据模型,然后将它们“合并”到相同的概念数据 模型中。如果对于合并的结果不满意,PowerDesigner的多级Undo/Redo特性,可以取消模型的任意操作,直到最初的状态。

同时,用户在链接建立过程中,需要知道数据是怎样通过一个系统转换到另一系统,并希望可以手动改变转换过程。PowerDesigner提供了内建的映射特性来描述转换关系(如图2),并可以通过图示化的映射工具定义该关系。


当 模型建立到一定的规模,必须考虑将其导入企业知识库来进行版本管理及访问控制。现在可以建立数据资产的初始版本。为缺少文档的大系统来还原数据资产是非常 繁杂的任务。迭代式建模方法可以很好的缓解该矛盾。企业可以从只有5%或10%的系统设计文档(甚至没有)开始,随着时间的推移,越来越多的系统定义被抽 取到PowerDesigner中,直到建立大量可用的模型定义及其依赖和链接关系。

影响度分析

    PowerDesigner通过对从不同层次的数据建模,并与业务过程建模和UML面向对象建模建立双向链接关系,能够有效的获取及管理数据资产。如何回 答“数据变化会影响哪里?”。PowerDesigner提供了独特的影响度分析特性(如图3)。可以选择模型中的任意对象,打开“影响度分析”,与该对 象相关的上游与下游的依赖关系将通过树状形式的报表展示。该报表可以存储或打印与项目的其他成员来分享。


结论

    PowerDesigner不仅仅提供了结合业务需求及业务过程上下文的数据建模所需的工具,而且提供了丰富的关系追踪能力来记录数据元素的生命周期。伴 随影响度分析,基于安全版本控制的企业知识库,以及全面的双向工程等强大功能,PowerDesigner大大缓解了数据资产管理的矛盾,提高了数据资产 建模的自动化。PowerDesigner让“数据从哪里来,到哪里去”成为企业数据管理的基础架构,可以持续地维护和改变,而不是一个需要在系统完成之 后才进行的的全新任务。

www.htsjk.Com true http://www.htsjk.com/teradata/36452.html NewsArticle 全面数据资产建模与管理,  “获取数据从哪里来,到哪里去”是当前企业数据中心的主要挑战。随着数据复制(Replication)、数据仓库以及其他数据集成技术的广泛采用,企业数据集...
相关文章
    暂无相关文章
评论暂时关闭