5.XML服务器:一般认为,XML服务器是一个提供数据服务的平台,而这里的数据就是以XML形式出现的,而这些数据主要是为分布式应用程序服务的,比如电子商务和B2B应用等。XML服务器通常包括了一个完整的应用开发环境,并通过各种数据存储方式来使应用程序可以方便的获取和使用这些数据。存储的数据包括传统的数据库数据、电子邮件信息和文件系统等等。我们知道传统的Web服务器都是基于HTML文本进行信息传送的,随着XML技术的出现,对于基于XML的Web服务器的需求也就产生了。那么到底什么是XML服务器呢?准确定义XML Server这个概念是困难的,因为这实在是一个比较新,而且概念很广泛的东西,虽然已经有许多的产品称自己为XML Server,比如DataChannel公司的DataChannel Server 4.1;Software AG公司的Tamino;Excelon公司的excelon,但在应用的范围上以及功能上,每种产品都各不相同,因此这里也就不为XML Server进行定义,而是归纳这几种产品的共同拥有的一些特点,以说明的方式来向大家解释XML Server这个概念。 简单地讲,XML Server是一个提供数据的平台,它能够以XML文档的形式与分布式的应用进行数据交互。比如电子商务这一类的应用。这听上去和传统的数据库非常的相似,它和数据库一样提供数据的存贮与提取功能,但数据的格式的是基于XML的,因此在数据的处理方面,所用的是和传统数据库完全不同的技术了。
所以XML Server被认为是XML Database其中的一种,XML-enabled Server则相对来讲比较容易理解,因为它本质上就是一个Web Server,对于客户端而言,浏览Web,客户端不会感觉它和传统Web Server有什么太大的区别,但实际上Server端在对请求REQUEST)处理方法上,XML-enabled Web Server和传统Web Server是完全两种不同的方式,这是由于XML文档与HTML文档本身的特性所决定的。我们大家都知道,XML文档是一种以数据为中心的文档,XML文档本身没有表示格式化的信息,而是通过特定的XSL或者CSS来表现,也就是说数据和表现是分离的。而在客户端提交需求后由XML-enabled Web Server将内容与形式结合后把最终结果发布给客户端的Web Server。因此这是一种胖服务器,瘦客户的模式。这种模式同微软将XSL Parser集成到IE中的设计思想是完全不同的。它的优点是能够对不同的设备浏览Web的提供各自相应的格式的文档,而不需要人工的干涉。
从另外一个角度讲,XML Server可以提供比单纯XML文档更强的管理XMl格式数据的能力,而且可以避免用传统数据库时需要进行数据转换的过程因为XML是标准的扩展标记语言,并不是各个公司专属的技术,而数据库厂家对自己的数据库都有不同的格式,所以必须通过一些中间件进行转换),而获得高效。
当然,任何技术都不是尽良尽美的,任何一项新的技术在没有完全成熟以前都会存在许多的缺点,XML Server同XML-enabled Server也不会例外,它们分别存在下面一些缺点或问题:
对于XML Server而言:XML Server的性能如何还没有得到验证,因为它采用的是一种全新的数据组织方式,而这种方式在过去还没有得到过广泛的应用。正如我们有理由看好XML Server发展前景的同时,我们也有理由对这种没有经过大范围使用的产品持怀疑态度。我们可以看一下几种典型XML Server产品的配置需求。
DataChannel Server 4.1 在Windows环境下的硬件要求:500MHz or faster Pentium III processor with at least 256MB of RAM.
DataChannel Server 4.1 在Windows环境下的硬件要求:Sun Ultra 10 or equivalent. At least 256MB of RAM.
Tamino 在Windows环境下的硬件要求:At least 300MHZ or faster. At least 256MB of RAM.
对于XML-enabled Web Server而言:最大的问题是XML-enabled Web Server太复杂了,比较起原来用Html和传统Web Server建设Web,懂得使用XML这些先进技术的人还是太少了,而且Server的安装也显得太复杂,而开发工具则又太专业了。如何使电脑的初级用户能很快的学会使用它,是它需要解决的另外一个问题。 基于XML的Web服务器体系结构如下所示:

最后,我们看一下微软对基于XML的Web服务器的支持,它的实际实现方法是通过IIS的ISAPI扩展用以提供通过HTTP直接访问SQL Server并将查询结果形成XML返回到客户端而完成的。最简单的访问方法是直接HTTP的URL中使用SQL语句:http://IISServer/VirtualRoot?sql=SELECT+*+FROM+Customers+FOR+XML+AUTO。同时需要注意的,我们可以在URL中执行存储过程和使用xml文档模板。
6.XML应用服务器:XML应用服务器实际上是支持XML的Web应用服务器,它们通常是模板驱动的,通过在一个剧本语言中嵌入使用SQL语句来提取数据并动态构建XML文档。
7.内容管理系统:内容管理系统是用来存储、提取和装配XML文档的系统。它们通常包括以下一些特征:编辑器、版本控制和多用户并发处理,它们本身的对数据库实现对用户是透明的。它们的主要目的是用来管理文档。文档一般是以XML格式或者其他的如RTF、PDF或者SGML的形式出现的,对于非常简单的文档集合,文件系统就能够满足你的要求,但是,如果你有一个复杂的文档集合的话,你通常需要一个内容管理系统。这里的内容管理系统的含义就是说允许你把文档分割成具体的内容片段,比如例子、过程、章节或者是工具条和其他的一些元数据比如:作者名字、版本号等等。然后可以根据需要来重新装配XML文档。你也可以根据这些片段来合成一个新的XML文档。
内容管理系统通常具有下面的一些功能:
1.版本和可获取性控制。
2.搜索引擎。
3.编辑器。
4.发布引擎,把内容发布到书本、CD或者Web上。
5.内容和形式的分离。
6.通过剧本和接口进行扩展。
7.和数据库数据集成。
采用对象-关系模型,把DOM映射到数据库中,你需要为DOM中的每一个对象在数据库中建立对应的表格。一般来说,系统需要包括五个表:
1.属性定义:定义属性,包括他们的类型,合法的值等等。
2.元素/属性关联:定义哪些属性是和哪些元素相关联的。
3.内容模型定义:定义哪些元素能够包含其他的元素。
4.属性值:包含属性值和指向在属性定义表和元素/属性关联表中的相关行的指针。
5.元素值:包括元素值(PCDATA或者指向其他元素值的指针),元素在它的父节点中出现的次数,指向包含父节点元素值所在行的指针,指向在元素/属性表中的相应行的指针。
前三个表和一个简单的DTD是等价的,接下来的两个表包含了实际的数据。通过反复的查询后面两个表,就有可能构建XML文档的任意一个部分。
可持久化的DOM实现Persistent DOM Implementations):使用数据库来进行DOM实现的考虑是为了加快速度和避免机器内存不够,尤其是在XML文档非常大的时候。它们存储了XML文档的结构,可持久化的DOM实现能够被用来存储、提取和查询XML文档,也可以从现在的文档中创建新的文档。也就是说能够通过编程实现基于DOM的应用。
实际上,你可以在自己的应用程序中,通过编写代码来整合中间件、支持XML的数据库,原始XML数据库、XML服务器和永久DOM实现等技术。这里XML应用服务器需要你编写一些剧本代码,内容管理系统需要你做一些系统的配置。
关于XML的数据库总体分析就介绍到这里,若文章中有不妥之处,欢迎各位批评指正。