网站首页  词典首页

请输入您要查询的论文:

 

标题 基于XML的异构数据交换研究
范文

    邹卫国 郭建胜 王 毅 代华兵

    [摘要]数据交换是进行数据融合和集成的重要途径。本文针对XML的特点,对基于XML的异构数据标准化、数据与XML之间的转换和异构数据交换方法进行了研究。

    [关键词]XML;XML-Schema;数据交换

    [中图分类号]F270.7;TP312[文献标识码]A[文章编号]1673-0194(2009)24-0082-02

    0引言

    信息化建设大大提高了各类管理工作的效率。随着各种信息系统的推广使用。存储在信息系统数据库中的数据已经成为管理工作的重要基础。由于各管理机构之间的相对独立以及信息系统开发初期缺乏总体规划,导致一个有机实体或部门内部出现大量的“信息孤岛”和“应用孤岛”。

    信息集成是消除“信息孤岛”和“应用孤岛”、避免资源浪费的根本途径。进行信息集成,必须首先实现各系统之间的数据交换。数据交换是指各业务信息系统之间在业务需求的基础上,通过定义数据接口或数据交换平台互相交换数据,实现系统之间的数据共享与互操作。在原有业务系统之间建立的数据接口或数据交换平台,必须满足以下要求:源数据位置透明;在不改变原有系统安全策略的情况下,保证数据安全性;集成系统具有继承性;保证数据实时性:系统易于维护等。

    1XML与XML Schema

    电子数据交换(Electronic Data Exchange,EDI)在传统的异构数据集成中发挥了重要作用。但由于传统EDI业务规则固定、数据传输成本高等缺点使之已难以适应异构数据源快速变化和新业务规则迅速增长的需要,而XML则能很好地适应新形势下信息集成的要求。

    可扩展标记语言(eXtensible Markup Language,XML)是一种元语言,能针对特定的应用定义自己的应用语言,并具有良好的数据存取格式、可扩展性和自描述性、高度结构化、便于网络传输等特点。这些特点使XML有着巨大的伸缩性和灵活性,可以广泛应用于不同数据源间的数据交互、分布式运算、数据展现等应用中。

    XML文档的结构、数据类型等可通过XML Schema来进行定义和描述。XML Schema是一种描述信息结构的模型,它为XML文档建立了一个模式,规范了XML文档中的标记(tag)和文本(text)可能的组合形式。XML Schema支持许多复杂的数据类型,引入原型(Archetypes)和命名空间概念,可随意扩充,使得其不但编写简单,而且内容充实完整,可以给出XML文档详细明确的定义。在XMLSchema定义约束下,XML文档的有效性更加严格,内容结构更加严谨。

    XML与XMLSchema组合已成为各种结构化、半结构化和非结构化信息交换的最佳方式。

    2基于XML的数据标准化

    

    不同应用系统中异构数据的交换。最理想的方法是建立一个全局或局部的标准,作为交换的中介,为各异构数据提供交换平台。因为XML在数据结构表示和语义表达方面具有突出优势,所以本文将其作为数据标准化工具。

    基于XML的数据标准化,是指运用XML Schema技术为各类异构数据创建一个基于XML的标准化数据框架,以便实现各信息系统之间的数据交换和信息共享。

    XML文档表示的标准化数据,简单易懂,可解决不同数据库系统及数据关系、语义定义等数据表达方面的差异,且数据表示独立于应用系统,具有平台无关性,较好地解决了各应用系统间信息资源集成的分布和异构等问题,使得数据的交互变得透明。利用XML文档内容受其XMLSchema模式约束的特性,我们可以给出所有相关应用系统间需交换数据的全局XML Schema模式的描述标准,作为数据转换时的结构定义,也就是利用XML Schema来表示各类异构源数据与XML标准数据之间转换的映射规则。以保证各类应用系统间交流的XML数据文件都有标准的、统一的数据结构形式。

    3基于XML的数据交换机制

    异构数据交换,首先将需交换的异构数据转换成统一的标准数据结构,经过网络传输与交换,被目标系统(数据库或数据转换模块)接收后,再将标准化的数据转换成目标数据库的数据模式,进而实现异构数据的集成共享。

    本文以基于XML的数据标准化为交换模型,以XML文档作为底层信息交换载体进行数据的转换与传输,完成各应用系统之间异构数据的自动、平滑交换,实现异构数据的集成共享和各种现有信息资源的有效利用。

    基于XML的异构数据交换,是将异构数据从数据源中提取出来,根据定义的异构源数据到标准XML全局数据模式的转换规则(即转换映射关系)将异构源数据转换为XML标准结构文档。再通过数据传输通道,将XML标准数据文档传送到相应的目标应用系统。最后。通过目标系统的模式转换规则,将接收到的XML标准数据文档。转换成自身系统可理解的数据模式,再接收相关的数据信息,进而完成异构数据源间的异构数据交互。

    基于XML的异构数据交换模型如图1所示。

    4映射规则生成

    从图1可以看出。基于XML的异构数据交换,其核心是各类异构源数据与标准XML数据之间的转换。而要实现转换,必须先建立转换规则,即建立全局XML Schema与各数据源数据间的映射关系。

    目前。管理信息系统中广泛应用的数据管理模式都是基于关系数据模式的,因此,这里只讨论关系数据库数据与XML文档之间转换映射规则的生成。

    4.1源数据转换到XML文档的映射规则

    首先获取源数据的具体关系模式,考虑到源数据关系模式的数据库平台无关性,将具体关系模式再转换为一般关系模式,从一般关系模式中提取出表、字段、完整性约束等信息并通过有向图来表示。由于关系数据由扁平的数据表构成,而XML是多层嵌套的层状结构,XML Schema是由13种模式组件组成的集合。通过定义模式组件与有向图属性的映射模板,实现数据库中表结构和相关属性的扁平结构到XML Schema的层状结构的转换。

    4.2XML文档转换到源数据的映射规则

    首先对XML Schema的数据结构与数据语义约束信息进行形式化描述,建立E-R模型。然后在E-R模型的基础上,通过建立E-R次序特性、引入父子元素的方向特性、扩展元素出现次数、建立附件信息等,形成扩展关系模型。通过建立XML Schema形式化描述与扩展关系模型的元素与实体、元素到子元素与实体、属性等之间的对应关系,实现形式化描述到扩展关系模型之间的映射。通过将扩展关系模型转换为关系模式的数据结构,将扩展关系模型的约束条件转换为关系模式的数据约束条件,就可实现扩展关系模型到一般关系模型的转化,最后针对具体信息系统的数据模式,实现一般关系模型的具体化,就可以实现XML向关系数据模式的转换。

    5XML文档的传递与接收

    在基于XML的异构数据交换模型中,数据交换途径与方式也是关键技术之一。XML数据文档的传递与接收,可通过两种方式来进行:基于普通文档和基于消息模式数据包。基于普通文档,就是将包含数据的普通XML文档进行传递与接收。基于消息模式的数据包,就是将包含数据的XML文档或符合XML格式的文档片段打包成消息的方式进行传递和接收。

    在进行XML文档的传递与接收时,必须先建立一个数据区,它是一个概念上的区域,其本质上是信息交换平台,既可以是用来存储普通XML文档的物理磁盘区域或内存区域,也可以是基于消息机制的信息传播机制。所有需交换的信息以XML数据文件的形式存储在数据交换区,供目标应用系统访问或触发目标应用系统,进而实现不同应用系统间信息的发布、获取、协商、交换等功能,如图1所示。该平台上还可包括用XML Schema描述的各全局模式或局部模式的模式结构,以及异构源数据与标准XML数据文档的转换规则等,并提供下载机制。

    6总结

    异构数据交换是进行异构数据集成的关键技术之一。一直是信息集成领域研究的热点。XML具有良好的可扩展性和自描述性,便于网络传输。针对XML这些优点。本文对基于XML的异构数据交换方法进行了研究。探讨了使用XML Schema进行数据标准化和基于XML的异构数据交换实现机制,对利用XML技术进行异构数据集成具有一定的参考意义。

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/11 22:20:01