新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> Oracle, SQL Server与XML,XML在数据挖掘中的应用, PMML.
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - 高级XML应用『 XML 与 数据库 』 → [转帖]使XML本地化和关系化 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 16273 个阅读者浏览上一篇主题  刷新本主题   平板显示贴子 浏览下一篇主题
     * 贴子主题: [转帖]使XML本地化和关系化 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 XML 与 数据库 』的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 [转帖]使XML本地化和关系化

    http://www.yesky.com/SoftChannel/72342376223342592/20030225/1653736.shtml

    使XML本地化和关系化  
    2003-02-27· · ··天极论坛

    Oracle XML DB提供本地化格式和关系数据库访问。

      XML正快速地成为企业间数据交换的首选语言。然而,大多数企业把它们的数据存储在如Oracle9i数据库那样的关系数据库中。那么你怎样将分层次的、以文档为中心的XML和表格式的面向集合的关系数据库连接起来?你是把XML文档作为文件存储在文件系统中?还是把XML文档分开,把数据存储在关系数据库中?在两种方法间进行选择时需要根据你使用数据的方式进行权衡。但如果你不必进行选择呢?如果你可以同时使用两种方法,你会如何做呢?你可以使用Oracle9i数据库第2版中叫做XML DB知识库(XML DB Repository)的新特性。

      XML DB知识库说明

      Oracle XML DB既不是一个单独的产品也不是一个你必须安装的单独选项。Oracle XML DB指的是在直接内置于Oracle9i数据库的XML特性和技术的集合。其中一个关键特性就是XML DB知识库。这个知识库使你能够在Oracle9i数据库第2版中直接存储XML文档。一旦你的XML文档存储在该知识库中,你就能够以XML为中心的方式或以关系为中心的方式访问XML数据。

      要把XML数据存储在你的数据库中,你只需简单地使用FTP、HTTP或WebDAV等所有行业标准的协议写一个XML文档文件即可。而从数据库中获取XML数据就像执行一个SQL查询或使用上述协议之一读文件一样简单。

      场景设置

      假设你正在销售独立艺术家制作的CD。你需要和主要的音乐商店、在线站点和艺术家自身交换信息。你已经开发了用来描述CD内容的如清单1所示的XML文档格式,现在想利用XML DB 知识库把信息存储在数据库中。你想通过SQL轻松地访问数据并轻松地访问本地XML文档。简而言之,你希望数据既具有关系特性又具有层次特性。在这篇文章中,我是你的DBA,实现它是我的工作。

      注册XML模式

      我的第一步是使用XML DB知识库注册你的XML模式。当我注册一个XML模式时,该知识库创建能够保存那个模式实例的对象类型和对象表。下面对通过SQL*Plus执行的dbms_xmlschema.registerURI的调用从http://gennick.com/cd.xsd获取如清单2中所示的XML模式,然后注册它:
    BEGIN
    dbms_xmlschema.registerURI(
    'cd.xsd',
    'http://gennick.com/cd.xsd');
    END;

      注意:我除了需要对各种模式对象类型的CREATE权限外,为了注册模式和创建这篇文章中的例子我还需要ALTER SESSION和QUERY REWRITE权限。

      清单3显示了由于注册CD模式而创建的一些结构和对象。一个名字是CD331_TAB的XML表被创建来保存模式的实例:在知识库中的每个CD文档将由这个表中的一行来表示。我可以通过查询USER_XML_TABLES数据字典视图得到XML表的一个列表。在这个例子中,我简单地在模式注册前后查询视图然后查找新的表名。CD331_TAB中的每一行将包含一个CD327_T类型的实例,这个类型对应于我们的XML模式来创建的。XML文档的第一层元素被表示为CD327_T类型的属性,属性名和XML字段名相匹配。例如,该对象类型中的Title字段直接对应于XML模式中的Title元素。Songs字段对应于Songs元素。Songs是XML模式中的一个复杂元素,同样地它被映射到另一个对象类型"Songs328_T"。如果我使用SQL*Plus命令DESCRIBE "Songs328_T",并继续研究Songs字段的定义,我会看到歌曲集合最终被作为一个VARRAY实现,在VARRAY中,每个元素都表示一首歌曲。

      当我注册一个模式时,我可以控制Oracle9i数据库生成的对象和类型名;我也可以控制被用来存储我的XML数据的特定数据类型。可以通过使用XML DB知识库定义的属性和oraxdb名字空间的部分注释XML模式来进行这些控制。当我不提供那些属性时,Oracle9i数据库为我生成它们,我可以通过查看存储在该知识库中的模式版本来简单地浏览Oracle9i数据库所生成的内容。图1说明了你如何能够方便地访问知识库数据,这次是通过HTTP,使用一个标准的Web浏览器来访问的。图1显示了我的知识库中的CD模式的一部分,你可以看到模式注释,它们全都以"oraxdb"开始。注意,URL使用8080端口,它是知识库使用的默认HTTP端口。

      默认情况下,注册模式时创建的全部对象将属于注册模式的用户所有。在这个例子中,我拥有清单3中的表和类型以及其他与该CD模式相关的所有对象。因为是我注册了那个模式,所以任何我保存到知识库中的XML文件(是该CD模式的实例)将被拆开然后存储在CD331_TAB表中。该模式和注册是特定于我的。其他用户保存的CD文件将不会被存储在我的表中。你可以对dbms_xmlschema.register模式使用一个可选参数,来创建一个影响所有用户的全局模式,以便所有用户都可以把CD文档保存到该表中。

      创建XML文件夹

      如果要把CD XML文档存储在XML DB知识库中,我就需要一个存放它们的文件夹。要创建一个文件夹,我作为SYSTEM用户登录到Oracle并执行清单4中的PL/SQL块。调用dbms_xdb.createfolder创建名为/CD的第一层文件夹。PL/SQL块然后使用dbms_xdb.setAcl过程创建把所有文件夹权限赋予拥有者(也就是SYSTEM用户)、把读权限赋予其他所有用户的访问控制列表(ACL)。下一步为了把文件夹的拥有者由SYSTEM改变为GENNICK,需要对资料库的RESOURCE_VIEW调用UPDATE语句。在文件夹创建后,提交是重要的;直到你提交后,该文件夹才对其他会话可见。现在我可以作为GENNICK使用FTP或WebDAV连接并把XML文件保存到/CD文件夹中。

      保存XML文档

      一旦我注册了模式然后创建一个文件夹来保存我的XML文档,把文档保存到知识库就像拷贝文件那样简单。清单5显示了一个拷贝(清单1中所示的)LegendsOfTheGreatLakes.xml文件到知识库的FTP会话。FTP open命令使用的端口2100是知识库为FTP会话使用的默认端口。注意,我可以不使用FTP,而是像以前那样在WebDAV和Windows Web文件夹简单地使用Windows拷贝和粘贴操作。

    使用RESOURCE_VIEW

      你应该知道的一个重要视图是名为RESOURCE_VIEW的视图。RESOURCE_VIEW视图为你所访问的知识库中的每个文档和文件夹返回一行。例如,通过执行下面的查询你可以得到/CD文件夹下所有XML文档的一个列表。

    SELECT any_path
    FROM resource_view
    WHERE under_path(res,'/CD')=1
    AND extractValue(res,
    '/Resource/ContentType')='text/xml';

    ANY_PATH
    -------------------------------
    /CD/Gospel/NothingLess.xml
    /CD/LegendsOfTheGreatLakes.xml

      上面显示的新的UNDER_PATH函数使你能够测试一个给定的知识库资源是否在你指定的文件夹(或路径)中。在这个例子中,我使用该函数把查询结果限定在/CD文件夹及其子文件夹的资源中。通过使用对基本表所创建的一个层次式域索引可以使对RESOURCE_VIEW视图进行的基于路径的查询更高效。这个索引是该知识库的一部分;你不用创建它。


    此主题相关图片如下:
    按此在新窗口浏览图片

    图1:XML DB知识库中示例CD模式的一部分

       资源视图中的RES字段并不代表资源自身,而只是代表资源的元数据。对RES字段运用新的extractValue函数检查每个资源的内容类型。因此查询的结果被进一步地限制到指向XML文档的路径。'/Resource/ContentType'语法代表XPath表示法。XPath是指定XML文档各部分的标准表示法;你将在许多对XML数据的查询中使用它。

      给定一个资料库路径,你可以使用新的XDBUriType对象类型检索全部或部分基本XML文档。清单6显示两个查询。第一个查询是对以上代码的扩展,使用XDBUriType来检索/CD文件夹下的所有XML文档。为了只提取CD标题,清单6中的第二个查询进行了进一步的改进,把标准的XPath语法附加到URL的末端。
    对知识库数据的关系访问

      也可以通过直接访问基本表来访问知识库中的XML数据。我注册CD模式时创建的基本表是CD331_TAB。你可以直接对这个表编写查询语句,但这些查询必须是支持XML的。要简化通过设计用于关系数据的报表工具访问XML数据,你可以创建一个如清单7中所示的视图。除了视图,清单7还对艺术家名字创建了一个索引。视图和索引使我能够有效地执行诸如下面的标准关系查询:

      SELECT title
      FROM cd_master
      WHERE artist='Carl Behrend';

      更新XML数据

      不幸的是,因为在cd_master视图中的所有字段都是基于SQL函数的,所以该视图不能被更新。然而,可以更新知识库中的XML数据;我只需要如下所示更新注册模式时所创建的基本表:
    UPDATE CD331_TAB cd
    SET VALUE(cd) = updateXML(
    value(cd),
    '/CD/Website/text()',
    'http://greatlakeslegends.com/
    legends.htm'); 

      注意这个新的updateXML函数中的XPath语法的使用。路径'/CD/Website/text()'说明我要更新CD文档的Website元素的文本。updateXML的第三个参数为那个文本指定新值。这是一个恰当的更新,并非常高效。XML DB知识库并不需要重建被改变的整个XML文档。因为模式被注册了,所以XML DB知识库能够以在底层对象结构只有Website属性被触及的方式重写这个查询。

      结论

      通过使用XML DB知识库,你可以把XML文档存储在数据库中,并使用标准的互联网协议访问那些文档。同时,你还可以使用标准的关系查询访问相同的XML文档或是那些文档的部分。你没有XML数据和关系数据,只有数据。"XML"和"关系"只是查看数据的不同范例。通过把数据从范例中分离出来,Oracle9i保护你最重要的资产之一--数据--免受范例改变的影响。

      Jonathan Gennick (Jonathan@Gennick.com) 是一个经验丰富的Oracle DBA和Oracle认证专家(OCP)。他目前以写作为生,最近刚刚完成《Oracle SQL*Plus袖珍参考手册第二版》(Oracle SQL*Plus Pocket Reference,Second Edition 2002年O'Reilly & Associates出版一书。

    [此贴子已经被作者于2005-3-14 23:21:51编辑过]

       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/1/27 13:07:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML 与 数据库 』的所有贴子 点击这里发送电邮给Google AdSense  访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 11:13:02

    本主题贴数4,分页: [1]

     *树形目录 (最近20个回帖) 顶端 
    主题:  [转帖]使XML本地化和关系化(8159字) - admin,2004年1月27日
        回复:  see(3字) - xmzhy,2005年3月17日
        回复:  搂主是搞啥子工作的?(20字) - 阿星[aXing],2004年2月16日
        回复:  头大(4字) - 阿星[aXing],2004年2月16日

    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    62.500ms