新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> Oracle, SQL Server与XML,XML在数据挖掘中的应用, PMML.
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - 高级XML应用『 XML 与 数据库 』 → XML“走进”数据库 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 47386 个阅读者浏览上一篇主题  刷新本主题   平板显示贴子 浏览下一篇主题
     * 贴子主题: XML“走进”数据库 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     yuji1998 帅哥哟,离线,有人找我吗?魔羯座1981-12-22
      
      
      威望:5
      头衔:蓝色先锋
      等级:大二(研究C++)
      文章:212
      积分:1059
      门派:XML.ORG.CN
      注册:2004/4/10

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给yuji1998发送一个短消息 把yuji1998加入好友 查看yuji1998的个人资料 搜索yuji1998在『 XML 与 数据库 』的所有贴子 访问yuji1998的主页 引用回复这个贴子 回复这个贴子 查看yuji1998的博客楼主
    发贴心情 XML“走进”数据库

    可扩展标记语言(XML,Extensible Markup Language)目前正在成为各种数据特别是文档的首选格式。由于它具有标记不同字段(field)的能力,使得搜索变得更简单和动态化,从而把企业准备扔进废纸篓的文件变成了进行数据挖掘的宝藏。XML把内容从演示格式中解放出来,使材料可以多次重复使用。这样一来,同样的内容可以分别用于新闻发布、白皮书、宣传册、演示和Web页面。对那些需要把不兼容的系统融合在一起的企业,XML可以充当公共传输工具,以中性格式进行数据传输。此外,XML还可以处理各种数据,包括文本、图像和声音,并且可以由用户进行扩展以处理任何特殊类型的数据。
       
       XML的特性使之成为在线和离线数据的共同语言。
       
       现在的问题是,怎样管理XML标记的数据。一种很有希望的方法是用数据库对XML进行存储、检索和操作,即把XML标记的数据收入一个框架中,在一种更容易管理、更系统化、更为人们所熟悉的环境中完成搜索、分析、更新和成果输出工作。
       
       这里有两种不同的观点:纯粹派认为,只有以XML原始的格式存储XML的数据库才能称为XML数据库;另一些人认为,只要能存入和检出XML,且它本身又是一个数据库,那它就是一个XML数据库,而不必考虑数据是怎样存入的。我们暂且把两派之争放在一边,凡内部不是以XML格式存储的XML数据库,叫做“XML- enabled数据库”;如果内部以XML格式存储数据,就称为“native-XML数据库”。
       
       使用现有的数据库类型和产品而不是以原始格式来存储 XML,是出自以下几种考虑:首先,普通的关系数据库和面向对象数据库已尽人皆知,而 native-XML数据库是新的;其次,人们熟知现有的关系数据库和面向对象数据库,也了解它们的行为和性能,因此,他们不愿意转向native-XML数据库,因为其性能,特别是可伸缩性尚未经过检验;最后,在企业看来,选择关系数据库和面向对象数据库是比较安全的,不到迫不得已用不着冒险使用新的native-XML数据库。
       
       所幸的是,您用不着去冒险。现在已经有一些能够很好地处理XML的XML-enabled数据库,并且是由久经考验的关系数据库和面向对象数据库担此重任。这些数据库在收到XML后,将其分解为字段并按通常的方式存储它们,当检索XML 时,这些字段再被拼接成原状。
       
       设在麻省Reading的Xyvision企业解决方案公司研制的 Content@XML是一套内容管理系统,它可以在任何一种流行的关系数据库中存储XML文件。其好处是可以开展基于内容的协同工作,进行多通道内容输出。一家技术出版商选用了 Content@XML,他们说XML将他们2周的工作压缩到几分钟,“该系统接受的是XML材料,给出的却是你想要的任何格式的结果。”
       
       Lotus公司的Domino数据库也可以处理XML,而且其 XML Toolkit甚至可以让您像在native-XML数据库中一样创建和处理内容。
       
       在关系数据库中处理XML数据时,可用第三方中间件进行转换,其中有一种产品称为XML-DBMS,这是一种基于Java Database Connectivity(JDBC) 的工具,可以在XML文档和数据库之间传输数据。
       
       不过,利用关系数据库和面向对象数据库存储XML也遭到一些批评。例如,有人认为,XML最具吸引力的特性之一是其分层结构,而关系数据库却将XML映射成关系表,从而将XML结构变成了平面的行和列。另外,遇到大型或复杂文档时,在XML与数据库之间进行来回转换要耗费相当多的处理时间,从而降低了Web页面的生成速度。
       
       目前,native-XML数据库已经开始出现,尽管人们还不能完全信任它,但的确有一些native-XML数据库开始在实际应用中受到得青睐。另外,主流的数据库厂商也可能在适当的时机推出自己的native-XML数据库产品。
       
       第一个,可能也是最有名的商用native-XML数据库是位于美国加州的Software AG公司开发的Tamino。除了可以存储和访问XML外,Tamino 还具备多项功能,包括Open Database Connectivity、符合Unicode要求、HTTP通信及处理非XML数据的能力。Gartner Group的一份报告指出:“Tamino特别适用于需要从多种不同平台和格式整合信息并向业务伙伴或客户散发这些信息的机构。”
       
       据介绍,Tamino拥有直接XML检索和特殊检索的能力,其查询语言强大而简短,可进入任意深度,使SQL相形见绌。
       
       其他native-XML数据库包括dbXML、eXcelon和 XHive/DB,分别由美国的dbXML Group LLC公司、 eXcelon公司和荷兰的The Connection Factory公司研制。奇怪的是,对native-XML数据库的主要批评之一是性能问题。有人预见到,当所搜寻的信息位于大文档的未尾时,由于缺乏其他机制,native-XML 数据库只能艰苦跋涉到最后,而关系数据库和面向对象数据库则可以将文档分成小块同时进行搜索,速度当然要快得多。
       
       当然,上述困难并非无法克服,只要在存储时给各文档分别加上索引就行了。Tamino就具有这种索引能力,从而弥补了大型文档搜索的不足,另外,native-XML存储消除了不必要的转换操作。目前,Tamina有Windows NT、Windows 2000、Solaris和SCO Unix等版本,将来还要出Linux和一些大型机版本。
       
       目前,许多主流的数据库厂商都在把XML支持结合到其产品中,或者提供可在其数据库中使用XML的工具。IBM提供了XML Extender for DB2,以允许用户在DB2中存储XML文档,并提供一些新功能协助用户处理XML文档;Microsoft 的SQL Server 6.5和7.0也进行了XML扩充,据悉SQL将来要加入XML输出选项,用以向其他系统传送信息。Oracle也拥有功能强大的XML索引引擎。
       
       有专家预计,这些数据库厂商不久将推出自己的native- XML数据库,以满足基于Web的电子商务对XML数据处理的需求。
       
       总之,XML的需求正在扩大,新的应用包括采用XML 标签的Internet搜索引擎、必须快速输出结果的电子商务系统、带XML标签的电子数据交换、数据重复使用和内容个性化。作为处理上述应用的一环,XML数据库的需求也将快速增长。

       收藏   分享  
    顶(0)
      




    ----------------------------------------------
    私人网站:蓝尚WEB商务平台http://www.lanshang.com     建站黄页:http://www.lanshang.com/link.asp WEB技术文库:http://www.lanshang.com/wenzhang/ 
    电子书籍: http://www.lanshang.com/ebook/  技术交流:http://www.lanshang.com/bbs/

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/6/28 16:41:00
     
     GoogleAdSense魔羯座1981-12-22
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML 与 数据库 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 7:11:53

    本主题贴数19,分页: [1] [2]

     *树形目录 (最近20个回帖) 顶端 
    主题:  XML“走进”数据库(4741字) - yuji1998,2004年6月28日
        回复:  最好有详细的实列啊!!!(24字) - wymm1981,2006年5月12日
        回复:  XML最具吸引力的特性之一是其分层结构, 能不能发一些这方面的贴子啊.初学者发言:LEVEL..(229字) - stewart,2006年3月22日
        回复:  什么叫第三方"中间件"软件, 那第一方和第二方是什么?(49字) - stewart,2006年3月22日
        回复:  有点点了解...还不是很懂...FIGHTING....(38字) - sbb6081,2006年3月8日
        回复:  多谢!(6字) - ranran0122,2006年3月7日
        回复:  好文章,顶!(12字) - ranran0122,2006年3月7日
        回复:  好文章!(8字) - a__mao,2006年3月7日
        回复:  多谢!!!(7字) - sajia,2006年3月4日
        回复:  我还是不明白是怎么结合的(24字) - ミ楛鮇メ,2006年2月22日
        回复:  VERY-GOOD(9字) - nmgyjw,2005年12月21日
        回复:  good(4字) - royczy,2005年8月30日
        回复:  似乎久了一点(12字) - KingX,2005年8月30日
        回复:  写得很好。。。(14字) - csyans,2005年8月6日
        回复:  哪位需要Tamino的信息,可以与我联系(33字) - eveningstar,2005年5月31日
        回复:  谢谢,又了解了一些新的东西!(28字) - 邪之正義,2005年5月30日
        回复:  置顶~就需要这样的好帖~~~(24字) - 宇南,2005年5月28日
        回复:  hehe,不错,不过Tamino不是美国加州的,而是德国的,欧洲第二大软件公司,第一当然是SAP了..(123字) - eveningstar,2005年5月18日
        回复:  多谢!!!顶!!!!(13字) - long010822001,2005年5月18日

    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    76.172ms