新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> XML与各种文件格式的相互转换及相关工具。 word to xml, xml to word, html to xml, xml to pdf,
    csv to xml, rtf to xml, text to xml, xml to text, xls to xml, xml to xls
    FOP
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - XML技术『 WORD to XML, HTML to XML 』 → 怎样将任意网页转化成XML文件 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 11745 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 怎样将任意网页转化成XML文件 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     samymsn 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:1
      积分:53
      门派:XML.ORG.CN
      注册:2009/1/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给samymsn发送一个短消息 把samymsn加入好友 查看samymsn的个人资料 搜索samymsn在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看samymsn的博客楼主
    发贴心情 怎样将任意网页转化成XML文件

    急用!!之前在网上找了一些代码,用的是tidy,但只能转化一些十分简单的网页,许多复杂的网页都不能顺利转化成XML文件,请教各位高手,有没有什么方法,对任意网页都有效,
    例如这个URL:http://www.da-ben.com/ArticleShow.asp?ArticleID=717&gclid=CL6d2PfzopUCFQoNewodwwNtjw

    谢谢!!


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/5/20 19:34:00
     
     Qr 帅哥哟,离线,有人找我吗?
      
      
      威望:9
      等级:博士二年级(版主)
      文章:4392
      积分:29981
      门派:XML.ORG.CN
      注册:2004/5/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Qr发送一个短消息 把Qr加入好友 查看Qr的个人资料 搜索Qr在『 WORD to XML, HTML to XML 』的所有贴子 访问Qr的主页 引用回复这个贴子 回复这个贴子 查看Qr的博客2
    发贴心情 
    tidy没办法。要自己写代码,正则表达式是关键。

    ----------------------------------------------
    没人帮忙,那就靠自己,自己才是最好的老师!本人拒绝回答通过站内短消息提出的问题!

    blog:http://Qr.blogger.org.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/5/21 8:58:00
     
     redskywy 帅哥哟,离线,有人找我吗?双子座1983-6-12
      
      
      等级:大一(猛啃高等数学)
      文章:12
      积分:108
      门派:XML.ORG.CN
      注册:2005/10/8

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给redskywy发送一个短消息 把redskywy加入好友 查看redskywy的个人资料 搜索redskywy在『 WORD to XML, HTML to XML 』的所有贴子 访问redskywy的主页 引用回复这个贴子 回复这个贴子 查看redskywy的博客3
    发贴心情 
    使用 perl可以方便的实现的
    cpan上有 html2xhtml

    ----------------------------------------------
    ability

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/8/17 14:26:00
     
     GoogleAdSense双子座1983-6-12
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 WORD to XML, HTML to XML 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 15:44:52

    本主题贴数3,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    62.500ms