新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> XML与各种文件格式的相互转换及相关工具。 word to xml, xml to word, html to xml, xml to pdf,
    csv to xml, rtf to xml, text to xml, xml to text, xls to xml, xml to xls
    FOP
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - XML技术『 WORD to XML, HTML to XML 』 → 关于本版块以及基于XML的Web挖掘的问题 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 9723 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 关于本版块以及基于XML的Web挖掘的问题 举报  打印  推荐  IE收藏夹 
       本主题类别: Semantic Web    
     fangel2000 帅哥哟,离线,有人找我吗?
      
      
      头衔:w3china第一水王
      等级:大四寒假(收到Microsoft的Offer啦)
      文章:283
      积分:1503
      门派:W3CHINA.ORG
      注册:2006/5/30

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给fangel2000发送一个短消息 把fangel2000加入好友 查看fangel2000的个人资料 搜索fangel2000在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看fangel2000的博客楼主
    发贴心情 关于本版块以及基于XML的Web挖掘的问题

    这个版块的人气实在是不怎么旺盛,来了这么长时间了。很少看到有人发帖子,也很少看到有人回帖子,不知道是不是研究这方面的人实现是太少了还是其它的什么原因
    我的论文是做基于XML的Web挖掘的
    我的设计思想是将HTML转换成XML后,再解析XML,提取感兴趣的内容
    但是关于HTML如何转换成XML的问题,我在网上找了不少资料
    还没有找到一个完整的转换过程的,主要是因为有的网页不规范导致的,很多都只是在理论上实现了这样的一个构思.不知道大家可有谁实现了这样的一个过程
    到现在了我还一点头绪也没有,因为我以前是研究语义Web的
    如果有的话,告诉我,我不胜感激
    我的邮箱:fangel2000@163.com
    QQ:24163272

       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/12/24 21:19:00
     
     edward007 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:10
      积分:114
      门派:XML.ORG.CN
      注册:2007/1/16

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给edward007发送一个短消息 把edward007加入好友 查看edward007的个人资料 搜索edward007在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看edward007的博客2
    发贴心情 
    我也有此问题啊,我想做基于DOM的解析,不知道楼主有这方面的资料吗,互相交流一下啊。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/1/19 11:12:00
     
     yestoday11 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:3
      积分:87
      门派:XML.ORG.CN
      注册:2007/2/1

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给yestoday11发送一个短消息 把yestoday11加入好友 查看yestoday11的个人资料 搜索yestoday11在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看yestoday11的博客3
    发贴心情 
    如果需要的内容不多,还是用字符串检索解析的方式吧!
    原因如下:
    1.html中有很多隐式的字符无法解决
    2.用dom解析一个文件资源耗费比较大
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/2/2 11:58:00
     
     goodhero 帅哥哟,离线,有人找我吗?
      
      
      等级:大三(要不要学学XML呢?)
      文章:161
      积分:808
      门派:XML.ORG.CN
      注册:2005/8/17

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给goodhero发送一个短消息 把goodhero加入好友 查看goodhero的个人资料 搜索goodhero在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看goodhero的博客4
    发贴心情 
    可以找一找开源的项目
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/2/4 9:45:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 WORD to XML, HTML to XML 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/12/22 5:50:01

    本主题贴数4,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    78.125ms