中文XML论坛--如何抓取URL链接中的内容

新书推介：《语义网技术体系》
作者：瞿裕忠，胡伟，程龚

XML论坛

W3CHINA.ORG讨论区

计算机科学论坛

SOAChina论坛

Blog

开放翻译计划

新浪微博

首页

软件下载

资料下载

核心成员

帮助

>> 本版讨论DOM, SAX, XPath等。

[返回] 中文XML论坛 - 专业的XML技术讨论区 → XML.ORG.CN讨论区 - XML技术 → 『 DOM/SAX/XPath 』 → 如何抓取URL链接中的内容

◇查看新帖 ◇ 用户列表 ◇

(订阅本版)

您是本帖的第 3195 个阅读者　　

*	贴子主题：如何抓取URL链接中的内容	举报打印推荐 IE收藏夹
	本主题类别:

bisal

  等级：大一(猛啃高等数学)
  文章：27
  积分：158
  门派：XML.ORG.CN
  注册：2006/3/9

姓名：(无权查看)
城市：(无权查看)
院校：(无权查看)

	楼主

如何抓取URL链接中的内容

大家好，我现在正在做毕设，要做一个网络爬行器，在美国专利数据库中输入一个关键词，然后把返回的所有专利URL链接中的内容保存到本地数据库中，但现在还没有头绪，哪位高人能给我指点一下，比如：如何用xpath或是其他方法抓取链接内容，我找了许多资料，但可参考的代码资料确实不多，另外请推荐我一些有关xml,xslt等方面的书籍，谢谢大家的指点
qq:173635235
msn:bisal1130@yahoo.com
e-mail:bill15@tom.com

收藏分享
顶(0)

2006/3/9 19:00:00

GoogleAdSense

  等级：大一新生
  文章：1
  积分：50
  门派：无门无派
  院校：未填写
  注册：2007-01-01

	广告

2025/9/17 22:17:58

本主题贴数1，分页： [1]

管理选项：修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告


	W 3 C h i n a ( since 2003 ) 旗下站点苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》	62.500ms