以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 DOM/SAX/XPath 』  (http://bbs.xml.org.cn/list.asp?boardid=11)
----  如何抓取URL链接中的内容  (http://bbs.xml.org.cn/dispbbs.asp?boardid=11&rootid=&id=28360)


--  作者:bisal
--  发布时间:3/9/2006 7:00:00 PM

--  如何抓取URL链接中的内容
大家好,我现在正在做毕设,要做一个网络爬行器,在美国专利数据库中输入一个关键词,然后把返回的所有专利URL链接中的内容保存到本地数据库中,但现在还没有头绪,哪位高人能给我指点一下,比如:如何用xpath或是其他方法抓取链接内容,我找了许多资料,但可参考的代码资料确实不多,另外请推荐我一些有关xml,xslt等方面的书籍,谢谢大家的指点
qq:173635235
msn:bisal1130@yahoo.com
e-mail:bill15@tom.com

W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
46.875ms