新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 提高页面的PageRank(页面排名),让页面被Google检索的技巧。站长交换链接。搜索引擎优化(SEO)。Google Analytics,Google Sitemap,Google Related Links。
    [返回] 中文XML论坛 - 专业的XML技术讨论区Android开发论坛『 Google PageRank/Google排名/SEO/Google Analytics 』 → Google Sitemaps实用教程Google Sitemaps实用教程[转帖] 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 15953 个阅读者浏览上一篇主题  刷新本主题   平板显示贴子 浏览下一篇主题
     * 贴子主题: Google Sitemaps实用教程Google Sitemaps实用教程[转帖] 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 Google PageRank/Google排名/SEO/Google Analytics 』 的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 Google Sitemaps实用教程Google Sitemaps实用教程[转帖]


    Google Sitemaps实用教程Google Sitemaps实用教程之一

    转载自:http://www.iteer.net/modules/doc/article.php?storyid=1517

    这个简明教程记录了制作Google Sitemaps过程中自己的一些心得与体会,拿来与各位站长讨论交流,其中可能会有不当之处,也欢迎大家及时批评指正。另外需要强调,对于已经大量被Google收录的站点或者已经从Google得到理想搜索访问量的站点,请权衡对待,但是对于希望尽快被收录的,或者希望收录自己站点被提交到Goolge之前的页面,Google Sitemaps是个不错的选择!下面进入正题。文章中的部分内容会引用Google Sitemaps中文帮助原文,其版权归Google公司!

      先引用 Google 官方关于 Sitemaps 的一段文字,请大家看看,这将帮助您对 Google Sitemaps 有一个明确地认识:

      关于 Google Sitemaps 如 Google 一样的搜索引擎使用名为“Spider”的软件抓取 Web,从而找到有关您的网站的信息。Spider 找到网站后,它们会按照该网站内的链接收集有关所有页面的信息。Spider 会不定期地重新访问网站以查找新的或更改的内容。
      Google Sitemaps 是有关 Web 抓取的实验。通过使用 Sitemaps 通知并指引抓取工具,我们希望扩展对 Web 的覆盖范围,并加快网页搜索及将其添加到索引的速度。
      如果网站拥有不容易按照链接找到的动态内容或页面,您可以使用 Sitemaps 文件提供有关网站上的页面信息。这将有助于使 Spider 了解网站上有哪些网址以及其更改频率。
      Sitemaps 从另一角度观察网站(如同主页和 HTML 网站地图所做)。此计划并不会取代我们抓取 Web 的常规方法。无论使用此计划与否,Google 都将用与以往相同的方式搜索网站并编制其索引。Sitemaps 只是为 Google 提供可能未发现的额外信息。网站不会因使用此服务而受到处罚。这只是测试计划,因此我们无法预见或保证何时或是否您的网址将被抓取或添加到我们的索引。随着时间的推移,通过逐渐改善我们的过程及更好地理解网站管理员的需要,我们期待覆盖和编制索引的时间都能得到改进。
      另外,可以在网址更改时提交更新的 Sitemaps,但并不需如此,因为 Spider 将定期重新访问您的网站(将使用您在 Sitemaps 中提供的频率信息作为决定多长时间重新访问一次的因素)并查找新页面。
      轻松加入
      可以按照下面这些基本步骤参与 Google Sitemaps 计划:
      以支持的格式创建 Sitemaps。
      将此 Sitemaps 提交到 Google。
      当网站有更改时更新 Sitemaps 文件。
      如果您的网站为移动设备提供内容,则可以创建并提交移动 Sitemaps,以便向 Google 提供有关移动 Web 索引的信息。
      任何网站所有者都可以参与 Google Sitemaps 计划 – 从只有一页的站长到有上百万不停变化的页面的公司。如果想让 Google 抓取网站上更多的页面,并可以在网站内容更改时通知 Google,那么您可能对使用 Google Sitemaps 特别感兴趣。
      Google Sitemaps 计划是完全免费使用的。Google 从未对搜索结果收取过费用,也没有收费的计划。Google 启动此计划是为了完成我们的使命,即将全世界的信息组织起来并使之可普遍访问。我们希望此协作抓取系统能使我们的抓取器改进此系统的覆盖和时效性,从而为用户优化 Google 索引的使用。
      引用页面地址

      Google Sitemaps 推出时只有英文版,限于英文水平也只理解了个大概,在网上找了找也没有比较详细的中文帮助,于是就在第一时间不知死活的用了自己的网站作了试验,当然刚开始取得了很好的效果,不到一个月,收录量由之前的2000多达到了15000多。但是因为配置文件参数设定的不合理加之没有坚持更新地图文件,后来却成了我的心病,Google几乎不再更新我的站!极度郁闷!

      这是个惨痛的教训,所以在中文版出来后,仔细研究了其中所有参数,以及地图的制作和使用流程,并确定以我的软件下载网站作为测试站点,测试地图的使用效果,网站地址为:10点在线。

      为了能切实的验证地图配置文件的参数有效性,我们做了近两周的观察,现在Google已经开始不断收录,所以才开始萌生写这个教程的念头,希望能对各位想尝试Google Sitemaps的站长有所帮助,避免一些不必要的麻烦和困扰!

      需要说明的是我并不能完全保证这篇文章内容描述的准确性,因为 Google Sitemaps 的中文帮助实在很蹩口,哈哈,也许是太专业吧,希望Google不会因为这个惩罚我的网站:P!
    Google Sitemaps 的中文帮助地址

    Google Sitemaps实用教程之二

    开始写详细操作之前,声明一下,我是第一次写这种东西,不足之处还请大家谅解,同时希望有经验的朋友能及时给予补充和指正!

      先来介绍一下教程中的测试网站:
     10点在线是一个涉及软件和电影内容的网站,其所有页面全部生成html文件,总计大概90000多个。正如前面所提到的,最初制作好Sitemap.xml并提交到Google后因为没有坚持更新地图文件,导致由收录最高时的24000页到最后的几百页。在11月1日重新制作了地图,并提交给 Google,现在的收录结果,http://www.baidu.com/s?wd=site%3Awww.10dian.net&cl=3大家可以点此察看。这个站生成地图的配置文件里设定的更新周期是每周,所以Google会每周下载一次地图文件。顺便给自己作个小广告,哈哈:P,关于如何向Google提交地图会在后面详细介绍。

      创建 Sitemaps其实有很多方法,Google都有相应的说明和帮助,具体地址可参见:https://www.google.com/webmasters/sitemaps/docs/zh_CN/overview.html这里就不重复了。
      这篇文章只介绍其中的一种方法,即使用 Sitemaps 生成器(sitemap_gen.py)生成Sitemap,Google 提供的帮助地址为:https://www.google.com/webmasters/sitemaps/docs/zh_CN/sitemap-generator.html
      Google Sitemaps 生成器是一个 Python 脚本,可以使用 Sitemaps 协议为您的网站创建 Sitemaps。此脚本可以通过网址列表、Web 服务器目录或通过访问日志创建 Sitemaps。要使用此脚本:
      1.您需要连接到您的 Web 服务器,并在其上运行脚本。
      2.您的 Web 服务器需安装 Python 2.2 或更高版本。
      3.您需要知道启动 Python 的命令。(该命令通常为 python,但可能会因安装不同而异。例如,如果 Web 服务器安装了两种版本的 Python,命令 python 可调用较早的版本,而命令 python2 则可调用较晚的版本。)
      4.您需要知道指向贵网站的目录路径。如果您的 Web 服务器托管一个网站,路径可能是 var/www/html 等。如果您拥有一个托管多个网站的虚拟服务器,路径可能是 home/virtual/site1/fst/var/www/html 等。
      5.您需要能够将文件上传到自己的 Web 服务器(例如,使用 FTP)。
    如果您要根据访问日志生成一个网址列表,则需要了解用于这些日志的编码,以及指向它们的完整路径。

      以上为Google官方原文,这里我想说明几点:
      1.此方法支持独立服务器用户,当然也支持虚拟主机,但是要求主机上必须由python程序运行环境及相应权限
      2.大家可以看出他给出的路径格式是Unix/linux平台的形式,但事实上它同样支持window平台
      3、本教程操作只适用于独立服务器用户

      一、环境配置
      1.需要下载Python-2.2.3或更高版本,本站提供的地址为:Python-2.2.3下载,安装过程在此略过,非常简单不用作任何配置。
      2.下载Sitemaps 生成器python程序文件,可点此下载,下载存档后,将其解压缩到本地目录,其主要文件说明如下:
      README:包含关于此工具的最新信息
      sitemap_gen.py:生成 Sitemaps 的 Python 脚本
      example_config.xml:配置文件,将用其指定网站的相关属性参数
      example_urllist.txt:如果想根据自己指定的一组网址创建 Sitemaps,则可参照使用此网址列表模板

      二、配置文件参数设置
      在配置配置文件之前,需要说明一下,python将按照配置文件参数运行,并生成sitemap文件,配置文件中很多参数是可选的,本文中将概述常用的参数配置方法,有兴趣的朋友可以测试其他参数,共同完善此教程。
      在进行配置之前,你需要了解几个概念:
      1.网站的基准网址即http://www.googlepub.com/这种形式,只有以此基准网址开头的网址才能包括在 Sitemaps 中。请确认包括了协议,如 http://,就是说,http://www.googlepub.com 是有效的基准网址,而 www.googlepub.com 就不是。
      2.指向要保存 Sitemaps 的位置的 Web 服务器路径。通常,由于 Sitemaps 不能包含较高级别目录(来自 Sitemaps 的位置)中的网址,这是指向基本网址的路径。当您运行 Google Sitemaps 生成器时,它会创建 Sitemaps 并将其放在您指定的位置。建议指向网站根目录或者专门的存储文件夹,比如:sitemap,您希望的 Sitemaps 生成器用来创建 Sitemap 的方法可以任意组合下列各种方法:
      URL:在配置文件的这一部分列出单个网址,并提供关于所有网址的信息。通常,您要使用此方法与另一方法结合,手动提供其他方法无法提供的附加网址。
      网址列表:将配置文件指向包含网址列表的文本文件。如果文本文件已经存在或您使用脚本生成网址列表,则可以使用此方法。
      目录路径:为网站指定目录路径及这些路径的相应网址。Sitemaps 生成器将以这些目录的内容为基础创建网址的列表。如果网站由静态 HTML 文件构成,您可能需要使用此方法。
      访问日志:指向日志文件的路径。Sitemaps 生成器将以包含在日志中的网址为基础创建网址的列表。如果网站由动态页面构成,则可能需要使用此方法。
      Sitemap:指向您使用 Sitemaps 生成器创建的现有 Sitemaps。Sitemaps 生成器将创建一个 Sitemaps 文件,其中包含每个 Sitemaps 中都包含的网址。如果您已经创建了几个较小的 Sitemaps 并想将它们组合为一个较大的 Sitemaps 文件,则可以使用此方法。
      以上是Google官方提供的解释,暂可不必深入理解他们,但是需要提醒:sitemap存储路径建议指向网站根目录或者专门的存储文件夹。


       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/3/2 20:06:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Google PageRank/Google排名/SEO/Google Analytics 』 的所有贴子 点击这里发送电邮给Google AdSense  访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/6/1 6:38:59

    本主题贴数6,分页: [1]

     *树形目录 (最近20个回帖) 顶端 
    主题:  Google Sitemaps实用教程Google Sitemaps实用教程[..(8032字) - admin,2006年3月2日
        回复:  [灌水](494字) - cnknot,2007年5月24日
        回复:  谁能不能告诉我,我的sitemaps配置不成功能不能给我写个大概的步骤,我比较笨..(74字) - woaizhou,2006年4月24日
        回复:  Google Sitemaps实用教程之五作者:coiner | 2005-11-18 23:2..(2614字) - admin,2006年3月2日
        回复:  [B]Google Sitemaps实用教程之四[/B]作者:coiner | 2005-11-..(1795字) - admin,2006年3月2日
        回复:  [B]Google Sitemaps实用教程之三[/B]作者:coiner | 2005-11-..(10740字) - admin,2006年3月2日

    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    70.313ms