以文本方式查看主题 - 中文XML论坛 - 专业的XML技术讨论区 (http://bbs.xml.org.cn/index.asp) -- 『 Google PageRank/Google排名/SEO/Google Analytics 』 (http://bbs.xml.org.cn/list.asp?boardid=54) ---- Google Sitemaps实用教程Google Sitemaps实用教程[转帖] (http://bbs.xml.org.cn/dispbbs.asp?boardid=54&rootid=&id=28047) |
-- 作者:admin -- 发布时间:3/2/2006 8:06:00 PM -- Google Sitemaps实用教程Google Sitemaps实用教程[转帖] Google Sitemaps实用教程Google Sitemaps实用教程之一 转载自:http://www.iteer.net/modules/doc/article.php?storyid=1517 这个简明教程记录了制作Google Sitemaps过程中自己的一些心得与体会,拿来与各位站长讨论交流,其中可能会有不当之处,也欢迎大家及时批评指正。另外需要强调,对于已经大量被Google收录的站点或者已经从Google得到理想搜索访问量的站点,请权衡对待,但是对于希望尽快被收录的,或者希望收录自己站点被提交到Goolge之前的页面,Google Sitemaps是个不错的选择!下面进入正题。文章中的部分内容会引用Google Sitemaps中文帮助原文,其版权归Google公司!
先引用 Google 官方关于 Sitemaps 的一段文字,请大家看看,这将帮助您对 Google Sitemaps 有一个明确地认识: 关于 Google Sitemaps 如 Google 一样的搜索引擎使用名为“Spider”的软件抓取 Web,从而找到有关您的网站的信息。Spider 找到网站后,它们会按照该网站内的链接收集有关所有页面的信息。Spider 会不定期地重新访问网站以查找新的或更改的内容。 Google Sitemaps 推出时只有英文版,限于英文水平也只理解了个大概,在网上找了找也没有比较详细的中文帮助,于是就在第一时间不知死活的用了自己的网站作了试验,当然刚开始取得了很好的效果,不到一个月,收录量由之前的2000多达到了15000多。但是因为配置文件参数设定的不合理加之没有坚持更新地图文件,后来却成了我的心病,Google几乎不再更新我的站!极度郁闷! 这是个惨痛的教训,所以在中文版出来后,仔细研究了其中所有参数,以及地图的制作和使用流程,并确定以我的软件下载网站作为测试站点,测试地图的使用效果,网站地址为:10点在线。 为了能切实的验证地图配置文件的参数有效性,我们做了近两周的观察,现在Google已经开始不断收录,所以才开始萌生写这个教程的念头,希望能对各位想尝试Google Sitemaps的站长有所帮助,避免一些不必要的麻烦和困扰! 需要说明的是我并不能完全保证这篇文章内容描述的准确性,因为 Google Sitemaps 的中文帮助实在很蹩口,哈哈,也许是太专业吧,希望Google不会因为这个惩罚我的网站:P! Google Sitemaps实用教程之二 开始写详细操作之前,声明一下,我是第一次写这种东西,不足之处还请大家谅解,同时希望有经验的朋友能及时给予补充和指正! 先来介绍一下教程中的测试网站: 创建 Sitemaps其实有很多方法,Google都有相应的说明和帮助,具体地址可参见:https://www.google.com/webmasters/sitemaps/docs/zh_CN/overview.html这里就不重复了。 以上为Google官方原文,这里我想说明几点: 一、环境配置 二、配置文件参数设置 |
-- 作者:admin -- 发布时间:3/2/2006 8:06:00 PM -- Google Sitemaps实用教程之三 作者:coiner | 2005-11-18 23:23:42 (779 次阅读) 下面开始按照配置文件模板创建你自己的配置文件: 1.在文本编辑器中打开 example_config.xml 文件。将其另存为新文件(如 config.xml 或 mysite_config.xml)。 <site 使用.gz格式命名,脚本执行时会自动压缩你的地图文件,当然以也可以直接使用.xml格式,如果站点页面数量较大,为了方便Google下载你的地图文件,建议采用压缩格式。如果你的网站链接超过50000个,此程序会自动分开存储在不同的.gz文件里,最后会自动建立一个sitemap_index.xml文件作为主地图文件。 3.开始各部分参数的配置: <!-- ** MODIFY or DELETE ** Required attributes: Optional attributes: <url href="[URL=http://www.example.com/stats?q=name]http://www.example.com/stats?q=name"[/URL] /> b)找到以下部分: <!-- ** MODIFY or DELETE ** Required attributes: Optional attributes: <urllist path="example_urllist*.txt" encoding="UTF-8" /> c)找到以下部分: <!-- ** MODIFY or DELETE ** Required attributes: Optional attributes: --> <directory path="D:\what\where\webroot" url="[URL=http://www.bbar.cn/]http://www.bbar.cn/"[/URL] <!-- ** MODIFY or DELETE ** Required attributes: <accesslog path="/etc/httpd/logs/access.log*" encoding="UTF-8" /> e)找到以下部分: <!-- ** MODIFY or DELETE **"sitemap" nodes tell the script to scan other Sitemap files. This can Required attributes: <sitemap path="/var/www/docroot/subpath/sitemap*.xml" /> f)找到过滤器定义部分: <!-- ******************************************************** Filters specify wild-card patterns that the script compares Filters can be either type="wildcard", which means standard Filters are applied in the order specified in this file. The default action is "drop". You can MODIFY or DELETE these entries as appropriate for <!-- Exclude URLs that end with a '~' (IE: emacs backup files) --> <!-- Exclude URLs within UNIX-style hidden files or directories --> <filter action="drop" type="wildcard" pattern="*.jpg" / > <filter action="pass" type="wildcard" pattern="*.htm*" / > 过滤部分主要功能也很明确,如果你有不希望被收录的页面或者目录,可以通过文件扩展名或者目录进行,也可以配合robots.txt 使用,比如你的后台管理路径不希望背收录,可以在robots.txt 里声明,具体robots.txt 使用方法,[URL=http://www.googlepub.com/html/200511/244.html]可参考这篇文章[/URL]。我的配置是这样的: <filter action="drop" type="wildcard" pattern="*.jpg~" /> |
-- 作者:admin -- 发布时间:3/2/2006 8:07:00 PM -- Google Sitemaps实用教程之四 作者:coiner | 2005-11-18 23:24:59 (460 次阅读) 到了这一步,生成Sitemap.xml文件的参数配置就基本结束了,保存此配置文件。检查无误后,将该配置文件your_config.xml和sitemap_gen.py复制到站点根目录,然后登陆服务器,以命令行模式进入你的站点路径 键入:sitemap_gen.py --config=config.xml 然后回车运行,这个是在Windows主机下的脚本执行格式,如果是Unix主机可参照Google的中文帮助。 如果您正在测试自己的配置,并且还不准备提交 Sitemaps,以下语法可以避免 Sitemaps 与 Google 接触: 键入:sitemap_gen.py --config=config.xml --testing 然后执行 其执行结果示例为 到这里Google Sitemaps的制作就完成了,后续将会对提交部分和使用过程也作个说明,以便能够使内容完整连贯。写这个文章过程中[url=http://www.googlepub.com]GooglePub论坛的几位坛友给予了不少帮助,因此这个文章就首发在这里了,同时因本教程也未经大家验证,可能存在诸多疏漏,后续将会不断完善,如果有需要转载的,希望能标明转自[url=http://www.googlepub.com]GooglePub论坛,以方便访问者可以查看到后续补充的内容! |
-- 作者:admin -- 发布时间:3/2/2006 8:08:00 PM -- Google Sitemaps实用教程之五 作者:coiner | 2005-11-18 23:25:41 (524 次阅读) 当我们制作的地图文件确认无误时,就可以开始向Google提交了,登陆入口地址https://www.google.com/webmasters/sitemaps/login。 如果你已经有了Gmail帐号可以直接通过其邮件认证通道登陆到Google Sitemaps,如果没有可以通过点击登陆入口下方的创建 Google 帐户链接进行Google Accounts的注册,或者也可以在一些发放Gmail邀请的论坛里得到Gmail的帐户。当然本站也提供gmail邀请函,具体申请地址:[url]http://www.googlepub.com/bbs/viewthread.php?tid=148&fpage=1[/url] 登陆后就进入了Google Sitemaps的欢迎页面,然后点击确认按钮就进入了Google Sitemaps管理界面,点击“添加您的首个 Sitemaps 文件”的链接,就会看到简单的三个步骤说明。因为之前我们已经完成了创建Sitemap.xml和放置到网站的根目录下操作,这里我们只需在下面的 Sitemaps 网址框中输入自己网站地图的URL地址并点击提交网址按钮即可。我的输入是这样的 http://www.***.com/sitemap_index.xml ,如果采用了.gz的格式的这里提醒大家需要注意别弄错了。另外关于移动Sitemaps的相关帮助可以在这个地址https://www.google.com/webmasters/sitemaps/docs/zh_CN/faq.html#mobile 获得,本文不在这里说明了。 提交以后,就可以看到这个地图的相关信息,这时候你可以看到右侧的Sitemaps状态是“待定”,接下来点击左侧的“确认”。这个页面要求你确认状态,需要在指定的路径创建一个空的.html的文件,其文件名Google已经生成可别搞错了,然后点击“检查状态”按钮,如果该.html文件创建无误就会看到原来红色的“未确认”字样变成绿色的“已确认”,按钮也变为“察看网站状态”链接。个别情况这里会出些小问题,比如Google会返回服务器忙的信息,不用担心过一会再试就好了。 我们点“返回我的 Sitemaps”,这时候的界面显示与之前的未确认时会有所不同,原来左侧的“确认”变为“统计信息”点击可以查看了解相应的信息,右侧的“待定”变为此时的状态信息,正常会是“确定”,当然如果以上操作有误的话也会出现其他的状态信息。到这个时候,以后的工作就交给了Google来做了,当然我们也并不是一劳永逸。 另外还要根据对你自己站点的收录效果的观察,相应的对地图文件的生成配置作调整,来生成新的Sitemap.xml然后每次都需要重新提交给Google,具体就是登陆你的Google Sitemaps帐户,然后点击最右侧的“Sitemaps 操作”下的“重新提交”。或者向 Google 发送 HTTP 请求,方法是在浏览器中地址栏中输入www.google.com/webmasters/sitemaps/ping?sitemap=http://www.***.com/sitemap.xml ,成功后回返回相应的信息。 至此为止提交的操作也完成了,这部分的内容比较简单,但是提交后Google可能会有一些状态信息,这些信息的提示,有时候会让人费解,比如会列出某条找不到的网址,但事实是该网址没有任何问题,目前还无法判断这种情况会不会导致某些页面不被收录,希望大家在使用的过程中能多提供相关信息,也能使这篇文字完善起来,因此后面的FAQ内容会集中在大家比较关心的问题上,同时也会尽可能多的收集实际案例。
|
-- 作者:woaizhou -- 发布时间:4/24/2006 9:18:00 PM -- 谁能不能告诉我,我的sitemaps配置不成功能不能给我写个大概的步骤,我比较笨 |
-- 作者:cnknot -- 发布时间:5/24/2007 9:45:00 AM -- [灌水] <script type="text/javascript"><!-- google_ad_client = "pub-8190021918857508"; google_ad_width = 300; google_ad_height = 250; google_ad_format = "300x250_as"; google_ad_type = "text"; google_ad_channel = ""; google_color_border = "FFFFFF"; google_color_bg = "FFFFFF"; google_color_link = "000000"; google_color_text = "000000"; google_color_url = "191919"; //--> </script> <script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"> </script> |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
75.684ms |