新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> Gmail,Google阅读器,Google桌面,Google笔记本,Google文件,Google地图,Google地球,Google邀请
    [返回] 中文XML论坛 - 专业的XML技术讨论区Android开发论坛『 Google 应用 』 → GOOGLE搜索秘籍--适合高手,菜鸟共同提高 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 38209 个阅读者浏览上一篇主题  刷新本主题   平板显示贴子 浏览下一篇主题
     * 贴子主题: GOOGLE搜索秘籍--适合高手,菜鸟共同提高 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     nineline 帅哥哟,离线,有人找我吗?
      
      
      等级:大三(研究MFC有点眉目了!)
      文章:48
      积分:540
      门派:XML.ORG.CN
      注册:2005/1/11

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给nineline发送一个短消息 把nineline加入好友 查看nineline的个人资料 搜索nineline在『 Google 应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看nineline的博客楼主
    发贴心情 

    Google 的一般搜索
    1、搜索结果要求包含两个及两个以上关键字

    一般搜索引擎需要在多个关键字之间加上“ ”,而Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。

    示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页
    搜索:“搜索引擎 历史”
    结果:已搜索有关搜索引擎 历史的中文(简体)网页。 共约有78,600项查询结果,这是第1-10项 。 搜索用时0.36秒。

    用了两个关键字,查询结果已经从70多万项减少到7万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历史”,并不是我们所需要的“搜索引擎的历史”。 怎么办呢?删除与搜索引擎不相关的“历史”。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、“历史书籍”等。


    2、搜索结果要求不包含某些特定信息

    Google用减号“-”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。

    示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页
    搜索:“搜索引擎 历史 -文化 -中国历史 -世界历史”
    结果:已搜索有关搜索引擎 历史 -文化 -中国历史 -世界历史的中文(简体)网页。 共约有36,800项查询结果,这是第1-10项 。 搜索用时0.22秒。

    我们看到,通过去掉不相关信息,搜索结果又减少了将近一半。第一个搜索结果是:

    搜索引擎直通车≡搜索引擎发展历史
    搜索引擎直通车, ... 搜索引擎专业介绍站点. ...
    www.se-express.com/about/about.htm - 14k - 网页快照 - 类似网页

    非常符合搜索要求。另外,第八项搜索结果:

    463搜索王
    本站检索 整个网站 在此输入关键词. 你的当前
    位置:首页 >> Internet搜索手册 >> 搜索引擎的历史. ...
    www.cnco.net/search/history.htm - 21k - 网页快照 - 类似网页

    也符合搜索要求。但是,10个结果只有两个符合要求,未免太少了点。不过,在没有更好的策略之前,不妨先点开一个结果看看。点开se-express.com的这个名为“搜索引擎发展历史”的网页,我们发现,搜索引擎的历史,是与互联网早期的文件检索工具“Archie”息息相关的。此外,搜索引擎似乎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,使搜索引擎深入人心的是“Yahoo”。了解了这些信息,我们就可以进一步的让搜索结果符合要求了。

    注意:这里的“ ”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“搜索引擎 - 文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。


    3、搜索结果至少包含多个关键字中的任意一个

    Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。

    示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。
    搜索:“搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化”
    结果:已搜索有关搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化的中文(简体)网页。 共约有8,400项查询结果,这是第1-10项 。 搜索用时0.16秒。

    我们看到,搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧。

    注意:“与”操作必须用大写的“OR”,而不是小写的“or”。

    在上面的例子中,我介绍了搜索引擎最基本的语法“与”“非”和“或”,这三种搜索语法Google分别用“ ”(空格)、“-”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“ ”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。

    4.通配符问题

    很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用""引起来。比如,“"以*治国"”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。

    5、关键字的字母大小写

    Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。

    6、搜索整个短语或者句子

    Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。

    示例:搜索关于第一次世界大战的英文信息。
    搜索:“"world war I"”
    结果:已向英特网搜索"world war i". 共约有937,000项查询结果,这是第1-10项 。 搜索用时0.06秒。

    7、搜索引擎忽略的字符以及强制搜索

    Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。

    示例:搜索关于www起源的一些历史资料。
    搜索:“www的历史 internet”
    结果:以下的字词因为使用过于频繁,没有被列入搜索范围: www 的. 已搜索有关www的历史 internet的中文(简体)网页。 共约有75,100项查询结果,这是第1-10项 。 搜索用时0.22秒。

    我们看到,搜索“www的历史 internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。

    如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。
    搜索:“+www +的历史 internet”
    结果:已搜索有关+www +的历史 internet的中文(简体)网页。 共约有25,000项查询结果,这是第1-10项 。 搜索用时0.05秒。

    另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”world war I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。

    搜索:“"www的历史" internet”
    结果:已搜索有关"www的历史" internet的中文(简体)网页。 共约有7项查询结果,这是第1-6项 。 搜索用时0.26秒。

    我们看到,这一搜索事实上把“www的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。

    注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/13 21:32:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Google 应用 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/2 20:12:26

    本主题贴数12,分页: [1] [2]

     *树形目录 (最近20个回帖) 顶端 
    主题:  GOOGLE搜索秘籍--适合高手,菜鸟共同提高(18634字) - admin,2004年10月29日
        回复:  我第一次用的搜索引擎就是GOOGLE!!!(33字) - 七七,2005年6月25日
        回复:  学到不少东西(12字) - 对面,2005年6月23日
        回复:  这个帖字真好啊!从中学到不少东西,我会告诉朋友都来学一学!(58字) - xxxx,2005年6月21日
        回复:  support!it is wonderfull!thanks!(34字) - zjinyu,2005年5月16日
        回复:  学到不少!(10字) - linjuclub,2005年5月16日
        回复:  有一个疑问,我用google搜索出结果后,为何只能看到很少的一部份结果?如搜索:donghid ,..(261字) - donghid,2005年1月21日
        回复:  1、搜索所有链接到某个URL地址的网页如果你拥有一个个人网站,估计很想知道有多少人对你的网站作..(8494字) - nineline,2005年1月13日
        回复:  Google高级搜索1、对搜索的网站进行限制“site”表示搜索结果局限于某个具体网站或者网..(3058字) - nineline,2005年1月13日
        回复:  Google 的一般搜索1、搜索结果要求包含两个及两个以上关键字一般搜索引擎需要在多个关键字..(5714字) - nineline,2005年1月13日
        回复:  知道了很多!(12字) - yibingzheng,2005年1月5日
        回复:  不错(4字) - xmzhy,2004年12月15日

    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    125.000ms