网上搜索信息的加速方法

来源:百度文库 编辑:神马文学网 时间:2024/04/29 02:44:37
作者:E剑 发文时间:2005.11.04

网上的信息搜索技术越来越多,怎样才能高效迅速地找到问题的答案?有几种技术可以使得更加快捷地找到所需网页。没有一种技术是万能的,但将几种技术巧妙的结合使用会大大加快网页搜索进程。几乎所有流行的搜索引擎都提供按词组搜索的功能,按词组搜索是一种在浩瀚的网页搜索相关网页的最佳技术。
1.词组搜索
如果只给出一个单词进行搜索,那么将发现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND(与逻辑)结合起来,或者在每个词前面加上加号,这种与逻辑技术大大地缩小了命中范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样有语法。一个带引号的词组意味着只有完全匹配该词组(包括空格)的网页才是要搜索的网页。例如在搜索说明中,有“this exact phrase(这个确切词组)”这个词组,那么搜索引擎只搜索包含“this exact phrase(这个确切词组)”的网页。
下面举一个例子,一个人要查找惠普的MPE/ix操作系统的命令清单,他可能在Altavista站点只输入“MPE/ix”这个词,那么他可能会发现有2400个匹配网页;如果在填写搜索条件时写了“MPE/ix”和“Commands”两个词并用AND(与逻辑)结合起来,那么满足条件的可能是450个网页;如果在搜索条件上输入“MPE/ix Commands”,那么只有15条记录匹配,其中包括爱荷达州立大学计算与通信管理用户指南,其中对MPE/ix系统命令有详细的描述
2.词组选择
一般说来在网页搜索引擎中,用词组搜索来缩小范围从而找到搜索结果是最好的办法。但是,运用词组搜索涉及到如何使用一个词组来表达某一具体问题。有时简单地输入一个问题作为词组就能凑效,尤其是在Altavista这个站点上,因为它采用了“Ask Jeeves”引擎技术,该技术就常见问题给出预置的答案。
在Altavista上输入“ Why is the sky blue(为什么天是蓝的)",就会在“Ask Jeeves"部分找到答案,并给出若干网页回答这个问题。然而简单明了的提问方法只对一部分搜索奏效。其他词组也可以作为搜索条件,尤其这些词组中有一个词十分独特或者该词组是几个词独特的组合。试一试用人名、产品名、甚至是嵌入程序中的字符串去搜索。
3.巧妙利用错误信息
将全部或部分错误信息作为词组进行搜索。当夏时制时间变化时,Netscape Navigator (浏览器)会产生一条错误信息,该信息包含词组“book marks have changed on disk(磁盘书签已变动)”。在Northern light 或HotBot 站点上输入该词组,就会找到对该问题的解释以及如何处理。
DejaNews和新闻组文档经常发现一些问题很难甚至不能通过搜索引擎找到答案。由于新闻组更关注讨论而网页相对来说变更较少,DejaNews新闻组文档或许是一个较快的信息源。不幸的是,DejaNews 不能总是充分地处理词组引擎。尽管它遵守常规的语法,但是它的搜索引擎是处理器密集式的,而且经常只给出与搜索词组匹配的部分结果。有鉴于此,在DejaNews上搜索时最好直接键入词组不要加引号,并希望包含该词组的记录出现在前面。有些搜索引擎在处理词组时出人意料——忽略句号,搜索该词的其它形式,漏掉空格等等,但是在DejaNews中的处理过程中不存在。
4.直接到信息源查找
有时词组搜索太精确或者一个词组无法准确表达所需信息。那么可以直接到信息源,这种技术“简单得似乎不值一提”,但却很有效。根本不用搜索引擎,直接到提供某种信息组织的站点去。很多时候我们可以用公式“www.公司名.com”去猜测某一组织的站点。如果猜不中,那么到Yahoo去,或用搜索引擎。
例如,要找Dell公司现有附件的说明书,直接去该站点www.dell.com,想知道Oracle公司有什么新闻,试一试www.oracle.com,然后再去新闻栏看一看。人们在搜索引擎中得到很多无用信息,却忘了试一试该方法。这种技术还可用于其他搜索目的,并不一定与公司有关。政府机构、职业协会、教育机构也可以提供很好的信息资源。有关人口统计请去www.census.gov,还能去www.acm.org看看最近的会议清单。
(T126)
_xyz