Internet搜索引擎

来源:百度文库 编辑:神马文学网 时间:2024/04/29 12:15:32
著名搜索引擎使用指南

Internet上有很多信息查询工具,是使用最广泛的一个。提供了全面的分类体系,它提供了按主题分类索引的WWW服务器的目录。我们可以按这个分类来查询,查询的方法是先点击分类的超连接,然后便可按其查询要求进行查询。
也提供了一些简单的高级查询,你可以输入关键词,也可以设置关键词之间的关系,是AND还是OR,例如,我们输入DO,将列出在Internet上所有含DO这个单词的WWW站点地址。如果用户在中查不到所需的资料,还可以利用其主页末尾提供的其他搜索工具,如ALTAVISTA、LYCOS等的超连接进行进一步的查询。
现在,请您按动开始网上搜索![回主页][返回]
二、ALTAVISTA
设在美国公司的ALTAVISTA检索服务器是1995年12月建立的。是目前最优秀的搜索引擎。ALTAVISTA维护了一个含时间变量的数据库,能保所查询的资料是最新和最全面的。
ALTAVISTA的查询分为简单查询和高级查询。
简单查询通过输入一个或几个关键词后提交查询任务即可。
高级查询则除了定义关键词以外,还必须使用下列关系符:
AND:和,指同时存在。
OR:或,二者居其一。
NOT:非,不包括。
NEAR:接近,同时包括两个单词但两词距离不超过10个单词,两词不分先后顺序。
例如:查询条件“Internet AND data mining”将查找同时包括“internet”和"data mining"的资料;而“internet OR data mining”则查找包括“internet”或者“data mining”这两个词的资料;
此外,ALTAVISTA支持过滤查询。其查询的节点分为WEB主页和USENET新闻组两种。
对于Web页,过滤的方法有:
例(1) title:"data mining":查找标题中含有“data mining”的主页;
例(2) host:digital.com:查找主机为digital.com的文章;
例(3) URL:datamining.html:查找URL中含有dataminig和html的文章。
对于新闻组,查询语法为:
例(4) From:mrp:查找新闻的FROM头中含有单词“mrp”的新闻;
例(5) subject:mrp:从新闻头的subject域查找含有“mrp”的条目;
例(6) summary:invest*:查找的新闻的summary域中含有invest、investment、investor...等的新闻;
ALTAVISTA还允许设置查询的时间段,如可以查询从1996.04.01到1997.05.05这段时间内的资料。
ALTAVISTA还有许多有用的功能,您只需按动HERE 亲自尝试一下便知![回主页][回页首][返回]
三、
Opentext可以进行全文本搜索,同时也可以指定搜索范围。它的搜索方式有两种:
简单搜索(simple search):类似于一般的关键词搜索。
强力搜索(Power search):可以限定搜索范围,并且可以使用关系词如AND、OR、BUT NOT、NEAR等。
关于搜索范围,限制词有:
Anywhere:在整个Web页内搜索,相当于全文搜索;
Summary:在每个Web页的摘要(summary)中搜索。每个Web页的摘要由标题(First heading)和正文(Context);
Title:按每个Web页的题名(Title)搜索;
First Heading:按每个Web页的标题搜索;
URL:按Web页的地址搜索。
关键词之间的限定关系:
除了通常的“AND”(与)、“OR”(或)、“NEAR”(接近)与其他搜索引擎相同之外,比较特殊的有2个:
BUT NOT:“否”的关系,剔除包含NOT后关键词的Web页;
FOLLOWED BY:类似NEAR,但followed by前面的词在前,位置不能颠倒。
[链接到OPENTEXT][回主页][回页首][返回]
四、
美国Excite公司的WebCrawler是第一个在Interneth上提供全文检索的引擎,后来lycos、infoseek、OpenTeaxt等加入了全文检索的行列,目前WebCrawler仍然是Internet上被广泛使用的搜索引擎,它每周有200万人次的访问,每天有300万人次的查询。WebCrawler使用了PLS(Personal Library Sofware)高级搜索和检索技术,使其搜索和检索十分简单。WebCrawler支持“自然语言搜索”,采取了ANY或ALL的匹配模式。
WebCrawler的查询也分为简单查询和高级查询。简单查询同其它引擎的简单查询一样。对于查询结果我们可以设置结果处理方式:
1)只显示文章的标题;
2)Summary方式:显示文章标题的同时显示文章的摘要。
同时也可以设置一次显示多少篇文章,如10篇、25篇等。WebCrawler的高级查询与ALTAVISTA的高级查询基本一致,如使用AND、OR、NOT、()等,对于NEAR,WebCrawler有一定的扩充,同时还增加了.ADJ操作符。
1)NEAR:在ALTAVISTA中NEAR有一个默认,即两个词之间的间隔不超过10个单词,而WebCrawler对于这个间隔是可以改变的,如data NEAR/20 mining,这样,data与mining之间的间隔单词数就可以达20个。如果不指明这个参数,WebCrawler就认为为0,即data NEAR mining等价于“data mining”OR“mining data”。
2)ADJ:NEAR标识的相邻是前后顺序无关的,而ADJ标识的相邻就不是这样的了,如data ADJ mining查询结果将不包括含有mining data的文章,而只返回含有data mining的文章。
如果您想亲自试一试的话,就请按这里:[连接到WebCrawler][回主页][回页首][返回]
Infoseek
infoseek是一个收费的搜索引擎,它只免费向你提供它查到的前100条记录(不过这对于我们一般的用户已是绰绰有余)。它的特点是:搜索精度高,查到的节点一般都与你的要求相符。其搜索结果也是按照相关程度依次显示。每一个结果显示该HTML文件的标题、摘要、大小。
它可以提供以下的搜索范围:
1、the World Wide Web: 在整个WWW信息系统内查找;
2、Infoseek Select Site: 在Infoseek选定的Web页中查找;
3、Usenet Newsgroups: 在新闻组中搜索;
4、Company Directory: 在公司名目中搜索;
5、E-mail Addresses: 在E-mail地址中查找;
6、Timely News: 在实时新闻中查找;
7、Web FAQs: 在Web常见问题页中查找;
其搜索方法如下:
1、词组(短语)搜索。这时需对词组加以双引号,以示与单个词的区别。例如要查找关于电子杂志方面的信息可以键入“electronic magazine”,这样就把“electronic magazine ”当作一个短语来搜索。相反,如果不加双引号,搜索引擎就会查出包含“electronic”(电子)及“magazine”(杂志)的节点,诸如电子产品等,会严重偏离主题。
2、指定不得在结果的文件中出现的词。在一个词之前加一个“-”,表示在搜索结果中必须出现该词。相当于布尔表达式中“AND”(与)的作用。如果不加“+”,隐含为或的关系,即只要文件中包含上述一个词,即为检中。
[立即搜索][回页首][返回][回主页]