第一章 网络能为我们做什么第三课 因特网信息资料检索原理

来源:百度文库 编辑:神马文学网 时间:2024/04/28 21:48:07

第二课时       信息检索工具的工作原理

教学目标:

  了解因特网信息检索工具的工作原理,进一步提高搜索技能,熟练地使用检索工具获取所需信息。

教学内容:

  1.介绍全文搜索和目录搜索引擎的工作原理

  2.资源搜索的定律及策略

教学重点、难点:

  介绍全文搜索和目录搜索引擎的工作原理

课时数:1课时

例:一位女士住在北京市,她想买一种交通工具上班,她的情况如下:

⑴每个月的工资均是1500元。      ⑵她喜欢的颜色是紫红  ⑶家离公司的距离约500米

问:你建议她应买什么样的交通工具?(从价格、颜色等方面考虑)

一、全文搜索引擎的工作原理

1.搜索引擎的组成

  ⑴搜索器:定期自动到各个网站上抓取网页。

  ⑵索引器:分析抓取的网页,索引,存入服务器的数据库中。

  ⑶检索器:接收用户提交的关键词不达意,从索引数据库中提取相关资源,呈现结果给用户。

2.搜索引擎的工作流程图

例:在“百度”搜索引擎中输入“屯昌概况”。

二、目录搜索引擎的基本工作原理

  ⑴人工采集、存储网络信息,手工为每个风站确定一个标题,给出大概的描述,建立关键字索引,将其放入相应的类目体系中。

  ⑵网络目录

主题性质分类,依据:某种分类依据

  信息链呈树状结构:总目录—专题目录—链接—网站

  ⑶全文搜索引擎与目录搜索引擎的区别

全文搜索引擎

目录搜索引擎

需要关键词查询

浏览主题,了解某一主题的相关资源。

搜索器在因特网中抓取网页,索引器按关键词不达意建立数据库。

人工采集并存储网络信息。

信息资源多、复杂,不易了解主题内容

网页内容丰富、学术性较强

只需要搜索器定期“抓”网页

维护费用大、更新速度慢

 

三、资源检索的三个定律

  ⑴相关性定律

  相关性基于词频统计

  早期的搜索结果排序基于此定律,如:Infoseek、Excite、Lycos

  ⑵人气质量定律

  科学引文索引的机制(论文被引用次数越多赵权威)

  超链分析的方法:1998年

  ⑶自信心定律

  它是解决搜索引擎公司的生存和发展问题的定律。

  GoTo.com(Overture)是自信心定律的最早实践者。

  此定律与相关性排序、词频统计、超链分析和竞价拍卖有关系。

  GoTo市值13亿美金,收入高达雅虎总收入的35%。

  传统的搜索引擎靠CPM来收费,GoTo的搜索引擎靠竞价排名,点击收费,开创了真正属于互联网的收费模式。

四、资源检索的策略

搜索内容

搜索引擎

一般的信息资源

综合性的(百度、google)

图片、视频

特色的

专业性较强

专业搜索引擎

全面了解网上信息资源

元搜索引擎

 

  安排任务

  以课件形式展示

  任务1:登录搜狐,搜寻黎族同胞的文化。

  任务2:登录3个目录搜索引擎,搜索本周电视节目单,并画出各自找到“电视节目单”所选择的目录路径。

采用搜索引擎:                     网址:                 

搜索内容:                     关键字:                 

目录路径:                                    

  任务3:搜索“上网太多会对身体健康产生什么样的影响”,以文字、数据和图片说明。

  任务4:回顾人类载人航天的历史。(包括重要历史的时间、事件、人物以及相应的图片资料)

  任务5:搜索中国解放后的战争电影作品。

 

新文章哦
  • “90后”学生为何“不好管” (薛松推荐)
  • 校教职工歌唱比赛,我的参赛曲目:漫步人生路 (莫金莲)
  • 2007年中考政治备考策略《重点整合、热点专题》 (海口市教育研究培训院 吉秀丽)
  • 中国教育学会外语教学专业委员会组织机构 ()
  • 关于中学生攀比心理调查研究性报告 (蔡莹)
  • 该说什么好? (布老虎)
  • 看正大综艺 (小舟)
  • 在语文教学中渗透德育的途径探讨 (曾祥平)
文章评论