第一章 网络能为我们做什么第三课 因特网信息资料检索原理

来源:百度文库 编辑:神马文学网 时间:2024/04/28 09:00:45
第二课时       信息检索工具的工作原理
教学目标:
了解因特网信息检索工具的工作原理,进一步提高搜索技能,熟练地使用检索工具获取所需信息。
教学内容:
1.介绍全文搜索和目录搜索引擎的工作原理
2.资源搜索的定律及策略
教学重点、难点:
介绍全文搜索和目录搜索引擎的工作原理
课时数:1课时
例:一位女士住在北京市,她想买一种交通工具上班,她的情况如下:
⑴每个月的工资均是1500元。      ⑵她喜欢的颜色是紫红  ⑶家离公司的距离约500米
问:你建议她应买什么样的交通工具?(从价格、颜色等方面考虑)
一、全文搜索引擎的工作原理

1.搜索引擎的组成
⑴搜索器:定期自动到各个网站上抓取网页。
⑵索引器:分析抓取的网页,索引,存入服务器的数据库中。
⑶检索器:接收用户提交的关键词不达意,从索引数据库中提取相关资源,呈现结果给用户。
2.搜索引擎的工作流程图

例:在“百度”搜索引擎中输入“屯昌概况”。

二、目录搜索引擎的基本工作原理
⑴人工采集、存储网络信息,手工为每个风站确定一个标题,给出大概的描述,建立关键字索引,将其放入相应的类目体系中。
⑵网络目录
按主题性质分类,依据:某种分类依据
信息链呈树状结构:总目录—专题目录—链接—网站
⑶全文搜索引擎与目录搜索引擎的区别
全文搜索引擎
目录搜索引擎
需要关键词查询
浏览主题,了解某一主题的相关资源。
搜索器在因特网中抓取网页,索引器按关键词不达意建立数据库。
人工采集并存储网络信息。
信息资源多、复杂,不易了解主题内容
网页内容丰富、学术性较强
只需要搜索器定期“抓”网页
维护费用大、更新速度慢
三、资源检索的三个定律
⑴相关性定律
相关性基于词频统计
早期的搜索结果排序基于此定律,如:Infoseek、Excite、Lycos
⑵人气质量定律
科学引文索引的机制(论文被引用次数越多赵权威)
超链分析的方法:1998年
⑶自信心定律
它是解决搜索引擎公司的生存和发展问题的定律。
GoTo.com(Overture)是自信心定律的最早实践者。
此定律与相关性排序、词频统计、超链分析和竞价拍卖有关系。
GoTo市值13亿美金,收入高达雅虎总收入的35%。
传统的搜索引擎靠CPM来收费,GoTo的搜索引擎靠竞价排名,点击收费,开创了真正属于互联网的收费模式。
四、资源检索的策略
搜索内容
搜索引擎
一般的信息资源
综合性的(百度、google)
图片、视频
特色的
专业性较强
专业搜索引擎
全面了解网上信息资源
元搜索引擎
安排任务
以课件形式展示
任务1:登录搜狐,搜寻黎族同胞的文化。
任务2:登录3个目录搜索引擎,搜索本周电视节目单,并画出各自找到“电视节目单”所选择的目录路径。
采用搜索引擎:                     网址:
搜索内容:                     关键字:
目录路径:
任务3:搜索“上网太多会对身体健康产生什么样的影响”,以文字、数据和图片说明。
任务4:回顾人类载人航天的历史。(包括重要历史的时间、事件、人物以及相应的图片资料)
任务5:搜索中国解放后的战争电影作品。
新文章哦
“90后”学生为何“不好管” (薛松推荐)校教职工歌唱比赛,我的参赛曲目:漫步人生路 (莫金莲)2007年中考政治备考策略《重点整合、热点专题》 (海口市教育研究培训院 吉秀丽)中国教育学会外语教学专业委员会组织机构 ()关于中学生攀比心理调查研究性报告 (蔡莹)该说什么好? (布老虎)看正大综艺 (小舟)在语文教学中渗透德育的途径探讨 (曾祥平)
文章评论