Exploratory search领域研究

来源:百度文库 编辑:神马文学网 时间:2024/04/30 06:27:08
Exploratory search领域研究 (2008-05-10 00:37:23)
标签:it  分类:投资情报系统
对于无法直接找到答案的信息需求的搜索,都可以称之为exploratory search。实际中存在着大量的这样的需求,每个人都有这样的需求。例如,情报人员对情报主题的关注;一个普通人对某个主题感兴趣,想要持续地了解这个主题的情况等等。这样的信息需求都不是通过通用搜索引擎能够解决的。
Exploratory search服务一般会包括以下的一些特性:
(1) 相关信息搜集。当用户需要了解一个主题的时候,这个主题往往包括很多方面的信息。系统应该能够将这个主题相关的信息分门别类、持续地提供给用户。这里面的一个核心问题应该是信息相关性分析问题,即:一条信息是否跟该主题有密切的关系?是在哪方面的关系?等。
(2) 协同工作。当然用户可以独立工作。但是,如果一群对某个特定主题都感兴趣的人能够在一起互相配合,共同学习、理解、发现,相信对每个人来说都是有帮助的。因此,这个服务应该是一个能支持具有相关兴趣的人协同获取信息,协同工作。
(3) 收藏。当用户开始关注某个主题的时候,一定会看到一些相关信息。系统应该支持用户将这些网上的信息搜藏起来,在需要的时候能够随时看到。
(4) 特殊的数据挖掘能力。对于一些能够统计的信息,根据需要,系统可以增加一定的数据挖掘服务。如:对某类主题信息的数量统计以及随时间变化;网民对某主题的立场统计;某类主题用户强烈反响的热点和焦点新闻等。
因此做研究时,首先要确定核心问题。可能的核心问题有:
(1) 相关性分析问题。一条信息和另一条信息的相关程度。怎么来衡量?传统的信息相关度方法,如:用文本向量的夹角来衡量两个文本之间的相关度,只能找出与一篇文章类似的文章。但是相关的文章却并不一定是内容很类似的文章。可以借鉴semi-supervised方法来支持用户从不同的角度看同一个事件。