Knowledge is power.: 挖掘搜索2.0的线索

来源:百度文库 编辑:神马文学网 时间:2024/04/29 22:23:34
挖掘搜索2.0的线索
关于搜索引擎大家都有或多或少的期待,因为这个在网络生活中助手级的工具,它的点滴提升都是能让所有网民都受益的好事,但是类似百度Google这些业已成熟的搜索产品,能够改进和期待的地方非常有限,更何况很多细微的内在的升级都根本都无法在搜索体验上表现出来,所以关于改变搜索产品形态、从不同角度重新解读和发展现有搜索技术的互联网产品越来越多也越有趣,这些blogbeta都有概要的翻译介绍,使用和研究这些新的所谓2.0的搜索服务以后,发现其或多或少的在某个角度发展了现有搜索引擎的,但是显然离2.0还有些距离,我希望能对于某些细节作一些补充和仔细描述,试图发现一些通往2.0的线索。
Ebrahim Ezzy写过两篇名为“Search 2.0 vs Traditional Search”的帖子,介绍了他心目中的2.0时代的搜索引擎。他认为传统的搜索引擎虽然越来越准确而且覆盖面也越来越大,但它只是简单的文本匹配,而并非人们头脑中关于这个词汇的含义,而“搜索2.0技术可以使搜索更有意义、客观和基于任务”“传统搜索引擎只对寻找信息有利,搜索2.0更善于快速发现新的信息”。
在他的定义中,传统搜索引擎是指基于信息检索技术的搜索引擎,它们的操作包括:布尔查询(boolean queries)、近似搜索(proximity searches)、文本关联(text relevance)和链接分析(link analysis),例如:Google, Yahoo, MSN, Ask。
他认为搜索2.0是他心目中的第三代搜索技术,搜索技术发展的三代划分是这样的:第一代,根据网页内容来进行网络站点评级排列,比如早期的yahoo以及Alta vista;第二代,把网络结构考虑进去,主要是依赖超链分析来评级排列,以Google和Overture为代表。第三代,是通过将现有的网络搜索引擎与新型的经过改进的关联模型进行融合设计而成的,它们看重用户的偏好、合作性、集体智慧、丰富的用户体验以及其他很多能使得信息更富有效率的特别性能,例如: Swicki, Rollyo, Clusty, Wink, Lexxe。
对于第三代,作者列举了十多个这方面的代表:Swicki、Rollyo、Clusty、Wink、Lexxe 、 Gravee 、Jookster、Otavo、 Outfoxed、Yoono、 Krugle 、Koders、LivePlasma、Truveo、 Pandora、Last.fm、Qube、ZoomInfo、ChaCha ,这些东东的确在某种程度上给我们耳目一新的感觉或者给我们打开了关于搜索引擎的新的畅想空间,但是无论从商业、产品体验等都无法给人以下一个Google的期待。
以下将从新解读各个产品来与大家讨论,并会不断补充最新涌现的类似搜索服务。
Swicki是一个社区化搜索引擎(community-driven),它允许用户对某一特定术语创建深度集中的搜索。与传统搜索相比, Swicki的搜索结果可以根据社区搜索的行为自动学习和适应,也就是说其搜索结果排序的模型的动态自我学习成长的。他与传统搜索引擎的区别在于,他引入搜索环境因素影响来改进搜索结果。把搜索者纳入到搜索的排体系中,听起来很好,很难成为一种可成长的模式,用户参与评价的驱动力是什么?如果用户分布非常偏狭,这样的用户行为也不能会对搜索结果有好的改善,更何况一旦被SPAM盯上,那将更难做到有效提升。
Rollyo是用户设定主题限定搜索站点集合的人力驱动型搜索。(可以设置包括或除外两种方式或其结合)Rollyo根据用户设定的参数决定的哪些内容哪些网址包含在他们的“SearchRoll”。用户可以创建和公开共享他们自己的个人搜索引擎。 SearchRoll不能替代传统搜索,它仅仅是一种你在特定范围内搜索你喜欢的信息工具。这与Google Coop,Yahoo个性化搜索,以及live search自定义搜索都是这种类型。
继续介绍相关网站:
Clusty聚类式搜索引擎,他就是vivisimo的搜索服务站点,提供在搜索结果中把相关主题内容的类聚呈现,即把相似项目分组聚合。用户可以按照自己需要找寻的内容所属的主题,它超越了传统元搜索简单整合集成普通其他搜索引擎的结果,提供了对搜索结果重新进行主题类聚,大大提高了搜索结果信息的丰富程度和二次搜索的灵活体验。
Wink是people rank的典型,它能让用户给他们喜欢的结果打tag贴上标签,屏蔽阻止不相关的垃圾信息并显示最好的站点,系统根据用户手动分拣的topic特征,站点用户信任特征被屏蔽特征等形成新的排序参数,以不断优化搜索排序。Google的personalized search正在作类似的工作.
Lexxe在作的是做传统搜索引擎已经在做的,就是主攻动态摘要技术,它旨在把动态摘要摘录好的简短回答以动态页面形式直接返回给用户,代替了以住的只是寻找答案所在位置的页面。通过利用字词的层次和相关含义,它更着重于语言而非符号的处理。某种意义上是在实现问答引擎。虽然现在传统的搜索引擎已经在动态摘要和漂红策略上已经能够实现在搜索结果列表中解答用户query的问题,但是需要改进的空间依然很大。这一发展方向与其他搜索引擎所倡导的onebox策略有所相似,如创始人乔鸿亮说"lexxe引擎把用户打入文字当作语言来处理,而不是作为符号来处理。它的计算对象直接是语言,而不是一般符号,因为它具备了语言理解能力。"
Gravee有个非常有趣的商业模式,他真正试图改变搜索引擎经济的产供销关系,通过与内容所有者分享广告收益并且付报酬给它们来获得搜索结果。虽然这对于站长们来讲是一个潜在的获得收益的机会,但是从搜索引擎角度来看,对终端搜索用户没有提供任何显见的价值,与tagging、community-based ranking相比它更是个虚的概念.
Jookster是另一个社区驱动的社会化搜索工具,它基于浏览器toolbar工具栏或者button,源于用户的社交网络social network,搜索从一个用户的书签和与之相关联的有趣的站点,从本质上看,它是社交网络和搜索引擎的交叉点。有讽刺意义的是这样对于绝大多数query将会比有机的结果有更多的广告,也许当前受制于基本登陆用户(via here),数据库非常受限,它是社会化网络和搜索的混合体。其他类似的服务如Otavo; Outfoxed; Yoono
如果说传统的搜索引擎没有能解决好你的某些搜索需求,同样这些所谓的新式的搜索依然没有能根本上改变这一局面,只是他们看起来那么的有潜力要做出一些新鲜东东出来,而这些东东要改变格局,不只是需要idea,还要接受历史的考验.