社会化搜索的探索之路——迅雷篇

来源:百度文库 编辑:神马文学网 时间:2024/04/29 03:40:02
马国良 |IT风向标 | 出处:原创-IT| 2006年09月20日 23:20 | 阅读2726 次

首发:《社会化搜索周刊》作者:马国良 转载请注明!
Ailog说迅雷是成功的社会化模式和社会化搜索模式。但是之前每次和朋友谈迅雷模式的优势的时候,我一直鼓吹迅雷模式如何如何好,却从来没有想过和社会化和社会化搜索方面联系着想;另一方面也一直在记录和描述社会化和社会化搜索的案例和模式,却没有回头思考其实迅雷也是社会化和社会化搜索的一个特殊案例。现在想想其实我们可以把迅雷作为目前最成功的社会化和社会化搜索模式案例来研究。
一、迅雷社会化搜索之收藏
迅雷之所以如此快速的成长,第一得益于优秀的迅雷下载客户端,第二个是因为迅雷自己的资源数据库,迅雷自己的资源数据库实际上是社会化的成果。迅雷客户端的作用类似社会化搜索引擎网站一般都推出的工具条,但是比工具条优势大,因为工具条的门槛太低了而迅雷客户端一直在同类产品里保持领先优势。社会化搜索引擎网站的工具条的作用就是方面用户向搜索引擎提交收藏,用户一般是主动提交收藏信息;迅雷客户端的作用也是方面用户向迅雷搜索或者资源数据库提交收藏,但是用户是连自己也都不知道地提交收藏信息,这就是迅雷产品的高明处。目前用户在使用迅雷客户端的时候下载资源的时候,下载到本地的同时也上传了一份下载信息到迅雷服务器上,由此来保证通过迅雷搜索到的结果是很丰富的,而且是最新、最热的资源,随着迅雷客户端用户的增加,迅雷服务器可以很轻易把握到互联网用户资源下载指数。
二、迅雷社会化搜索之资源库
迅雷的资源库很丰富,而且还在不断丰富,只要用户在不断使用迅雷客户端,资源库就会膨胀。迅雷资源库建立的基础是迅雷定向抓取各大资源网站,这点类似社会化搜索引擎很多都建立在元搜索和其他搜索引擎的基础之上(国内元搜索社会化案例:deyeb)。因此迅雷的资源库由两部分组成:一部分是由机器自动抓取的,另外一部分用户产生的。当用户产生资源数量小的时候,机器搜索抓取起主导;当用户产生资源数量巨大的时候,虽然可能利用用户产生的资源来满足用户的需求,但是机器搜索抓取的还是需要作为必要的补充,起搜索结果辅助作用。但如果用户产生资源有太多的无效资源或者垃圾资源呢?怎么样保证用户利用搜索引擎搜索到的就是用户最需求的?这就是涉及到资源筛选、过滤的问题。
三、迅雷社会化搜索之资源筛选
在丰富资源数据库的同时要保证资源信息的优良性。社会化搜索引擎也面临用户提交信息的过多垃圾的挑战,可能一不小心,社会化搜索引擎就成了“垃圾桶搜索引擎”。传统的收藏或者书签网站,都不可避免的垃圾信息的干扰,雅虎的收藏也逃不脱成为“垃圾桶”的噩运。国内的365key也是。之前我也一直在考虑用户筛选机制应该是怎么样的?我之前的文章里也提过:收藏+搜索+dig,结合起来是完美的机制。收藏不能排除垃圾信息进入;搜索决定用户的兴趣、需要,这样可以避免一部分垃圾信息出现;dig可以对信息筛选,不良信息将被用户剔除出搜索结果。经过dig+搜索的筛选省下来的,与用户不相关的搜索结果被大大减少。一旦良性用户氛围建立,搜索也变成了wiki搜索,搜索的结果将变得是非常准确的。怎样的搜索才是用户最为喜爱的搜索?迅雷是怎么来筛选资源的呢?用户喜欢一个搜索引擎,肯定因为用该搜索可以在最短时间内找到最佳信息。这个搜索引擎的搜索机制应该包括机器筛选,人工参与。简单地说就是机器采集的时候设置采集站点的优先级,这个根据资源热度、网络下载速度等因素来决定,资源热度判断是根据用户用户关注度和下载量。用户对迅雷资源的dig方式就是下载,每下载一次就相当于为该资源投一票。
四、迅雷社会化搜索之资源聚类
其实目前迅雷作为一个专门的资源搜索和下载站,好像对社会化搜索的类聚功能需求不是很大,最多做一个相关搜索就可以。迅雷搜索的资源量和范围还是有限的。比如用迅雷搜索“芙蓉姐姐”,社会化搜索引擎的类聚往往会出现“博客”、“照片”、“北大”等词汇,因为这些类聚词汇可以帮助用户全面了解芙蓉姐姐的全面信息;而用迅雷搜索出来的,无非是一些恶搞芙蓉姐姐的视频或者图片,这也是用户最需要的,用户在选择用迅雷搜索相比选择社会化搜索搜索范围狭隘些,相对明确的目的决定迅雷和社会化搜索的这点区别。迅雷不需要类聚,但是类聚对社会化搜索相当重要,类聚甚至可以说是未来智能搜索的一个雏形引导或者启发式,简单智能搜索带有启发式,会利用搜索引擎去帮助用户寻找最佳答案,在寻找过程中不断引导提示起了关键作用,类聚好坏决定搜索的准确度和所消耗时间量。
四、社会化搜索的其他特征
1.个人搜索
社会化搜索为什么还要个人搜索?社会化搜索可以是建立在个人搜索基础之上的。这样的模式国外比较成功的有swicki和rollyo。以个人搜索为突破点,自定义搜索页面和搜索结果,也可以指定搜索站点,然后把代码放到个人网站或者个人博客上。因为个人网站或博客的用户群是固定的,同时自定义搜索页面、搜索结果、指定搜索站点可以满足个人站长和博客为自己网站或博客量身定做一款搜索引擎,访问用户对搜索的增、删、改的建议也将帮助完善个人个性化搜索,所以个人搜索将被打造一个一个符合需求的搜索。个人搜索的建议将直接影响到整体搜索引擎的搜索结果,可惜目前的swicki还没有推出公共搜索的服务。Swicki也确实就是wiki化的搜索。提到这点特征,会过来头来再看迅雷,迅雷的社会化机制做得还只是起步,但是有雏形了。我们看到资源博客和web迅雷首页是相互独立的。Web迅雷其实就类似Swicki的个人搜索,但是这个“个人搜索”只针对个人。通过web迅雷下载资源是对迅雷资源库的一个更新整理过程,用户在不知情的条件下替迅雷的资源库做wiki编辑工作。因为下载资源可能涉及隐私问题,不然完全可以单独拿出来,每位用户都有一个资源库和搜索,分享个人下载资源。个人整理的资源库往往是很有价值的,方便自己也方便其他用户,在国内用户主动参与性还不是很高的情况下,web迅雷帮每位注册用户罗列一个该用户的资源库,用户只需要整理下就可以。单纯的资源博客是没有意义的,结合web迅雷的用户资源库的博客,可能更有价值,这样结合不就是Swicki的个人搜索吗?
2.圈子
提到了分享,肯定需要圈子的概念,社会化搜索发展过程中也是慢慢总结普通搜索引擎的不足,慢慢完善的。搜索的分享是非常必要的,前一位搜索相同内容的,对后一位是有指导和帮助意义的。搜索引擎上每天搜索相同事物的用户非常多,我们称这些搜索相同事物的用户为“兴趣圈用户”,而这些用户组成了同一个兴趣圈。兴趣圈第一层意思是把其他用户搜索的相关热点关键词列出来,包含相关搜索和类聚的意思,但是这个是有用户产生的相关搜索热点。兴趣圈第二层意思是共同兴趣爱好的用户,分享自己的搜索结果。比如李宇春的玉米,肯定有共同的搜索需求和搜索爱好,他们之间的交流也是有必要的,因为这是他们有共同的兴趣点。社会化搜索的圈子服务是对用户深一层的服务,更好地满足用户需求是社会化搜索的宗旨。迅雷在资源博客来完成圈子的作用,那是不够的。博客能实现分享,但不能让用户进一步交流。而且搜索的记录痕迹也是可以放入圈子分享的,当然为了保护自己的隐私,可以做关键词屏蔽。圈子的最终目的,是形成分享的文化氛围,达到交流互动的作用。
最后要说的一点,本文只是在迅雷和社会化搜索的模式上进行讨论。迅雷不是社会化搜索,社会化搜索不是迅雷。因为有相似点,所以放在一起研究下,迅雷或许可以从社会化搜索的模式中寻找到一些优秀的应用,社会化搜索也可以从迅雷的快速发展寻求下自身发展可以借鉴的地方。