互联网感悟点滴:tag和搜索

来源:百度文库 编辑:神马文学网 时间:2024/04/25 09:04:19
互联网感悟点滴:tag和搜索
tag被国内关注越来越多了。
先是owen提到tag的中文化难题,后是keso质问tag会死于垃圾信息吗?tag面临大规模的应用还是有很多问题需要解决。不过我感觉,所有的问题需要我们真正实践了才能找到解决方案。毕竟tag的好处还是很多的。我认为以下几点很关键:
1、Tag操作更便捷
刚做365key的时候,我不太理解Del.icio.us为什么要那样填写分类(那时候我还是用分类的观念来看tags)。后来我把很多信息进行归类,发现数量一多,信息查到非常困难,明明收录了不知道扔到那个分类了,后来不得不进行拆分。比如互联网就被我拆出Blog、SNS、SEO、......等等分类来。
我现在明白了,分类相对tag而言,最大区别是我们在操作的时候要想一下具体的划分原则,因为从聚类的观点来看,分类的边界应该是比较清晰的,而这个清晰的界线只存在你脑海中,保不准哪天疏忽了。而tag是一种随心所欲的标签,当我读一篇文章的时候想什么就写什么,不受原有分类的束缚,操作自然便捷。
2、Tag便于迅速定位信息
这也是Del.icio.us作者Jeremy Wagstaff设计tag的一个初衷,前面提到,Tag是自己的思想火花,单个tag比分类有更强的指向性,另外,现在的大部分tag系统支持tag的相加,相加的概念就是同时归属2个或以上tag的信息,这样匹配出来的信息就更加准确到位了。比如,在365key的google标签下有996项内容,而google+yahoo就只有12项了。
3、Tag的社会性特点能帮我们找到真正的同好
tag是随意性,但也是人的思想真实体现,当系统赋予tag更多社会化特点后,我们可以通过tag直接找到志同道合的朋友。比如摄影中,我们就可以找到cerio等网友了。
我对Tag应用最担心还是用户的接受程度,我想大部分不是聪明绝顶,都会像我一样有个从分类到tag的转换过程。目前阶段,就像我在365key为什么要支持tag和使用建议中提到的,喜欢分类的用分类,喜欢tag的用tag,主要还是看你对信息整理的思维逻辑。
平时工作忙,利用难得的五一长假,我对365key的tag系统作了些修改,下面是365key关于Tag的一些改进:
1、支持Tag"图"
Tag"图"其实还是文字,就是根据收录数量指定tag字体大小,达到一目了然的作用。365key一周热点Tag"图"在:
http://www.365key.com/tags/,个人的Tag"图"在:http://www.365key.com/tags//。
2、支持Tag的"+"和","操作
前面谈到"+"了,比如通过http://www.365key.com/tag/+/我们可以定位到包含这2个tag的网摘,从逻辑上讲,+实际是结果集的and(和)关系,不难理解,","就代表结果集的or(或)关系,http://www.365key.com/tag/,/表示的实际上是2个tag内的所有网摘,包含其一即可。"+"和","都支持多个tag的组合,在365key的tag页面右边会列出相关tag,可以随意组合查询。同时,这种方式也可以指定用户,格式是http://www.365key.com//++.../和http://www.365key.com//,,.../。
3、支持Tag相关用户列表
在365key的tag页面右边会列出相关用户,这为找到同好提供了便利之门。发现好的tag和用户就赶快订阅吧。
4、链接信息支持相关Tag
当一个网摘是多人收录的时候,就会在右边列出相关Tag。比如在"365key为什么要支持tag和使用建议"的链接信息中IT、tag、365key是最多的3个tag。感谢googoz的建议,通过这种方式,我们就能看到到底把西瓜标为“香蕉”的人有多少,都是哪些人了。用社会化的tag方式,也间接实现了王翌提到的多层的tag概念。
googoz说的好,如果只是把tag作为一种随意的分类方式,那么tag的意义就大大缩水了。自由的意义如果只是限定在个体上,那么tag的这种自由的优势将成为其致命的缺点。365key将让用户感觉不到系统分类和中心化的概念,首页自然需要改版了。:)
诚如各位网络精英所言,tag面临着非常多的难题,365key会继续在tag方向不断实践和探索,也希望各位多多给我出谋划策。
暂时离开tag,我们来看搜索。和王翌先前聊到网摘的搜索化出路,网摘都是网友的精选,有网友的tag和选择的摘要,天生是搜索的好素材,不用确实可惜了。
这2天修改了整个搜索模块,加入了海量的部分技术,具体也给大家通报一下:
1、支持对标题、评论、摘要的搜索 2、搜索默认按照相关度排序
这个相关度和普通的全文检索相关度略有不同,我综合相关度/收录数/点击量等来排序,目的是希望搜索出来的结果尽量是大家最喜欢的,最重要的。这篇帖子的很多连接就是我通过365key搜索到的。
3、搜索词支持通用的搜索语法
比如多关键词查询、逻辑查询、结果中去除,懒得写帮助了,大家参考一下CSDN上的吧。
4、结果的排重
如果没有指定用户和tag,搜索结果总是第一个收录人的网摘,保证了不出现URL重复。
顺便说一下,365key收录榜有一个XXX首先收录的连接,这是keso的好主意,目前搜索也结合了,365key鼓励用户看到好内容第一收录。同时我们也可以统计出网友第一收录的记录,比如keso的6536网摘中就有3079篇是他第一收录并被其他人收录了。
最后提一下js输出的一点小改动,jsDays.aspx多支持一个showclip(=1表示显示摘要信息)的参数,可以在javascript中显示摘要了,keso拿来作为“名言警句”放在blog的右边。
写到这里天已经亮了。忙了几天,今天留给自己玩《国家的崛起》,别打搅我。:)