Tag的应用技术

来源:百度文库 编辑:神马文学网 时间:2024/04/28 17:44:42
Tag的应用技术tag也被称为Folksonomy(分众分类)
Tag的兴起源于两种社会性网络服务的应用 - del.icio.us书签和Flickr的图片分享服务。这两种Web服务很巧妙的将Tag功能运用其中,配合他们独特的易用性,一定程度上引爆了Tag以及分众分类的流行。
Tag主要在信息检索和寻找同好方面具备极大的价值。Technorati的Tag搜索大受欢迎,可以证明Tag在搜索领域可以很大程序上做为专业搜索引擎的补充,这是一个重要的研究方向。
寻找同好方面,Tag可以让你轻松的找到哪些人和你关注相同的关注点,从而找到志同道和的朋友。
目前中国知名blog 服务托管商Blogbus已经引入Tag,并且获得相当的好评。中国领先的SNS网络Uuzone也在积极开发准备引入。
由于认识到Tag在信息检索方面巨大的价值潜力,国内领先的专业分类信息社区必够分类搜索网bgo.cn在全国同类网站中率先引入了Tag应用。
在开发中面对的第一个难题就是relation tags的关联问题。设计者rever提出的设想是
规则1、甲文章有a b e三个tag 乙文章有b c g三个tag 丙文章有c e b三个tag 丁文章有a c b三个tag 那么tag "b"的relation tag就是3次c 2次e 2次a 1次g ,如果relation tag只列出三个的话,应该就是:
c e a
规则2、就是tag “blog”就把所有包含“blog”的tag列出来,什么“blogger”"blogsphere" "blogspot""blog商业"
经过《人肉搜索引擎是不是就是搜索引擎的未来?》作者tinyfool以及互联网感悟点滴:tag和搜索作者曾登高的指点和建议,rever决定先采用规则1中的计算方式。并且融入了王翌的多层的tag及其他理念,把加权的思想融入进来。
形成必够分类搜索网bgo.cn目前所使用的规则算法,如下:
金融类(结合传统分类目录) 甲文章有a b e三个tag
音乐类 乙文章有b c g三个tag
金融类 丙文章有c e b 三个tag
体育类 丁文章有a c b三个tag
设不同分类目录的权重为0.5 ,同分类目录权重为1 则
甲文章tag“b”的relation tags为
ax1+ex1+cx0.5+gx0.5+cx1+ex1+ax0.5+cx0.5 = 2c+2e+1.5a+0.5g
显示效果为 c e a g
乙文章tag“b”的relation tags为
ax0.5+ex0.5+cx1+gx1+cx0.5+ex0.5+ax0.5+cx0.5 = 1a+1e+2c+1g
显示效果为 c a e g
目前必够新版发布不久效果已经得到明显的体现,通过看分类Tags可以看出网站信息发布较多的热门tags,在文章中的效果也初步体现出来汽车报价,二手车交易即使没有标记tag"汽车 "二手车"在relation tags中依然会显示出与汽车类别相关的标签,用户在阅读的时候可以直接点“房屋出租”这个标签继续延伸阅读来查找房屋出租信息。
最近在查看blogbus的Tags的时候,发现不少奇怪的词语的词就比较显眼,仔细一看原来是spam tags,这使我想起keso的以前的疑问tag会死于垃圾信息吗? spam tags的问题我考虑过很多,必够对防止spam tags的设计是限制每次发布tags的个数,对重复发布相同信息进行严格监督,一旦发现重复信息就立即删除,并且删除恶意重复发布信息的用户甚至封IP。
rever认为对于spam tags,疏导的作用大于限制;受利益的驱使,发布spam的人是为了更好的效果,必够分类搜索网bgo.cn允许用户更新自己发布的信息,只要点一下“更新”项,被更新的信息发布时间就改为现在,信息就会显示在前面,效果和发布新的信息一样。只要不出现重复相同的信息,spam tags的危害就会极大降低,即使出现了spam tags它也会因为数量少而不会突出显示。
虽然受到spam tags的威胁,但是这并不会改变人们对tag前景的看好。Yahoo公司目前就十分重视Tag技术,因为它代表了一种新的组织和管理在线信息的方式。它不同于传统的、针对文件本身的关键字检索,而是一种模糊化、智能化的分类。这更加符合用户使用的顺滑感和提高检索结果的相似程度,将会极大的促进用户查询数字文件的能力,照片、视频等多媒体数字文件都可以打上Tag的标签进行管理。Tag本身绝对无法取代Yahoo和Google这样的搜索引擎,但如果日后Tag的应用逐渐增长,那么搜索引擎的使用量一定会减少。