yahoo、网摘和tag

来源:百度文库 编辑:神马文学网 时间:2024/03/29 12:55:44
Yahoo、网摘和Tag
刚从老冒的Blog中得知Yahoo推出网摘了,开始感觉特别震惊,从365Key在国内首先推出网摘以来,国内类似的服务层出不穷,甚至SINA、SOHU等门户站点也介入其中。这次如果Yahoo介入,也就代表国际知名网站对社会化书签的重视了。研究了这个称为MyWeb的服务,感觉还是一个扩展的收藏夹,共享功能作得还不够。这从它的宣传口号:“My Web BETA Find it, Save it, Never forget it.”可以看出,目前也只支持IE的收藏夹导入。不过看说明,这个服务即将和Yahoo!360开始捆绑,相信还是会有不少的用户。
Yahoo的这种书签服务和网摘、Tag的模式还是有很大差别,为什么搜索引擎不直接引入网摘和Tag呢?Ding Deng的文章中援引Danny Sullivan的分析,认为:没有利用tagging所产生的元数据的原因是这些数据基本上都是没有利用价值的, 因为它们当中含有因滥用和描述不当而产生的无用信息。
虽然Yahoo不想涉足网摘和Tag,倒有热心人John Herren来帮忙。Yahoo! News Tag Soup Popular Tags就是一个Yahoo! News的weighted tag。他在How does this work?中透露了他的实现方式:
每小时定时从Yahoo! News的RSS源获取新闻信息。 将新闻信息导入MySQL数据库,通过MySQL的索引来避免重复的新闻。 然后使用Yahoo!提供的Content Analysis web service(内容分析Web服务)分析出关键词(tag),并和新闻关联。 有了以上数据,就可以通过CSS来输出weighted tag了。 点击每个Tag就能看到所有的新闻,每篇新闻还罗列了所有相关的tag。
这种方式非常有趣,让Yahoo!暂时也tag起来了,不过也有些限制。首先,Content Analysis web service其实是一种萃取(Extraction)服务,萃取出来的多半是文章的一些关键词,这和Tag这种大众分类(folksonomy)有些区别。其次Content Analysis web service限制每天5000个分析请求,如果需要处理的新闻多于这个数量,就没有办法了。