网络信息分类法的新亮点——Folksonom

来源:百度文库 编辑:神马文学网 时间:2024/04/19 00:51:28

1  Folksonomy概况[1-4

Folksonomy是一个创造词,是由Folk(或Folks)与Taxonomy组合而成,Folks在英文中是比较口语化的词,表示一群人、一伙人的意思。Taxonomy则是指分类法,是信息组织中的一个重要组成部分。Folksonomy的字面含义就是“一伙人的分类法”。Folksonomy是由社会性书签服务中最具特色的自定义标签(Tag)功能衍生而来,举个例子:当一个博客在收藏Sina.com时,自定义了“门户”、“中国”、“新闻”这3个关键词作为标签,而其他人在收藏Sina.com时也自定义了自己的关键词作为标签,例如“中国”、“新闻”、“网站”。最后系统统计出使用“门户”,“中国”,“新闻”这个3个关键词来定义Sina.com的频率最高,那么这3个词就是用户对Sina.com的Folksonomy分类。由此可见,Folksonomy就是由网络信息用户自发为某类信息定义一组标签进行描述,并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法。其实质就是以词为类,但其类目却是平面的,非等级的。

目前folksonomy的译法很多,主要有:“分众分类法”、“大众分类法”、“自由分类法”、“通俗分类法”和“社会分类法”等等。根据上文的说明本文采用“自由分类法”。但是无论folksonomy使用何种译法,它都是现今时代对网络信息分类的一种新方法,它与以往的网络信息分类方法有着很多明显的区别,这是值得人们关注的。

自由分类法的特点[5-7

自由分类法是对网络信息分类的一种新尝试,它突破了传统的类目设置,充分体现了网络用户的信息需求特点,与传统的分类法相比,它具有以下优点:

(1) 以词为类,类目(Tags)由网络用户自定义生成  自由分类法的类目是由词语担当的,不同与传统分类法采用符号、数字或者将二者结合。这样做的优点是类目直接显示,类目含义一目了然。作为类目名称的标签产生也与传统分类法有所不同。自由分类法的类目是由一个或几个标签组成的。Tag,译作标记标签。Tag首先是由用户个人定义的,由于用户的个性差异,对于同一信息不同的人可能使用相同或不同的Tags进行描述,当描述这类信息的某一个或几个tag最多时,就被确定为该类信息的自由分类。因此自由分类法的类目既体现了网络用户的个性化特点,同时又代表了所有网络信息用户的共性。

(2) 自由分类法的类目代表文献主题的能力较强  作为自由分类法类目的Tags相当于关键词,但又与关键词不同。关键词是出现在文章题名、文摘或正文中的词语,而Tags是博客对文章的分析和概括,Tag可以是文章中的关键词,也可以是代表文章主题的其他词汇,因此用Tags不但包含了文章的显性知识,同时也包含了文章的隐性知识,更能代表文章的主题。这实际上是利用网络大众对网络信息而进行的标引行为。

(3) 平面非等级的类目结构  自由分类法的类目是非等级的,用户不必从根目录开始经过几级类目再找到所需要的信息。这种显示类目的优点是重要的信息都直接显示在页面上。并且描述最热门、点击率高的信息的Tag在页面上被突出显示。

当然,自由分类法并非完美无缺,在对网络信息标引与检索方面同样存在着一些缺点:

(1) 自由分类法适用的范围有限  自由分类法源于博客为自己发布在网上的文章以及自己的收藏做标签以方便别人发现自己的收藏活动。可以说,自由分类法的类是由博客们创造的。然而却也并非全部博客网都提供为文章做标签并用标签进行检索的功能。即使提供了用标签进行检索的博客网站,检索到的也只是博客空间的信息,甚至只是该博客网的信息。这些信息只是网络信息的一小部分而已。

(2) 作为自由分类的类目Tag缺乏控制  个人使用标签不够规范和统一,加上有许多同义、近义词的存在,使得同类信息被分散开来,例如:“十一”和“国庆节”,“超级女声”和“超女”等等。这种由于tag缺乏控制造成的信息分散也必然影响了信息的检全率。

(3) 类目的平面非等级显示同样会隐藏重要信息不便浏览  自由分类不具有等级结构,并不存在根结点,标识信息的tag或者是字顺显示或者是随机罗列在页面上,尽管重要的、点击频次高的tag通过特殊颜色或字体等被突出显示,仍然难免被浩如烟海的信息所淹没。

(4) 使用Tag检索的检索结果并不十分理想  上文提到,目前只有少数博客网站提供tag检索入口。对于热门tag的检索结果往往成千上万,并且检索结果显示缺乏规律性。检索到的只是博客空间的文章,甚至只是该博客网站的文章。尽管也有博客网站利用时间、文章提供者的信誉排名等来对tag的检索结果进行排序,但此项技术并未推广使用,效果也有待验证。

现有的网络信息分类法

目前的网络信息分类法主要体现为各大网站和大型搜索引擎的分类导航系统,它们通常多是将几种分类法融合使用,这些分类法主要有:主题分类法、学科分类法、分面组配分类法、体系分类法等,所采用的分类体系也是各行其是。目前的网络信息分类法具有列类侧重人们日常生活需要、类名措辞通俗、多角度重复列类并设置镜像类目、体系力求新颖,应变及时的优点。但同时具有分类体系覆盖能力较差,列类五花八门,缺乏严密性和逻辑性,类名措辞随意,类名时尚、一味强调吸引力等的缺点。由此可见,目前的网络信息分类法并不统一,也并不能完全满足网络用户检索的需要。[8]

自由分类法与现有的网络信息分类法的关系

新生自由分类法与现有的网络信息分类法都是为了更好地对网络信息进行管理,然而自由分类法则以不同的姿态登上了这个舞台,同时,也给现有的网络信息分类法带来了新的启示:

首先,自由分类法为现有的网络信息分类带来了一种崭新的理念。现有的各种综合性门户网站或搜索引擎的分类导航系统,是面向整个网络信息、面向整个网络用户的,类目的设定是事先做好的,网络用户只能使用,并不能随意更改。而自由分类法是面向博客的,同时也是面向所有网络用户的(任何人随时可以成为博客),其最大的特点是自由分类是由网络用户建立的,在个性化的基础上体现了所有网络用户的共性。

其次,自由分类法是现有网络信息分类法的有力补充。网络信息和网络信息用户的复杂多样性使得用户索取信息的方法和手段必然是多种多样的。现有的网络信息分类法难以适应灵活多变的网络信息,难以满足网络信息用户的动态需求。自由分类法由网络信息用户创建、自由分类也是由网络信息用户满足自身需要的行为产生。一方面,自由分类法把传统分类无法细分的信息按照用户的需求各入其类,满足了不同用户的需求;另一方面,自由分类是网络用户创建的,使得未来对网络信息的分类可向着由网络信息发布者、管理者和使用者三方共同承担的方向发展。

然而,自由分类法却又因自身的局限性而无法取代现有的网络信息分类法。未来的网络信息分类必然是面向用户、面向应用的[9]。无论是现有的各种网络信息分类法还是新生的自由分类法,甚至是另一个新的“自由分类法”都必须在发展中互相借鉴、取长补短,才能使未来的网络信息分类法达到尽善。

自由分类法应如何改进

自由分类法恰似刚出生的婴儿,还并不成熟。必须在众多方面加以改进和补充才能发挥其更大的作用。对此笔者将提出以下意见:

(1) 确定自己的发展空间  正如产品进入市场要首先选择目标市场一样,自由分类法也应该在网络空间内选定自己发展的空间。自由分类法无法取代现有网络信息分类法作为各大网站和搜索引擎的分类导航系统的地位。但是,自由分类法兴起于博客空间,它对博客发布的信息,以及分散在各大网站BBS、留言板的重要信息的组织管理却较现有的网络信息分类法灵活、适用。因此,应该将自由分类法的适用范围选定在博客空间以及BBS等网络用户发布信息的领域,针对该领域信息的特点就可以充分发挥自由分类法的特长,同时,也有利于自由分类法自身的成长。

(2) 不能完全放任自由  哲学思想认为,绝对的自由是不存在的,自由必然存在于规律的约束中。同样,自由分类法也必然应该受到规律的约束。自由分类是由网络用户的自发标引行为产生,尽管这一定程度上体现了用户对知识分类的共性,但由于不同使用目的对信息的分类会使得相同的信息被划分在不同的自由分类中。同时,利用标签平面非等级标引的信息也都是并列的,信息越多利用标签直接找到信息就越困难。传统分类法特别是文献分类法历史悠久,一定程度上体现了知识分类的科学性。因此,自由分类法应该借鉴传统分类法中已被验证的科学分类法,在对上述选定范围内全部信息划分大类的基础上允许网络用户再进行知识细分。把众多的标签先按人为大类存放,既增强了标引一致性,又降低了平面非等级结构的标签所带来的检索难度。

(3) 对标签Tag进行同义词限定  标签使用的随意性使得同一信息被分散在同义词、近义词的不同标签下。利用后控制词表和系统统计标签的功能,强制用户使用目前较流行的标签。例如,当某类文献达到一定数量时系统统计出“超级女生”的使用频次高于“超女”,当用户再对发布信息用“超女”标引时,系统则要求用户必须使用“超级女生”。对已经用“超女”标引的信息也应用“超级女生”加以替换。

(4) 加强对使用标签检索的结果进行排序整理  使用自然语言语词检索将是网络信息检索的主流。标签由网络信息用户创建,具有自然语言的特点。使用标签进行检索也将是自由分类法的一个重要应用。然而,使用单一标签检索也同样会有成千上万的检索结果。因此应该采取一定的手段和机制对检索结果进行排序,例如信息发布者的信誉度、该类信息被点击的频次、该信息被其他博客所引用的频次等等。

参考文献

1  [2005-9-25]http://blog.timetide.net/archives/2005/01/15/20050115015808.php

2  [2004-9-21]http://atomiq.org/archives/2004/08/folksonomysocialclassification.html

3  [2005-9-20]http://levelflight.info/?p=112

4  [2002-9-20]http://en.wikipedia.org/wiki/Folksonomy

5  http://www.kmcenter.org/printpage.asp?ArticleID=2301

6  [2005-9-28]http://www.360doc.com/showRelevantArt.aspx?ArticleID=12405&ArticleNum=7

7  [2005-9-26]http:www.technorati.com/tags/

8  刘延章.近5年网络信息分类组织研究综述.图书情报工作,2004(1)

9  同8

马    女  蒙族,华东理工大学科技信息研究所04级研究生,研究方向为网络信息组织与检索。向林燕  女  汉族,厦门大学图书馆助理馆员。