4.4 主题语言

来源:百度文库 编辑:神马文学网 时间:2024/04/29 14:11:59
主题检索语言是直接以代表文献内容特征和科学概念作为检索标识,并按其外部形式(字顺)组织起来的一种检索语言。主题词语言种类很多,如:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词汇之间的关系。
1、关键词语言
关键词(keyword)语言是自然语言,直接取自文献的题名、文摘等,或者取自全文。除了禁用词(stop-term),如一些冠词、介词、副词或连词外,凡在概念上有意义的词都可用作关键词,它确保检索用词与文献记录中的词汇完全一致。关键词有词表,一般按字顺排序,由关键词作索引标目的就是关键词索引,这些关键词可以进行组配。
2、标题词语言(subject heading)
标题词语言是最早出现的一种按主题来标引和检索文献的传统检索语言,是一种先组式规范化检索语言,采用的标题词是经过规范化的标引文献主题概念的词。在检索前这些标题词已经固定好组配,在标题词表中出现的两级标题词以固定的组合方式组织在词表中,检索时按既定组配执行。其特点是有较好的通用性、直接性和专指性,但灵活性较差,适宜于从事物的主题概念出发而进行的检索。常用的标题词表有:EI所用的《工程标题词表》(Subject Headings for Engineering,SHE)、《美国国会标题词表》(Library of Congress Subject)、《医学主题词表》(Medical Subject Headings)。
3、 单元词语言(uniterm)
单元词是指从文献中抽取出来的,能表达文献主题的最基本、不能再分的单元词语,又称元词。它从文献内容中抽出,经过规范,能表达一个独立的概念,具有灵活的组配功能。单元词是不能再分解的概念单元的规范化词,用来标引文献的主题概念。具有灵活的组配性,但是字面的组配不是概念的组配。例如,对于“公路桥梁”这一概念按单元词的做法是通过“公路”和“桥梁”这两个单元词组配来表达该概念,而标题词则直接选用“公路桥梁”这个词组表达它。
实际上,表达事物概念,除了单一概念外,还有许多的复合概念,由于科技不断发展,单元词语言已不能适应信息检索的要求,因此,它已被更先进的叙词语言取而代之。
4、 叙词语言(descriptor)
为了适应计算机检索的需要,叙词语言于20世纪60年代产生,它是在标题词语言、单元词语言和分类语言的基础上发展起来的一种新型的检索语言。它既吸收了分类语言的优点编制了叙词分类索引和等级索引,又吸收了标题词语言的优点编制了参见著录项目。因此,叙词语言既适用于手工检索,又特别适用于计算机检索。
叙词是指从文献内容中抽出来,能概括表达文献内容基本概念的并经过规范化的名词或术语。其持点是具有组配性,通过概念组配来表达主题。两个或两个以上的叙词组配在一起,形成一个新概念,数量不多的叙词可组成许多概念,便于提高标引专指性和检索的灵活性。 叙词语言是一种规范化的检索语言,在检索时可由多个叙词组成任意合乎逻辑的组配,形成多种检索方式。
常用的叙词表有:INSPEC的词表《INSPEC Thesaurus》、Ei的《EI Thesaurus》及我国编辑出版的《汉语主题词表》等。