公文主题词标引基础知识

来源:百度文库 编辑:神马文学网 时间:2024/04/25 20:02:15
[日期:2006-03-04]  ]
一、什么叫主题词、主题词表和检索语言
。。(一)主题词。主题词也称叙词,是一些以概念为基础的,规范化的,具有组配性能,并可显示词间语义关系的词和词组。
。。主题词分正式主题词和非正式主题词。
。。正式主题词用来标引和检索文献,非正式主题词是查找正式主题词的引导词。
。。(二)主题词表。主题词表也称叙词表,是指由自然语言中优选出来的语义相关、族性相关的名词术语按字顺排列所组成的一种规范化的动态词典。
。。(三)《公文主题词表》。《公文主题词表》是用于公文主题标引与检索的主题词表。它是适应机关办公自动化,尤其是计算机数据处理的需要,为党政机关公文主题标引与检索而编制的一部术语控制工具。
。。(四)检索语言。检索语言是根据人们检索工作的需要而创造的一种人工语言,它是存储、查找文献的共同依据,也叫标引语言。
。。检索语言又分为分类语言和主题语言。
。。分类语言的概念。是指以阿拉伯数字或以拉丁字母和数字混合作为类目标识符号,以基本类目作为词汇,以类目的从属关系表达复杂概念的一类检索语言。
。。主题语言的概念。是以直接论述的事物、对象为依据,以自然语言为基本词汇,以概念之间的逻辑关系作为构词法的一类检索语言。
。。二、为什么要标引公文主题词
。。(一)标引公文主题词有利于建立先进的公文检索体系,辅助领导同志决策。
。。信息量的增加,数据量的增大,单纯的分类检索方法难以满足人们对多主题文件查找的要求。
。。主题检索方法弥补了分类检索方法的不足,检索更自由,查找跨度更大。
。。(二)标引公文主题词是建立机关办公自动化检索系统的前提条件。
。。办公自动化系统通过文件上标注的主题词将文件纳入检索系统。
。。办文人员在办公自动化系统上通过主题词来查找有关主题的文件。
。。(三)标引主题词是实现公文管理现代化的基础。
。。档案工作人员可以根据公文主题词编制档案、文件主题索引或主题目录、专题目录等手工检索工具。
办文人员可直接利用根据公文主题词而建立的档案编目计算机检索系统查找文件。
。。(四)对提高秘书工作人员业务素质有重要作用。
。。三、《公文主题词表》的体系结构
。。《公文主题词表》由范畴表、字顺表、附表三大部分组成。
。。1、范畴表。范畴表又称分类表,它根据公文的主要内容和职能部门的分工划分若干范畴,将字顺表中所列款目词按词义归入有关类目,满足按类查词和按族性检索的要求。
。。范畴表设两级类目,一级类目19个,用一个汉语拼音字母标识。二级类目70个,用两个拼音字母标识。
。。2、字顺表。字顺表由正式主题词与非正式主题词款目(词单元)、款目词的汉语拼音、范畴号和词的参照关系四部分组成,个别词还有注释。。。
。。①汉语拼音。注上汉语拼音主要是便于按音排序和按音查词。
。。②款目词。款目词单元按汉语拼音字顺规定的同音同调同形排列,起排列和查找作用。
。。③范畴号。范畴号即每个款目词所属的分类范畴编号。这是字顺表与范畴表联系的渠道,通过范畴号可以在范畴表中查找与该主题词同属一个类别的相关主题词。
。。④参照关系。参照关系有等同关系、属分关系和相关关系三种。
。。等同关系指两个以上概念相同或相近的主题词之间的关系,也叫用代关系,用“Y”表示正式主题词,用"D"表示非正式主题词;
。。属分关系指概念上具有隶属关系的主题词之间的关系。不同隶属关系主题词分别用 “F”、 “S”、 “.”、“..”和“Z”表示。“F”是下位词指引符,该词之后的主题词为下位词,用“.”、“..”表示,黑点多少表示词的等级,黑点越多表示该词越专指;“S”是上位词指引符;“Z”是族首词指引符,同时带有“*”号。
。。相关关系指主题词之间具有的交叉、对立、矛盾、对应等相互参照的关系,用C表示。
。。3、附表。附表有三个,内容为:组织机构名称表;中国地区名称表;世界各国和地区名称表。附表中的主题词与字顺表中的主题词具有同等效力。
。。四、怎样标引公文主题词
。。(一)公文主题分析。
。。1、审读文件,了解主题。审读文件的重点。
。。2、分析主题类型,确定主题概念。
。。主题类型分为单主题和多主题两种。
。。单主题是指一份公文所研究和论述的只有一个对象或问题。多主题是指一份公文所研究和论述的主题对象不只一个,而是两个或者更多,而且都是并列的独立主题。
。。3、分析主题结构,确定主题因素。主题因素分为主体因素、通用因素、位置因素、时间因素和文献类型因素五部分。
。。主体因素是指公文论述的主题中的关键性概念,它是公文主题的主要成分,其他主题因素都附属于这个主体因素;通用因素是构成主题的一些通用概念,它说明主体因素的动态和趋势。通用概念没有专指性也没有独立检索价值,不宜单独使用;位置因素是表明主体因素所处的位置和范围,文件规定适用的地区、位置和对象。位置因素包括国家名称、地区名称和组织机构名称;时间因素是从时间上对主体因素进行限定,把主题对象放在特定的时间范围之内。时间因素包括年代、时代、朝代、期限等;文献类型因素包括文献种类、公文文种、文件名称编号等。
。。(二)查表选词,转换主题概念。
。。通过查找主题词表进行主题概念转换时,必须采用词表上规范化的主题词。转换主题概念主要有两种形式:一是直接转换。二是间接转换。
。。(三)主题词组配标引。
。。组配,就是用两个或两个以上主题词构成逻辑关系组合以表达一个专指概念的一种方式。它以词间语法关系和逻辑关系为基础,只有相容关系的概念词才可以组配,而且,不是字面上的组配,决定的因素是逻辑关系。组配标引有概念交叉组配、概念限定组配、上位词或下位词组配。应优先考虑交叉组配和限定组配。
。。交叉组配是指两个组配的概念之间具有交叉关系,两个概念的外延有一部分重合。
。。限定组配是以概念的限定为基础,由属概念过渡到种概念的组配。
。。(四)直接上位词标引和靠词标引。
。。上位词标引要求两个概念之间具有属分关系。靠词标引要求两个概念必须是同一范畴、同一属性。无论是直接上位词标引或是靠词标引,都不能越级标引。
。。(五)自由词标引。
。。自由词标引是用未经规范化处理的自然语言表述公文主题概念,并作为表达公文主题概念的检索标识。
。。自由词标引范围:一是某些主题概念虽然可以采用组配标引或上位词标引,但使用频率较高;二是新出现的主题概念,包括新科技、新政策、新理论、新名词术语等;三是人物、时间和年代称号;四是地区、组织机构名称。
。。自由词标引应遵守的规则:一是应认真地查找词表,确实没有合适的专指的主题词,才进行自由词标引。二是可选用其他词表以及权威性参考书、工具书上的词。三是所选的词必须具有较强的检索功能和组配功能,具有实用性,能检索,能组配。四是应尽可能做到词形简单、概念明确。五是在标出自由词的同时相应标出它的上位主题词(或类别词)。六是在自由词后标上“△”符号,并适时将新词登记在主题词表上。选用《词表》以外的地名(组织机构名)、时间、人名、文献名称等专用名词作自由词标引时,不作"△"标记。
。。五、标引工作中一些具体问题
。。(一)主题词的排列。
。。反映公文整体(概述)内容的主题词在前,反映公文部分(分述)内容的主题词在后。
。。在单主题公文中,反映中心内容的主题词在前,反映其他方面的主题词在后;在多主题公文中,反映公文整体(概述)内容的主题词在前,反映公文其他内容的各主题词按出现的先后次序排列。
。。作为自由词标引的地名(组织机构名)、时间、人名等,应置于表现公文内容的主题词后面,置于表现公文形式的主题词前面。同时出现在同一公文中,则按地名(组织机构名)、时间、人名的顺序排列。
。。(二)文种的标引。
。。文种作为正式主题词,标在所有主题词的最末位。在转(印)发类型通知中,被转(印)发的公文的文种可不作为主题词标引。但如果被转(印)发的公文属法规性质,其名称为条例、规定、办法等,则应作为主题词标引。
。。(三)标点符号的标引。
。。公文主题词一般不应出现标点符号。
。。在《公文主题词表》中带有标点符号的正式主题词,应予保留。因为这些标点符号有特殊功能,删去后容易引发歧义。
。。自由词标引时一般不要带标点符号。
浅谈公文主题词的制作
-----------------------------------------------------------------
进入20世纪卯年代,计算机技术在办公领域得到普遍应用,推动了各类机关办公的现代化。为了适应办公现代化的要求,便于计算机检索和公文的管理,公文“主题词”应运而生。国务院办公厅于994年4月23日以国办秘函[1994]157号文件发布了(国务院公文主题词表),废止了1988年12月修订的主题词表,并公布了(国务院公文主题词表)使用说明,初步规范了公文主题词的制作和使用。但由于主题词表的使用从上至下没有实施细则,加之主题词的应用、制作在不断完善、规范的过程之中,故,在各级公文主题词应用和制作中出现很多问题,笔者归纳为五大问题。
一是前题后移。出现这一问题多是因为不了解也没掌握主题词的体系结构,不清楚主题词的作用和意义,只是盲目跟随使用主题词,把标题完整地搬移到后面作主题词的词目而用。如:(关于成立XX市电子游戏专项治理工作领导小组的通知》主题词是这样标引的:“机构设置电子游戏专项治理工作领导小组面通知”,而正确的主
题词应拟制为:“机构 电子游戏面 管理 领导小组通知”。
二是类别不分。这有三种情况:①类别判断不准。如(关于成立XX市生产救灾领导小组的通知》的主题词标注是:“民政 救灾 领导小组通知”,其类别词使用“民政”词目不准,而应使用“机构” 词目。②把区域词当作类别词使用。如某市下发的(关于做好商品流通工作的通知》主题词“贸易 商品 流通 通知”中,就把 “贸易”这一区域词作为类别词使用了,这里正确的主题词标引应是“商业 商品 流通 通知”。③用类属词取 代类别词。如(X x省人民政府关于2001年重点工作的安排意贴 的主题词“政府 重点 工作意见”,这里缺少类别词“综合”,而错误地用类属词目“政府”代之,正确的主题词应是”综合 政府 重点 工作 意见”。
三是词目过多。主题词的标引要求:一份文件,除类别词外,最多不超过5个主题词目,但有的竟达6个以上。
四是生造词目。主题词的词目选用既要能全面、真实地反映一份公文的主要内容,又不能超出正在执行的本级以上的主题词表范围,更不能乱造、生造词目。尽管向下行文时,当在主题词表中找不到合适词目时,虽然可自定能反映公文主题的词目,但一定要在自定词目后记以“凸”符号标明。如:(关于分解落实(政府工作报告)提出的2001年主要任务的通知》的主题词是这样标引的:“政府工作 任务 落实 通知”,其中“任务”、“落
实”这两个词目在(XX省政府主题词表》中找不到,又没在两个词目后加注“凸”符号,就属生造词目。正确的拟定应是:“综合 政府 工作 分工通知”。目前一般的省、市、县都比照(国务院公文主题词表)制定了各自适用的主题词表,制作主题词时应该严格执行,不可生造,否则就会造成新的混乱,失去主题词应有的作用和意义。
五是置放错位。主题词的使用,目的之一是方便公文检索。因此,按照公文规式的有关规定,公文主题词应与版记一起置放在公文末页的背面下方。但有些公文为了印刷方便,往往忽略了这一点,把主题词与版记一起置放在公文末页的正面下方,这是错误的。
那么,怎样才能搞好主题词的制作,促进公文主题词的规范呢?笔者认为应做到三点:
1.了解主题词的体系结构
公文主题词,一般由类别词和类属词组配而成。(国务院公文主题词表)分三个层次列表。第一层是对主题词区域的分类,只作为划定类别词和类属词的区域,便于查找、使用类别词和类属词,不作公文主题词词目使用(即不可用来制作公文主题词),如序号为“01综合、经济”类、序号为‘’05财政、金融” 类等。第二层是类别词,即对主题词的具体分类,如序号为“02工交、能源、邮电”类中的“02A业”、“02B交通”、“02C能源”。
“02D邮电”等;第三层是类属词,如序号为“02工业”类别词中的“冶金”、“地矿’、“汽车”、“化工”等。第二层(类别词)和第三层(类属词)统称为主题词,用于文件主题词的标引。
2.掌握主题词的标引方法
(1)任何一份文件主题词的标引,除类别词外,最多不得超过5个词目。
(2)主题词标引顺序是:先标类别词,再标类属词。
在标类属词时,先标反映文件内容的词,最后标反映文件形式的词。如(国务院关于加强水土保持工作的通知),先标类别词“农业”,再标类属词“水土保持”,最后标上“通知”。
主题词:农业 水土保持通行
类别词 类 属词
(3)一份文件如有两个以上的主题内容,先集中对一个主题内容进行标引,再对第二个主题内容进行标引。如(关于听取全国财政工作会议情况和全国打击走私工作会议准备情况汇报的会议纪要)的主题词制作,先标引反映第一个主题内容的类别词“财政”,再标引类属词“税务’;然后标引反映第二个主题内容的类别词“公安”,再标引类属词“缉私”;最后标引“会议纪要”,制作成的主题词是:“财政税务 公安 缉私 会议纪要”。
(4)根据需要,可将不同类的主题词进行组配标引。
如(国务院关于加强农业生产资料价格以及对其主要品种实行最高限价的通知),先标引类别词“农业”,但在序号为“04A农业”类别中找不到“资料、物价、管理”方面的类后词,这时可使用序号为“01 经济管理”类别中的“资料、物价、管理”类属词进行组配,组配后的主
题词为:’‘农业 资料 物价 管理 通知”。
(5)当词表中找不到准确反映文件主题内容的类属词时,可以在类别词中选择适当的词标引。如在整个主题词表中都找不到能准确反映文件主题内容的类属词时,可自定词目代之,但要在自定的类属词目后边标注“凸” 符号,但是,上行文不得使用自定词目。
3.统一主题词的标引要求
(二)用词要求。上行文,必须严格按照上级公文主题词表及其要求拟制公文主题词,不可使用上级公文主题词表中没有罗列的或者废止的类别、类属词;下行文,可使用自定的公文主题词表中任何类别词、类属词。县级以下无条件的单位,下行文也可不使用主题词。
(2)置放要求。主题词应置放在文件的末页背面抄送栏之上,顶格。“主题词"三字之后用。冒号”,“主题词"三字与类别词、类别词与类属词(词目与词目)之间相间一字空格。如:主题词:农业水土保持 通知
(3)字体要求。“主题词”三字和冒号用三号黑体字;词目(类别词与类属词)用三号小标宋体字。