论联合国教科文组织信息管理软件WINISIS在中国推广的巨大意义

来源:百度文库 编辑:神马文学网 时间:2024/04/28 07:36:30
【作 者】陈光祚
【机 构】武汉大学图书情报学院 430072
【刊 名】《情报科学》,2003年 第10期
【关键词】联合国教科文组织 信息管理软件 WINISIS
【文 摘】本文介绍了联合国教科文组织推出的WINISIS的发展历史及其对建设书目数据库、事实和数值数据库及全文数据库的先进功能,论述了它在中国免费推广使用的巨大意义。【Abstract】The pape rintroduces the development history of WINISIS and the advanced function of its bibli-ography database, fact and number database, fulltext database, then states the magnificence meaning of ex-panding it free in China.
【正文】1 联合国教科文组织授权武汉大学信息管理学院免费发行WINISIS软件,并提供咨询与培训服务
所谓WINISIS,是指基于Windows的CDS/I-SIS系统,其含义是集成化的计算机文献工作管理系统。它的前身是基于DOS操作系统的CDS/ISIS系统,这是联合国教科文组织遵照增进各国科学文化交流的宗旨而向图书馆和信息服务机构免费提供的信息管理软件。WINISIS有单机版、多用户版、JAVA网络版等。
基于DOS的CDS/ISIS是联合国教科文组织1985年推出的。由于它的功能先进,加之免费发行,因而受到世界各国、特别是发展中国家的欢迎。我国于1986年从联合国教科文组织接受了这个软件,并由中国科技情报研究所和国家建材局对其进行了汉化,使之适合于中文信息资源的处理。同时,对该软件进行了安装时的加密处理,并收取少量的费用,受到我国信息服务机构和图书馆的欢迎。从20世纪80年代下半叶至90年代中期,约有8000多家用户正式采用。至于这个软件后来被有人解密后,自由流传,其用户数量至少达数以万计。应用这个软件建立的数据库也大量出现,有的还以光盘形式发行。但是从90年代中期以后,随着计算机技术和网络技术的迅速发展,基于DOS的CDS/ISIS显得落后了。从1997年开始,联合国教科文组织开始推出基于Windows的CDS/ISIS,并不断更新升级,于2001年推出了当前最新版本的WINISIS1.4版。而在我国,却没有跟上这种时代的变化和发展,这个软件被人们遗忘了。
同在中国的情况相反,WINISIS在世界各国、特别是发展中国家受到了高度的重视和欢迎。这个软件的正式版本是英文版和法文版、西班牙文版,许多国家把该软件进行了语言本地化,已出现了阿拉伯文版、韩文版、俄文版、葡萄牙文版、波兰文版、德文版、意大利文版、越南文版、泰国文版、荷兰文版、捷克文版、波斯文版、土耳其文版、日文版、斯洛伐克文版及尼泊尔文版等版本。许多国家成立了经联合国教科文组织授权的发行中心,开展培训和学术研究活动,成立了WINISIS用户协会,并把用WINISIS建成的数据库在因特网上发布,允许下载,以实现数据库的共享。
中国是世界上最大的发展中国家,图书馆和信息机构的数量很多,而且我国是联合国重要成员,理应是WINISIS软件的最大受益国。可是我国却未推广使用这一软件,也没有对其汉化,使之形成WINISIS的中文版,更没有成立用户协会。中国几乎成为WINISIS在世界上推广活动的空白区。原先在DOS下CDS/ISIS建成的大量数据库被废弃,有的成为“死库”。这一情况,与我国在世界上的身份和地位很不相称。也与我国图书信息机构的潜在需求很不适应。
2001年7月,在武汉大学信息管理学院、信息资源研究中心的支持下,我开始研究WINISIS软件及其在中国推广的可行性。随后带领我的博士生臧国全和阮建海对WINISIS进行汉化,编出了WINISIS的中文版。同时根据国外的材料,编印了中文的《WINISIS用户手册》。并在中文版的WINISIS基础上,建立了“中国图书情报学书目数据库”、“中国名胜诗词全文数据库”、“武汉大学博士论文(附有全文)数据库”、“武汉大学图书情报学院校友名录数据库”等,从而证明WINISIS对中文资料处理的实用性。2002年初,我们向联合国教科文组织申请武汉大学作为WINISIS在中国的发行中心。同年7月8日,联合国教科文组织负责WINISIS的官员D. Storti先生 给我院马费成院长来信,正式授权武汉大学信息管理学院、武汉大学信息资源研究中心为WINISIS在中国的发行人。并于7月22日给我来信,要求将中文的《用户手册》在联合国教科文组织的网站上进行公布。此后,我们信息管理学院和武汉大学信息资源研究中心即决定成立了“联合国教科文组织信息软件推广培训中心”,配备了办公室和工作人员,向全国各种类型的图书馆和信息服务单位提供免费发行和咨询解答及培训服务,也可代为设计数据库。发行工作根据联合国教科文组织拟订的“使用协议”,使用方应填写用户协议书,与武大发行中心签署协议,并参加培训,即可取得中文版的WINISIS软件和中文版的《用户手册》。目前,推广培训工作已逐步展开。
二、WINISIS的推广,将有力地促进我国数据库的建设
数据库化是信息资源开发的中心环节。当前,由于网络信息的大量出现、电子出版的迅速增长、办公自动化所形成的电子文件的增多、以及图书馆和信息服务机构将历史性的信息资源进行回溯数字化的广泛进展,数字化的文献在整个文献中所占比重迅速增加。但是,信息资源的数字化只是迈向数字信息时代的第一步。单篇的数字化文献,尽管它们本身在逻辑上是一个有机整体,但众多文献之间却缺乏组织,因而不能构成有组织的文献系列,因而是无序的。因此,更重要的是要把它们进行整体性的有序化的组织,进行特征标引,实现可检索的性能和检索结果的再组织(如排序,计量)的功能。这就是数据库化的含义。
信息资源的数据库化,即数据库的建立与维护,必须有相应软件的支持。数据库软件的质量直接关系数据库的功能。WINISIS是一个技术先进的数据库建立与维护软件。WINISIS既能支持书目数据库、事实与数值数据库的建立与维护,同时也能支持全文数据库的建立与维护。一个软件能同时支持上述三种数据库,这是一大特色。其它的同类软件很少具有这种功能。
关于支持书目数据库的建设方面:WINISIS以及其前身DOS下的CDS/ISIS,在书目数据库建设方面,有其很大的优势。它原本是面向图书馆建立书目数据库而设计的,因而具有优良的性能。同其它数据库管理系统软件相比,它的字段是可变长的,可设置重复字段与子字段,每个字段可以有不同的索引方式(索引方式达九种之多),具有截词检索、布尔检索、位置检索、字段限定检索、全库顺序扫描检索、后控词表检索等检索功能,有索引词词典(每词之下有文献量)的显示并可据此选词检索,用户可设定和修改检索结果的项目及其次序,对检索结果可以进行多层次的排序,并可对全库或命中记录进行ISO2709标准格式的输出与输入,等等。WINISIS书目数据库的这些性能,是至今为止其他软件所不能比拟的。
在支持事实与数值型数据库的建设方面:WINISIS也有独到之处。联合国教科文组织发布了可与WINISIS配套的IDAMS数据统计与分析软件。为了对WINISIS数值数据进行统计分析,还推出了WINIDIS软件。也就是说,先把WINISIS库内的数据通过WINIDIS转换成IDAMS库内格式的数据。IDAMS软件包能对数据的有效性如数据的代码和数据的一致性进行校验;对数据进行标准的统计分析,如列表、回归分析、聚合分析,还能进行一些更高级的技术,如方差的单向分析,因子分析、交互式的时列分析、多维表的交互式构建等等。因此,WINISIS建立的数值型数据库借助上述两个软件,可以进行包括各种高级手段的统计分析,并进行数据挖掘。
在支持全文数据库的建设方面:WINISIS可用来建设全文数据库。在这里,全文数据库有两种类型:一是将文献全文纳入数据库,可对文献的标引项和文献全文进行基于索引的直接检索,我们建成的《中国名胜诗词全文数据库》就是如此。该库分别设立“诗词名”、“作者”、“作者介绍与写作背景”、“景点”、“诗词全文”、“注释”、“名胜景点介绍”等字段。每一诗词为一记录。在一条记录中,只要全文不超过1.6万字(32K)的文献,均可适应此种类型的建库。其索引与检索方法等同于书目数据库。二是对超过1.6万字的任何长度(例如数万字或十多万字)的文献,除文献的标引项外,可将文献全文进行“外挂”。所谓“外挂”是指文献全文存储在计算机的某一或某几个目录之下。检索时,用户对标引项进行检索,然后需察看全文时,对命中文献进行点击,即可展示全文,并可打印。这种作法,与清华大学的“中国期刊网”的办法一样。但比清华的作法优越的是,全文文献并不要求一致的格式,(清华要求方正排版格式),而是各种格式均可。例如TXT、Word、HTML、jpg、ps、甚至pdf的压缩格式,只要在计算机中装有各种相应的浏览器软件,就能“原汁、原味”地按原来的格式显示打印。显示打印结束后,又回到WINISIS系统,可继续进行检索。我们在WINISIS系统中,试建了“武汉大学学位论文全文数据库”系统。每篇学位论文一般为近十万字。有的达十多万字,并且其中包括图片、表格,文献格式除Word格式外,还有特殊的文献格式,如数学论文的PS格式等等,它们均可纳入系统。这种特性,特别适于网上下载的各种格式的文献进行统一建立全文数据库的要求。
WINISIS可建立各种规模、包括特大型的数据库。WINISIS软件可能建立的数据库数目不限。每个库容量最多可达3000万条记录,每个记录可设置多至1000个字段(描述项)。这种巨大的容量,可以适应数据库不断增长的要求。当前我国书目数据库和全文数据库的容量最大的一般是百万条或数百万条,可以说,WINISIS的3000万条的容量对于特大型库的建设是足够的。
三、WINISIS可用来建立维护多媒体信息管理系统
多媒体信息管理系统可以集文字、图形(静态的与动态的)、声音的信息于一体,进行统一的存储、检索和展示、多媒体信息管理系统是数据库当前的发展方向。
WINISIS可以将文字、图形、声音等文献,通过其标引项(指述项)统一建设,而将文献本身进行“外挂”。必要时通过命中记录的点击,而展示文章、图片、动画、音乐、VCD、DVD等文献的内容。
我们在WINISIS之下试建了一个多媒体数据库,收录的文献包括:从网上下载的网页、文章(TXT或Word格式)、名人书画、动画、音乐、录像等。这些“原始”文献都处于“外挂”的状态,可随时调用展示。而在库内,每条记录设置了数十个(最多可达1000个)的字段(扫描项)。如名称、作者、时代、文献类型、关键词、分类号等等。关键词、分类号可以标引数十个乃至百余个,作为“重复字段”字处理,其中每一个都可作为检索词。因此一条记录的描述项和检索点可达数百至一千个以上之多。因而可以充分地描述和反映各种媒体文献的各种特征,用户通过所需特征的布尔组合、可准确地检索所需的信息对象。
当然,多媒体信息管理系统的更深入的作法是对图片、声音等本身进行信息处理、存储和相似性的检索,而不一定借助外部的描述。但这种系统的实现较为困难,而且目前正在研究试验的一般是单项的系统,如指纹系统、声音识别系统等。WINISIS所可能建立的多媒体信息管理系统当然不是这样的系统。但从目前的情况来看,WINISIS的“描述项+外挂全文”的模式不失为是一种实用的模式。
四、WINISIS系统可用来建立虚拟图书馆
WINISIS的另一个优越功能是可按记录中的网址自动连结上网。这种功能适合于建立虚拟图书馆系统。
虚拟图书馆是网上信息资源的一种组织形式。它是从特定的目标出发,对网上符合特定专题的有关网站、网页进行普查,并进行可链接性核实鉴定,然后进行精选,写出有关摘要注释,给以分类排列而成。每一个网站或每一个网页,其后都必须注明网址,以便用户按此网址上网搜集信息。虚拟图书馆不收录用户所需的最终信息,而是指引人们获取最终信息的渠道,类似于推荐书目,给人们以读书治学的门径。它能为用户节约大量的时间而获得信息密度最高的情报源。虚拟图书馆的编制,往往是在各个门类的专家负责指导下进行的,因而是因特网上学术性较高的工具。在网上信息迅速澎胀、搜索引擎的检准率日越难于提高的今天,虚拟图书馆的可贵之处尤是重要。
但是网上公布的数以千万计的虚拟图书馆,一般不能自动地联网,而需用户记下网址,运用浏览器并输入网址才能进入所需的网站网页。这种“两步走”的方式给用户带来不便。而WINISIS下建立的虚拟图书馆,不仅能从网站名、关键词、分类号、文种、国别、内码(如GB,Big5)等多种角度及其布尔组合进行准确检索,而且在检索结果的记录中,点击网址即可自动上网。上网结束后,仍处于WINISIS的系统中,可继续进行检索上网。这给用户带来检索上网“一步走”的好处。我们用WINISIS软件试建了“图书情报学虚拟图书馆”,收录有关各类图书馆、信息服务机构、搜索引擎、图书馆学情报学有关出版社、杂志、研究机构、学校院系及主要研究人员等等的条目3000余条。事实证明,这种虚拟图书馆的建立与维护是可行的。
五、WINISIS可用于个人数字图书馆的建设
尽管WINISIS发行的主要对象是图书馆和信息服务机构,但是从事研究、教学工作的个人或科研项目组也可使用该软件建立个数字图书馆。这些人员往往从网上下载有关的文章、图片、歌曲等等文献,供自己研究学习之用。同时也有不少自己的文稿、书信等电子文献。它们往往被保存在一个或多个文件夹中。当下载资料数量增多时,就出现了如何科学组织、准确检索、合理使用的问题。采用WINISIS,就能使众多的资料多而不乱,一索即得,并展示文献全文,大大提高使用效率。这就是个人数字图书馆。
个人数字图书馆是数字图书馆的一种类型。数字图书馆的建设,目前在国内正在升温。但大型数字图书馆的建设,包括信息资源的数字化、文献格式规范化、数字图书馆软件编制和选择等等,是一个耗费大量财力和时间的系统工程。作为一个大国,我国建设大型的、规范化的、具有长远保存价值的、使用复盖面宽广的数字图书馆是必要的。但是这并不意味着个人数字图书馆就没有必要。个人数字图书馆就是个人把下载的网上资料和其它资料通过一定的软件加以标引和全文入库或外挂,使其形成具有结构化的信息集合和具有检索功能的系统。网上文献下载一般是不需付费的,而WINISIS软件也是免费的,因此人们建立自己的个人数字图书馆不会增加多大的负担。数字图书馆的功能主要是全文数据库的形成,同时还包括用户合法性的验证、使用时间和流量的控制、财务会计管理、网络安全的保证等等。用WINISIS建立的个人数字图书馆只是形成可使用的全文数据库,功能单一,可谓是简易型的数字图书馆。但它最贴近个人的信息需求,具有个性化的特点,建设容易,无疑将会得到广大从事研究学习的人员的欢迎。
六、免费的WINISIS推广是对西部地区、老少边穷地区、中小型图书馆的“雪中送炭”,而大型图书馆则可用来建设专题数据库。
我国正在开发西部地区,这其中包含了信息资源和信息服务的开发。西部地区和老少边穷地区由于经济落后,往往无力购买价格昂贵的商业性软件。联合国教科文组织之可以推出免费的WINISIS,其意也是对经济相对落后的发展中国家的援助。因此,中文版的WINISIS,我们将首先向西部地区、老少边穷地区推广发行,为这些地区的图书馆和信息服务机构作一点贡献。
条件较好图书馆和信息服务机构,有的已开始进行数据库和数字图书馆的建设,但仍可以运用WINISIS建立专题数据库,以光盘等形式发行。这是因为WINISIS单机版程序量不大,只有三十多兆。一张容量650 兆的光盘,除WINISIS程序外,仍可有600兆左右的数据可供存储。WINISIS无版权纠纷,可以把程序与数据一起放在同一光盘上发行。而其它商业软件由于版权限制是决不能做到这点的。
从节约软件费的角度来说,WINISIS将为我国创造巨大的经济价值。
七、使用WINISIS软件,能得到可持续发展的保证并与国际数据库建设接轨
联合国教科文组织设有专家组不断修改维护WINISIS程序,不断推出新版本。新版本的获取也是免费的。今后我们也将对新版本的WINISIS进行汉化,并修改中文版的《用户手册》,以保证该软件的推广使用做到与日俱进,获得可持续发展的保证。
WINISIS采用ISO2709的国际标准数据交换格式。库内的数据能与其它系统通过国际标准格式进行交换,从而能与世界数据库建设的主流接轨。这有利于我国与其它国家合作建库。
八、WINISIS的局限性
WINISIS是信息存储与检索软件,而不是图书馆自动化软件,也就是说,它的主要功能是建设数据库,而不是以图书馆的采购、分类、编目、流通、期刊管理等工作环节为目标而编写的图书馆自动化软件。它不能代替图书馆自动化软件。当然,在图书馆自动化软件(如ILAS)下建立数据库可与WINISIS数据库进行交换数据。这就是从馆藏目录中抽取有关记录建立WINISIS专题数据库的根据。
[参考文献]
①陈光祚,臧国全,阮建海:一个值得重视和推广的国际性信息存储与检索软件——WINISIS。大学图书馆学报,2002年第5期
②陈光祚,臧国全,阮建海编译:C—WINISIS用户手册,武汉大学信息资源研究中心,2001年12月
③吴广印:中西文大型情报检索系统CDS/ISIS的开发,情报学报,1991年第6期