中国与美国数字图书馆研究比较

来源:百度文库 编辑:神马文学网 时间:2024/04/19 04:10:50
计算机技术、网络通讯技术的迅猛发展为图书馆迎来了一次数字化革命,数字图书馆迅速成为中外图书馆界乃至社会各界关注和研究的热点问题。美国因是数字图书馆研究起步最早、进展最快、成果最多的国家而备受世人瞩目。本文主要就中美数字图书馆研究的异同做一比较和评述。 1 关于“数字图书馆”概念的研究 对“数字图书馆”的认识,中美都经历了一个发展的过程。“数字图书馆”概念的提出最早源起于20世纪80年代末、90年代初的西方发达国家,称为Digital Library。以Internet为背景,并随着美国数字图书馆创始工程DLI的提出于1993年得到确认并迅速风靡世界。 1.1 “数字图书馆”提出的背景 “计算机技术与图书馆的结合”的设想其实早在计算机诞生初期,人们就在设想将传统图书馆改造成计算机化的“图书馆”。在不同时期人类给自己的设想赋予了许多名字,如“未来图书馆”、“无纸图书馆”、“电子图书馆”、“虚拟图书馆”、“数字化图书馆”等。“数字图书馆”是人类近50年来对图书馆的美好设想,在计算机和网络通讯技术依托下的发展定位。 由于Internet的开通,网上信息资源日益膨胀、堆积,网络用户一方面为资源的丰富而惊喜,另一方面又为检索的不便而抱怨。这其中除了技术原因外,就是网上信息资源缺乏有效的组织和管理,无序信息泛滥,严重影响了用户利用信息资源的效率。显然,传统信息资源的组织和管理方法已不能适应网络信息资源管理的要求,迫切需要一种全新的组织管理信息资源的新模式。因特网是全球信息服务网络,上网的信息资源应按这种模式组织管理,于是“数字图书馆”应运而生,也即在这种背景下提出“数字图书馆”。数字图书馆就是21世纪初下一代Internet上信息资源管理模式。 1.2 对“数字图书馆”概念的认识过程 “数字图书馆”概念的提出,就像其它科学技术引入图书馆领域一样,最初也经历了一个盲目阶段。至今中外对数字图书馆还没有一个明确、完整的定义,即使是身处数字图书馆研究前沿的美国,数字图书馆的定义也是随着数字图书馆研究和建设的深入而对其不断完善的。 90年代初,美国国家科学基金会(NSF)、美国国防部研究项目机构(DARPA)、国家航空与太空总署(NASA)在分别拨款给一些计算机与通讯技术方面的基础研究项目时,他们就认为数字图书馆是一个发展前景广阔、潜力巨大的新领域。但研究哪些课题项目当时并不是很清晰。经过一些非正式小组的不懈努力,屡次就项目所达到的目标和其他可替代的研究课题技术问题召开专题讨论会,并最终形成报告将数字图书馆研究创始工程的方向和内容定位于“极大提高通过网络收集、存储、组织和获取以数字形式存在的信息”上。1993年9月美国数字图书馆创始工程DLI正式公布,向全美公开招标征求项目和参与者。起初按照基础研究创始工程设计,中标项目属高风险研究,主要用于试验和演示新技术。1994年9月DLI启动后,才发现许多问题没有考虑进来,这是一个牵涉面广、复杂的项目。联邦部门很快意识到并出资赞助召开各种专题讨论会,正是这些座谈会使数字图书馆的定义逐渐得到补充和完善。 美国数字图书馆创始工程一期工程(DLI-1,1994.9-1998.8),对数字图书馆的定义侧重于数字图书馆技术,更多强调技术和具体作用。美国官方和研究机构当时对数字图书馆的认识在1995年召开的联邦信息基础结构与应用项目(IITA)数字图书馆专题研讨会上有所体现。会上提出:“数字图书馆是向用户群体提供便于查找利用庞大的、经过组织的信息和知识存储库的手段的系统。这个信息组织的特点是没有预知的关于信息使用的详情。用户进入这个存储库,重新组织和使用之。这种能力由于数字技术的能力而大大增强。”这种看法后来又有了扩充和完善。1997年3月由NSF赞助召开了关于“分散式知识工作环境”专题讨论会[http://www.si.umich.edu/SantaFe/],会议报告将数字图书馆界定为“并不仅仅是一个有着信息管理工具的数字收藏的等价词。数字图书馆更是一个环境,它将收藏、服务和人带到一起以支持数据、信息乃至知识的全部流程,包括从创造、传播、使用到保存的全过程。”美国数字图书馆概念的提出,实际上经历了如下三个阶段:(1)数字化资源库的开发阶段。该阶段考察的重点是图书馆文献资源、科技成果的数字化转换(字符编码文本、电子化的位图映像等)、存贮、标引与检索、显示和输出等方面的问题。(2)数字图书馆技术研究阶段。该阶段的研究重点是数字化图书馆的信息存取、服务提供技术的解决方案。主要包括:数字图书馆数据对象的内存结构、命名规定;用户界面与人机交互;数字化素材的组织及标识;数字网络传输技术和协议制定等研究内容。配合这一阶段目标的实现,实施了“计算机科学技术报告计划”(CRTR PROJECT)。该研究计划由美国国防部高级计划局(ARPA)资助,经两年时间研究于1995年初制定数字图书馆结构框架。对其中提出的数字图书馆基本结构块的命名、标识、组合、数字对象库存、标识系统、智能检索、人机交互界面等多项技术方案基本达成共识。并通过美国数字图书馆研究中心(CENTER FOR THE STUDY OF DIGITAL LIBRARY)的研究项目,对空间超文本系统、人机交互技术、超媒体操作系统(HOSS)服务以及SGML、VRML技术进行了研发,并取得良好进展。(3)数字化图书馆的综合研究阶段。以美国数字图书馆启动计划(DLI)为标志,昭示着数字图书馆的研究已进入综合研究的时期。DLI-1重点集中在技术力量强的6大项目上,主要是计算机和信息科学。DLI-2放在技术研究课题上的注意力缩小,但学科范围有所扩大。强调以人为中心,涉及数字图书馆的经济、社会、法律和政策框架,制定信息共享格式与国际标准,数字图书馆网站的可靠性和稳定性,经济因素和商品化等研究内容。 如果说美国是从技术角度来界定数字图书馆,那么我国对数字图书馆的认识,则是从信息资源数字化开始的。认为“数字图书馆是传统图书馆的扩展”,“数字图书馆是用数字技术收集、存储和组织信息,并通过计算机网络查询和检索信息的一种现代化的信息系统”,“数字图书馆是一个数字化的信息系统,它将分散于不同载体、不同地理位置的信息资源以数字化方式贮存,网络化方式相互联接,提供即时利用,实现资源共享”。北京图书馆孙承鉴认为“数字图书馆是被下一代超高速Internet选定的管理信息资源的模式。”“数字图书馆实际上是一个数字信息资源库的概念,这个库有声音、有文字、有图像……。”其特点是:(1)是个多媒体的数字信息资源库;(2)这个库存是分布的,通过计算机网络可以跨库查询。它是一个图书馆群体的概念,是由一个地域或一个国家的众多图书馆或信息资源单位组成的联合体;(3)信息组织必须按格式标准,即数据库中的信息资源是有序的,按统一标准来组织;(4)在网上运行,且用宽带高速网实现;(5)以大量高新技术为依托,比如数据库技术、数据挖掘技术、数据推进技术,是多种高新技术的集成;(6)为读者提供方便、快捷、全面的服务。实现数字图书馆后,网上查询不必一个站点一个站点地查询,对读者而言,只要提供某个检索点,计算机就会提供所需分布在网上各馆的相关资料。 在对数字图书馆的认识上,中美存在差异,其原因是:(1)数字图书馆研究起步条件不同。美国在数字图书馆启动工程启动前,已基本完成信息资源的数字化存储,信息基础设施完善。我国数字图书馆研究起步晚,特别是1996年IFLA第62届大会后,电子图书馆在我国才引起普遍重视。面对蓬勃发展的计算机和网络通讯技术,要建设数字图书馆,人们首先想到如何将信息资源数字化,完成数字图书馆的初级工作。因此,对数字图书馆的描述难免有不同侧重。(2)对数字图书馆的理解有简单化思维倾向。在我国有相当一部分图书馆工作者将“图书馆数字化”与“数字图书馆”混为一谈,简单地认为图书馆资源数字化了,上网了,就是数字图书馆了。这是我们对数字图书馆认识上的一个误区。数字图书馆是一项涉及社会许多领域的整体性工程,不是由哪一个部门能够独立完成的。馆藏资源的数字化仅仅是数字图书馆工程的一个基础环节而已,况且对图书馆来说,也不是要把所有馆藏都数字化。数字图书馆是一个群体概念,不是哪一个图书馆的代名词。 美国已于1998年8月完成了数字图书馆创始工程的一期工程,已经启动二期工程。对他们来说,处理的问题不再是数据资源数字化、音频视频信息的转换、存贮和检索以及多媒体信息技术扩展深化中的难题。一期研究成果部分已上网应用,对数字图书馆的认识也随着研究的推进而明晰。中美对数字图书馆概念的理解都经历了一个认识的过程,这个过程还在不断完善中延续。数字图书馆的内涵会随着数字图书馆的研究而动态变化。我们没有必要非把数字图书馆定位于某个框架上,非要争论出一个被大家都接受的定义来。适当的讨论是必要的,因为它有助于我们确定数字图书馆整体框架、技术内容和范围等。但对读者来说,实用的数字图书馆才是大家企盼的最终产品。 2 进展与比较 中美在数字图书馆研究进展上,走出了各自的发展道路。由于中美存在阶段性的差异,美国已率先完成一期工程,进入二期建设。考察美国数字图书馆研究的发展,有一些成功的经验值得我们研究和借鉴。 2.1 示范工程先行,进展有序,基础稳固 美国在实施数字图书馆启动工程前,已经做了比较充分的前期准备。考虑到数字图书馆是使用几乎所有现代高新技术的系统工程,不能盲目铺开,一哄而上。他们的做法是先搞示范工程。1988年美国提出“水星”电子图书馆计划(Electronic Library:The Mercury Project),首先选择两所优秀大学——卡内基梅隆大学和密执根大学做试验,它们后来成为数字图书馆创始工程一期工程的重要实验基地。在DLI-1工程中造就了一批实力强大的试验基地,如卡内基梅隆大学的Informedia数字录像和演说资料试验基地、加州大学伯克利分校的环境数字图书馆实验基地等。因为在DLI中要求投标单位条件之一是自建一个实验基地。这一措施促进了一期工程顺利完成,也为二期工程奠定了良好的基础。美国的这一做法值得借鉴。 为实施我国数字图书馆工程做好准备,中国国家图书馆于1995年安排专人负责跟踪国际数字图书馆研究进展情况,并将有关技术引入相关研究项目中,积累了第一手经验和对数字图书馆总体框架的认识。国家图书馆于1998年底着手于中国数字图书馆前期实验研究,用3个多月时间,完成了试验环境及演示系统研究开发。取得了多媒体数字资源的创意、设计和加工,元数据抽取和元数据的生成,对象数据库建设,调度系统的选用以及实现多库的跨库检索和用户界面等方面的初步实践经验。还开发了相关软件,包括多媒体对象在内的动态页面生成、支持SGML和分布式数据库检索、查询及元数据和对象数据连接的接口软件等。该系统包括“千家诗”、中国古代建筑、北京故宫、海洋世界和宇宙的结构5个多媒体资源库,信息量约5GB,整个系统在国家图书馆的千兆位馆域网上运行稳定。另外国家图书馆还要建一个5万平方米的数字图书馆。北京大学、清华大学、上海交大图书馆等单位在数字图书馆研究上也取得了一定成绩,为我国数字图书馆的启动积累了良好的经验。 2.2 政府宏观调控、分工协作、进行团队运作 早在1994年8月,美国数字图书馆启动工程公布实施时,我国学者就注意到这项由美国自然科学基金会、美国国防部高级研究中心计划部以及国家航天航空事务委员会三家联合资助2400万美元、为期4年的规模巨大的项目。从项目的制定到实施一直由政府部门宏观调控,并明确将启动计划定位在: (1)大型协作实验性项目。 (2)(2)项目研究重点在三方面,即①数字信息收集、存贮和组织的技术和手段;②研发通过互联网进行信息检索的技术;③优化数字信息处理过程的用户界面。 (3)研究目的是最大限度地利用已有的信息技术成果,促进研究向新工具和新技术方向发展,最大程度地满足用户的信息需求。 (4)计划的核心原则强调研究中的协作关系:计划负责人制定的共同战略构想就是强调研制中的研究者、开发商和用户之间的协作伙伴关系,并将这种关系视为成败的关键。在核心原则指导下确立项目的研究方法:采用分工合作的研究方式。特别强调建立参加项目各方的协作伙伴关系,因为他们认为这种关系有利于新知识的创立、灵感的启发和技术转让速度的提高。 启动计划由6大子项目组成,分工明确,分别由有实力的大学主持承担。 具体分工是: (1)密执根大学主持“密执根大学数字图书馆研究计划”,主要为正持续发展中的多媒体数字图书馆建立一个便于使用、操作的系统测试平台(TESTBED)。(2)依利诺大学主持“为大学工程部建立交互式空间的数字图书馆基础设施计划”,以大学图书馆信息中心工程部为基础,项目技术研制集中测试系统的社会化评价、自然检索技术和未来信息系统模型设计。(3)加州大学柏克莱分校主持“环境电子文库,一个可测定智能的分布式电子图书馆模型”,主要任务是建立一个环境方面的数字图书馆模型。(4)Carnegie Mellon大学和WQED/PITTSBURGH联合主持“信息媒体:可视数字图书馆的图像语言合成技术”,着重可视数字图书馆系统联机互动式信息媒体研究。(5)斯坦福大学主持“斯坦福合成数字图书馆计划”,以信息的共享和传播模式、用户界面及信息检索服务为研究重点。(6)亚历山大计划,建立具有图像和空间参考源全面服务的分布式图书馆,研究重点在于信息的空间索引,最终建立具有为不同的大型地图、图像和图片资料提供入口以及提供配套的新型电子图书馆服务功能的数字图书馆。 这种分工形成了一个交互式网状分布结构。在研制内容上分学科和研制技术上的分侧重点,在一定程度上保证了研究的全面和深入。启动计划的6大子项目分别由高校牵头,联合各级院校、图书馆、学术团体、公司以及政府各部门形成数字图书馆的战略同盟。在知识、技术、资源上互相支持,发挥整体优势,充分体现了他们的协作原则。另外,由美国国会图书馆等15个图书馆与美国国家档案与记录管理局组成的“美国国家数字图书馆联盟”也发挥着重要作用。它致力于开发反映美国历史与科技文化成就的数字式资源库及分布式数字图书馆系统,承担的课题“美国国家数字图书馆项目”已于1999年完成。实践证明,实行团队运作,有利于研究的进展,有利于人财物等资源优势的发挥。为了加强国家政府的宏观调控,美国政府“国家计算、信息、通信指导办公室(NCO for CIC)自1994年以来,每年发表一本“蓝皮书”。这是一种正式的重要研究与发展的官方报告。其中对数字图书馆越来越重视,1998年被列为CIC(计算、信息、通信)的6个研究发展重点项目的第一位,显示了政府对数字图书馆研究的重视程度。 美国数字图书馆研究主要由高校牵头,依托高校技术上的优势,在发展方式上走的是一条技术主导型模式。我国数字图书馆研究主要由国家图书馆牵头,走的是一条资源主导型发展模式。主要表现为:自1995年开始,国家图书馆跟踪国际数字图书馆的发展动态。(1)1996年初,国家图书馆在文化部申请立项“数字图书馆实验项目”。1997年国家计委批准该项目,称为中国试验型数字式图书馆,由北京图书馆、上海图书馆、南京图书馆、辽宁图书馆、广东中山图书馆、深圳图书馆6个单位联合立项,北图任组长单位,拟建一个多馆协作、互为补充、联合一致,实现由多类型、分布式、规范化资源库组织的试验型数字图书馆。6馆联合建设文化部旅游资源库、名人资源库和法律资源库等,为我国建设数字图书馆提交一份初步成形的、实用的实现技术。(2)1996年国家"863"攻关项目“基于特征的多媒体信息检索系统的研究开发”,由中科院计算机技术研究所与国家图书馆合作完成,已通过技术鉴定。(3)1997年文化部立项“标准通用置标语言(SGML)的图书馆应用”,由国家图书馆现代文津信息技术研究中心与北京大学计算机研究所合作开发,已于1998年2月在国家图书馆使用。(4)1998年国家"863"攻关项目“知识网络—数字图书馆系统工程”,由国家图书馆和中科院计算机研究所合作完成。实现一类数字图书馆体系结构的设计与开发,初步建立一个中国试验型数字图书馆系统。(5)1999年6月,“中关村科技园区数字图书馆群软课题研究”由国家图书馆牵头,联合北京市有关单位和北大、清华、中科院等单位合作开发。结合地区特点,探讨建设数字图书馆群的方法和路线,最终提出一份切实可行的实施方案。已完成“中关村科技园区数字图书馆群建设整体架构报告”。(6)“教育部的数字化图书馆攻关计划”,由清华、北大、上海交大等强校联合承担。主要对数字化图书馆的结构和检索机制及应用标准和规范、图文信息联合导读学习系统等问题攻关。除此,还有“辽宁省图书馆数字化图书馆项目”、“中国数字图书馆发展战略研究”(863项目)等,以及个人承担的数字图书馆软课题研究项目,已经取得了不少的研究成果,为中国数字图书馆工程奠定了良好基础。但是,与美国相比,我国还没有一个全国性的数字图书馆宏观规划。各单位或个人数字图书馆研发和建设大多各自为政、相对分散,存在重复建设和投资问题。表现为研究项目之间交叉,经费投入不集中,缺乏行业、部门之间的合作等。必须加强宏观管理与协调,统一规划,统一布局,有重点、有层次、分阶段、有序地推进数字图书馆工程。数字图书馆是一个牵涉到社会各方面的复杂的整体工程,必须调动相关行业的优势力量,集中资金,重点投入。因此必须通过政府部门或成立全国性的专门机构进行统一领导和协凋,强化社会各行业的协作意识,让全社会共同关注和参与数字图书馆的建设。 为使中国数字图书馆工程顺利进行,避免重复建设,加强宏观调控力度,我国已采取相应措施:(1)文化部经与各有关部委、单位协商,组建“中国数字图书馆工程建设联席会议”,其成员由21家部委、单位组成,文化部是“联席会议”的召集单位。主要职能是宏观规划工程的建设方向,协调工程的资源建设和标准规范,协调国产高新技术和高性能设备在工程建设中的推广和使用,协调工程建设中的知识产权等问题。“联席会议”的办公室设在国家图书馆,对外称“中国数字图书馆工程建设管理中心”。(2)组建“中国数字图书馆工程建设专家顾问委员会”。职责是:协助“联席会议”为工程所涉及的资源建设、技术路线、标准规范和知识产权等方面的问题提供咨询和指导。(3)组建“中国数字图书馆有限责任公司”。这是遵循国务院领导同志关于建设数字图书馆要有新思路的指示精神,为中国数字图书馆工程建设成立的经济实体。该公司采用股份制操作,由国家图书馆及所属公司共同控股,实行企业化管理。以国家图书馆为依托,开展文献资源的数字化加工、数字资源深层次开发、数字图书馆网上信息服务、技术研发以及网上广告等工作,积累资金。 2000年4月5日,“中国数字图书馆工程建设联席会议”第一次会议在国家图书馆召开,标志着中国数字图书馆工程开始启动。工程计划10年完成,国家投资11亿人民币。中国数字图书馆工程相关事宜已明确:(1)整体目标:在互联网上形成超大规模、高质量的中文数字资源群,并通过国家骨干通信网向全国及全球提供服务;总体技术与国际主流技术接轨。(2)工程指导思想“统筹规划,需求牵引,科技创新,流动发展”。(3)工程建设原则:公益性为主,以资源建设为核心、统一标准规范、避免重复建设,实现工程建设民族化,保证工程顺利进行。(4)工程任务:至2005年,建设完成10余个、总容量不低于20TB的中文数字资源库;联合引入若干国内需要的国外专题数据库;实现全国大部分地区图书馆文献资源的联机采编及馆际互借;完成开发具有中国特色的数字图书馆应用系统等。(5)工程特点:超大规模、开放、分布式的数字信息资源网络体系结构,具有提供复杂信息加工存取功能;海量信息的生成与存贮;以中文信息资源为主,也包括外文和少数民族语言的信息资源;网络系统具有兼容性等,充分体现虚拟网络特点。(6)工程技术路线:与国际同类主流技术接轨,采用标准通用置标语言/可扩展的置标语言(SGML/XML),统一资源名称(URN),公共对象请求代理体系结构(CORBA)等;严格遵循电子信息处理与交换的相关国际标准及工业标准;统一的总体框架与灵活的子项目实施相结合;采用适用于网络环境下的分布式面向对象的软件技术;自研技术与引进技术结合。 虽然我国在数字图书馆研究和建设上已经起步并取得了一定进展,但是与发达的美国相比,我们面临的困难更多,也更加艰巨。(1)在信息基础设施方面。我国的整体水平低,各地区、各系统信息基础设施水平参差不齐。特别是一些中小型馆、偏远地区馆还处在图书馆自动化初期阶段,停留于单项工作的自动化或局域网水平。在少数能提供网络化信息存取的馆内,其远程存取也只有书目、文摘等二次信息。在美国,信息基础设施完善,不仅实现了全文信息远程存取,还提供文本、声、图等多媒体网上存取。在系统机构方面,我国一般采用host-based集中管理系统,而美国普遍采用的是分布式Clients/Server管理模式,在运行效率、扩展性、安全性和开放性方面都优于我国。在系统平台上,美国的一个软件通常可以在多个硬件平台上运行,相比之下我国的软件缺乏开放性和互联性。另外在用户界面、软硬件配置等方面也存在一定差距。(2)在检索技术方面。在美国文本的全文存储与检索技术早已是应用最广、相对成熟的关键技术之一。IBM公司在数字图书馆项目中开发了图像内容查询技术,它能根据图像的颜色、灰度、纹理和位置检索图像数据库。我国全文检索技术则刚刚起步。(3)数据库建设方面。在数据库数量、容量和质量上,美国都远远领先于我国。除清华、北大、上海交大等极少数单位的数据库质量较好外,其他大多数单位数据库质量普遍不高。体现本馆收藏特色的数据库不多。在建库时,追求近期效应,做表面文章,不严格遵守书目数据的机读格式,随意删减和改造著录项目。建库缺乏整体性考虑,重复录入数据等。这样做无疑为今后的转库和共享埋下隐患。(4)整体协调方面。应该切实重视、加强和落实。在图书馆计算机的软硬件配置、数据库建设、数字图书馆工程研发等方面必须有整体的规划,统一布控。否则,人财物资源的浪费将是非常严重的,还会直接影响我国数字图书馆发展的进程。(5)在协作方面。我们最欠缺的是协作意识。数字图书馆是需要社会各方面共同协作才能完成的复杂工程,不是图书馆界,更不是哪一个馆能完成的事。因此必须解决参与建设的各方之间的协作问题。美国在数字图书馆启动一期工程中就特别强调研究者、开发商和用户之间的协作伙伴关系,并将这种关系视为项目成败的关键。与其相比,我国还应在总体规划、分工协作以及开发特色馆藏等方面进一步明确并做出切实的努力。 【参考文献】 1 孙承鉴,刘明.中国数字图书馆建设的起步与发展.国家图书馆学刊,2000,(3) 2 俞菲,徐敏刚.美国数字图书馆启动计划概述.情报科学,2000,(2) 3 盛小平,禹蒲阳.国内电子图书馆发展的比较研究.图书馆理论与实践,2000,(2) 4 曾蕾等.数字图书馆:路在何方?.情报学报,2000,(1) 5 孟凡强等.美国数字图书馆首倡计划第二阶段研究述评.图书馆杂志,2000,(5) 6 周和平.统筹规划 协调组织 携手共建中国数字图书馆工程.国家图书馆学刊,2000,(3) 7 孙承鉴.走向数字图书馆.计算机世界,1998.12.7 8 李东平,杨玉祥.我国数字图书馆研究论文综述.图书馆学刊,1999,(4) 9 孙辨华.务实看待数字图书馆.计算机世界,1999.5.31 10 徐云.略论图书馆自动化建设中的误区.国家图书馆学刊,2000,(1) 11 杨沛超,魏来.论中国数字图书馆发展战略.情报资料工作,2001,(3)