Thinkpad@图书馆 ? 北京大学图书馆利用开源软件搭建下一代图书馆界面

来源:百度文库 编辑:神马文学网 时间:2024/04/29 01:53:23

下一代图书馆界面是图书馆服务发展的必然趋势。在商业产品刚刚进入国内市场的时候,不可避免会遭遇高价垄断和本地化不成熟的问题。在商业产品高成本投入低可用性的现状下,利用免费开源软件搭建试验系统,也许是图书馆可以尝试的一个解决方案。下面简要介绍一下北京大学图书馆利用开源软件Scriblio搭建下一代图书馆界面的情况。

项目背景及实施

2008年4月,北京大学图书馆对图书馆自动化集成系统展开评估和调研。调研的结果表明,下一代图书馆界面是图书馆未来发展和实践的一个方向。5月,北京大学图书馆便开始尝试利用开源软件Scriblio搭建下一代图书馆界面。2009年4月完成大部分本地化配置,系统投入试运行。未来,北京大学图书馆将根据本馆的实际需要,进行进一步的扩展开发。

Scriblio的功能特点

Scriblio本身是下一代图书馆界面的一个代表:既继承了传统OPAC书目查找的功能,又具备很多新的设计思路和理念。其主要功能特点如下:(1)一站式整合检索:检索界面简洁如Google,可以查询所有馆藏资源(包括纸版和电子资源);(2)对检索结果进行相关度排序、分面显示;(3)可以进行书评;(4)可以通过互联网提供书目信息的API接口,获取诸如封面、摘要、目录等丰富的内容;(5)其他一些web2.0的功能,如RSS、评分等。

安装

Scriblio是开源博客系统WordPress的一个内容管理插件。WordPress系统平台运行环境为Apache+Mysql+PHP。由于PHP语言本身有跨平台的特性,因此,整个系统可以运行在Linux/Unix、Mac OS、Windows等操作系统之上。北京大学图书馆试验系统运行环境为Windows 2003 Server。

安装的步骤:首先是搭建Apache+Mysql+PHP环境,北京大学图书馆使用的是Windows平台下开源集成软件WAMP(http://www.wampserver.com);其次,是安装搭建WordPress(http://www.wordpress.org)系统平台;接着,需要安装并激活WordPress Scriblio相关主题和插件:Scriblio主题(http://about.scriblio.net/downloads/scriblio_theme.tar.gz)、bsuite插件(http://downloads.wordpress.org/plugin/bsuite.3.0.5.zip)和scriblio插件(http://downloads.wordpress.org/plugin/scriblio.2.6b01.zip)。

安装过程中特别注意的是:WordPress系统和各插件的版本要相互兼容,否则会出现各种不同错误。北京大学图书馆测试成功的各软件版本分别为:WordPress 2.6.x、bsuite3.0.5、scriblio 2.6b01。

配置与使用

安装完主题和插件后,需在WordPress后台管理端配置相应的参数。主要配置点为:在“设置-永久链接(setting-permalink)”中设置为“数字(numeric)”。

配置完成之后,在WordPress后台管理端就可以导入书目数据了。可导入的数据类型包括:MARC书目数据、Horizon系统书目数据和III的Millennium系统书目数据。其中,后两种是直接与Horizon自动化集成系统和III的Millennium自动化集成系统进行批量数据交换。

北京大学图书馆使用的集成管理系统是SirsiDynix公司的Unicorn系统,Scriblio插件没有与Unicorn系统对应的接口,因此最终采用的是MARC书目数据的导入方式,即从Unicorn系统卸载出UTF-8字符集的MARC数据,再将这些数据通过Scriblio插件导入WordPress系统。

本地化问题的解决

安装好WordPress+Scriblio主题+Scriblio插件+bsuite插件系统后,并不意味着可以立即使用该系统。北京大学图书馆当时遇到的几个大问题如下:一是系统只可以导入UTF-8字符集的USMARC,而北大馆的中文图书使用的是CNMARC、古籍和学位论文等其他特藏库采用的是自建元数据;二是系统无法检索中文字符;三是中文图书无增强内容;四是无法获取Unicorn系统馆藏实时流通信息。

针对遇到的问题,北京大学图书馆作了四方面的改进:

一是改进Scriblio插件中importer.php文件的相应代码,自定义增加CNMARC字段映射和古籍元数据字段映射。经过改进后,北京大学图书馆可以将古籍数据和CNMARC数据导入系统。使用同样的方法,未来可以根据需要在importer.php文件中对相关代码进行自定义配置。

二是利用一款开源全文检索软件Sphinx(http://www.sphinxsearch.com)进行中外文全文检索,其中采用了香港科技大学项目成果TSVCC中文繁简字对照表(http://library.ust.hk/software/scriblio-sphinx.html)。配置好Sphinx与WordPress的接口,北京大学图书馆目前可以通过标题、著者、简介进行中外文的全文检索。此外,可以进行中文繁简自动转换检索,在检索框中输入繁体中文能够检索出简体书目,输入简体中文能检索出繁体书目。

三是通过互联网书目信息的API接口获取中文图书的增强内容,如图书封面和网络摘要。目前北京大学图书馆中文图书封面来自Google图书项目、豆瓣、亚马逊中文图书。

四是开发了一款WordPress插件,专门解析Unicorn系统的实时流通信息页面,获取馆藏实时流通信息。


www.sooyou.org/archives/235