我国农业科学数据共享中信息质量管理的措施与建议

来源:百度文库 编辑:神马文学网 时间:2024/04/20 11:58:41
作者:宋立荣  孟宪学  周国…    文章来源:《中国农业科技导报》.-2009,(6).-37-42    点击数: 42    更新时间:2010-2-6
农业科学数据共享,就是通过国家的整体规划和宏观管理,通过政策调控和法规体系保障,应用现代信息技术,将农业领域原来离散的科学数据整合、集成起来,使数据的使用由为数据拥有部门、数据拥有单位甚全个人服务的单一目标,规划成为一个整体而相互协调的系统,实现农业科学数据资源的开放与共享使用,为科技创新和国家发展的整体目标服务。
“农业科学数据共享中心”项目是2002年开始由中国农业科学院农业信息研究所主持启动,中国农业科学院部分专业研究所、中国水产科学研究院、中国热带农业科学院等单位参加。该项目是由科技部“国家科技基础条件平台建设”工程项目支持建设的数据中心试点之一。它是在“国家科学数据共享工程”总体框架下,立足于农业部,应用现代信息技术,以满足国家和社会对农业科学数据共享服务需求为目的,以数据源单位为主体,以数据中心为依托,以农业科学数据共享标准规范为依据,通过集成、整合、引进、交换等方式汇集国内外农业科技数据资源,并进行规范化加工处理,形成一个非盈利的以“总中心-分中心-数据源点”为构架的分布式网络系统,建成包括1个主中心、7个分中心和28个数据节点的农业科学数据中心,搭建基于网络的数据共亨平台,集成60余个农业主体数据库,并实现网络共事,建立一支稳定的农业科学数据资源整合、管理与服务队伍,实现全社会资源的共享和服务,最终建设成为覆盖全国,联结世界,可提供快速共享服务的网络体系,实现农业科学数据管理与共享服务的规范化和程序化,为农业科技创新活动提供强有力的支撑,为国家整体发展和科技整体水平的提高,提供可靠的农业科学数据资源保障。截至2008年底,农业科学数据共享中心项目建设了7个数据分中心,集成数据库(集)574个,资源量超过600GB以上,并全部实现网络化共享;共享平台网站提供的在线下载数据累计200GB,离线数据服务量600余GB,访问量已超过100万次,已经为33项863项目(课题)、22项973项目(课题)、30项国家自然科学基金项目、46项国家科技攻关项目(课题)、8项国家其他科技计划项目提供了数据支持。
目前,农业科学数据共享中心是以平台项目支持的形式运行,搭建农业科学数据共享平台是构建农业科学数据共享系统的一个重要环节。农业科学数据共享平台的定位是聚集国内农业领域的各种优势科学数据资源,面向国内外农业科研教育单位、行政管理部门、农业企业以及全社会全面开放,吸纳各种形式的科学数据资源,以制度建设为保障,以机制创新为先导,以管理刨新和共享服务为核心,以项目为纽带,全面开展农业科学数据共享服务。它的基本功能是数据积累和保存功能、数据共亭和服务功能、门户功能。
从质量角度看,数据共享平台系统应作为信息管理者,是连接信息用户和数据生产者之间信息生产过程的中间环节,更是维系上下游质量信息传递的关键,它其实是“质量代理人”角色。即:首先了解、获取用户对信息的质量要求,以此要求转化成平台系统质量要求,进而向数据生产者去传达这些质量要求,使从源头就开始建立基于用户驱动的质最控制标准。可以说,信息管理者是信息质量(information quality,IQ)的“把关者”,也是信息质量的主要推动者,由于该平台建设所需数据来源涉及多个部门,IQ有很大差异,迫切需要能够建立一套信息质量管理(information quality management,IQM)的制度,从管理上促进平台IQM工作。
需要说明的是,这里所指的“农业科学数据”是泛指,并不是严格意义上的“科学数据”,它包括农业科技基础数据、农业科学实验数据、农业科技文献数据、农业自然资源数据、农业科研条件数据。在理论研究角度看,其实应属于更宽泛意义上的“科技信息”范围,“农业科学数据共亭中心”项目上应该看成综合性的“农业科技信息共享中心”项目。
1  农业科学数据共享平台建设中信息质量管理举措
1.1  在组织管理方面,建立合理的组织管理体系,成立质量控制小组
建立合理的组织结构是保证农业科学数据共亨平台实现跨部门、跨学科、跨领域的共享目标的根本,为推动农业科学数据共享工作的有序进行,在科技部、农业部和中国农业科学院的领导和监督下,建立了完善的项目管理体系,项目由农业部牵头,负责项目的监督、管理与协调,由中国农业科学院农业信息研究所主持,负责项目的总体规划、总体技术方案和标准规范的制定与监督执行、数据资源的组织与管理、共享服务系统以及数据中心的建设以及运行维护、数据咨询服务等。同时,成立了项目领导小组,加强农业科学数据共享工作的组织和领导。
项目涉及单位多,专业面广,组织协调工作复杂。一方面,项目组按照“数据逻辑高度统一、物理适度分布”的原则、按照“项目课题-专题”三级管理方式,以合同的形式保障项目有效执行,通过“总中心-分中心-数据资源点”的体系开展数据资源整合与共享服务;另一方面,项目组成立了顾问组、技术总体组、项目管理办公室,加强项目实施过程中的组织与管理。同时成立了由“数据资源组”、“质量控制组”、“共享服务组”、“软件开发组”和“网络管理组”等组成的项目工作组,其中,“质量控制组”负责根据农业科学数据的业务特点,制订了数据整理、加工、质量控制、制作、归档、发布的业务流程规范,负责数据库的标准化处理和网络发布。图1(略)是农业科学数据中心数据处理业务流程图。
1.2  在共享规则建设方面,制定各项管理条例和规范
制定农业科学数据共享的各项管理条例和规范,并在项目实践中应用。针对本项目不同于部门行政管理手段开展数据整合和共享的特点,农业科学数据共享平台制定了多项共享管理条例,遵循实用和扩展性的原则,采用直接采标或采标修改的方法,统一制定各项标准规范。目前,已经在运行机制、管理条例、技术规范等方面完成约38项管理规范的研制,进行了全面的试行应用,并在使用中不断修订和完善。比如:“农业科学数据共享管理办法”、“数据中心运行管理规定”、“农业科学数据共享中心建设规范”、“农业科学数据汇交管理办法”、“农业科学数据共享中心建设规范”、“数据质量检查与控制管理办法”、“数据加工流程规范”、“数据质量控制检查规范”、“数据标引规范”、“数据分类分级规范”、“数据著录规范”、“农业科学数据库格式规范”、“农业科学数据使用说明规范”、“农业科学数据用户认证规范”等等。
1.3  在标准制定方面,构建科学数据共享标准框架体系,制订和完善各种标准规范
标准规范是科学数据持续积累、整合、共享与应用的重要保障。因此,要以提升信息质量、实现信息资源的整合为目标,制定并完善在科技信息采集、加工、管理、集成、融合、共享、应用等过程必需的标准规范和实施标准规范的工具。同时,要加强标准的有效实施,加强标准在各共享机构、部门及各个环节上的执行力度。
在项目建设过程中根据共享工作的需要,及时制定了一批标准和规范,不断完善标准规范,制订和完善农业科学数据共享试点建设急需的标准,为农业科学数据共享工作的开展奠定了坚实的基础。截至2008年底,制定或完善的公共标准、领域标准和基础标准达40多个。这些标准的出台和实施,为各组织机构间的合作制定了科学的流程和规范的工作标准,为项目的顺利实施提供了科学依据。
另外,积极构建农业科学数据共享标准框架体系,该标准体系由农业各专业领域科技基础数据相关标准和信息技术的相关标准融合形成,它定义了一系列的标准规范,来规约数据的采集、存储、分析、管理和数据的表达、发布、交换的各种格式、方法和规范。这些标准根据涉及的方面不同,可以分成框架体系、数据管理、数据制作和数据服务4大类,见图2(略)所示
1.4  在技术应用方面,积极探索新技术的应用,提升数据工作技术水平
农业科学数据共享中心建没需要良好的软件系统和网络硬件环境来保障。技术问题是实现农业科学数据共享管理的基础保障,因此要加强研究广泛获取数据以及最佳开发利用数据所需要的基础设施和关键共性技术,包括元数据库技术、异构数据库技术、数据挖掘技术、海量数据存储技术、集成化技术、虚拟现实技术、网格技术,以及广泛的国际互操作协议和有效的数据质量控制技术等。
共享平台中心利用先进的软件开发技术开发了供农业科学数据共享项目的元数据管理、目录导航、内容管理、异构数据检索等四个软件,制定了农业数据的标准,确定了主题数据库的结构,另外,还根据用户和科学研究数据整合。分布式数据共享的需要,开发农业科学数据共享平台软件,初步形成分布式数据共享网络框架,研发了基于元数据的农业科学数据共享软件系统。建成了一站式农业科学数据共享网站(http://www. agridata.cn),提供农业科学数据门户功能,并推广应用。
1.5  在人才队伍建设方面重视人才培养,加强人员培训工作
通过农业科学数据共享中心的建设,与各共享单位合作培养和组建一支农业科学数据整合与共享的数据中心的人才队伍,包括数据资源整理、整合专业人员、网络与数据库建没与管理专业人员、数据共享服务的专业人员、数据中心和分中心运行管理人员。这个队伍以中青年科研骨干为主,人员保持了相对的稳定,并且通过不断的尝试,逐步积累数据共享方面的经验,对继续做好这项工作提供了良好的人才保障。同时,重视人才队伍的培养,多年来长期坚持定期开展交流与培训,通过组织建设和有效管理,在项目实施过程中培养了一批既具有深厚的科学背景又掌握了信息技术的综合性人才,并培养了一批博士、硕士研究生。
1.6  在数据资源整合和服务方面,制定以应用为导向。加强科学数据与科研活动的数据资源整合策略
农业科学数据类型多,量大面宽,早期的农业数据库由不同的单位组织建没,建设目的也各不相同,不能适应网络化信息共享的要求,因此,所有汇集的农业专业主题数据库群和数据库集需要在新的标准规范指导下,进行一次标引、分级分类、元数据注册与归档、非结构化数据的改造和重组、网络化组织与发布以及数据备份等资源整合工作。
在数据资源整合方面,主要采取分步实施的策略,从有条件的地方起步,试点先行,取得经验,逐步推广,扩大范围和领域,最终达到整个农业科技界的共享。在数据整合方法上,以“标准-系统-数据”为主线开展数据整合工作,重点开展了三项工作:①数据共享标准规范的制订和完善,为数据整合提供标准方面的基础;②采用信息技术建立网络化分布式的数据共享软件系统,为数据整合提供技术方面的基础;③整合农业部下辖三院的农业科学数据,为“农业科学数据共享平台”长期、稳定运行提供了丰富的、源源不断的数据源。
l.7  农业科学数据共享平台制定严格的信息质量控制检查工作程序
首先成立由课题负责人、数据库领域专家以及农业专业人员等组成的“数据质量控制检查小组”;其次,成员组人员对数据进行定期或不定期的质量检查或抽查。必要时,根据数据库群的分布,质量控制小组又分解成若干个工作组,分别负责某一类数据群的质量检查;数据检查采用随机抽查方式,按照一定比例标准进行抽查;最后,汇总审查意见,将审查结果反馈给符个单位负责人或课题主持人对数据库进行及时修正。
2  进一步加强农业科学数据共享中信息质量管理的几个建议
由于飞速发展的农业科技对农业科学数据的需求日益增加,需求趋向多元化,且社会对科学数据资源共享的需求层次不断提升,并随着农业科学数据共享工程的深入推进,对农业科学数据共享中信息质量提出了更高的要求,故需要在组织管理、技术规范、标准建立、流程控制等方面进一步加强信息质量管理工作,简述如下:
2.1  从国家层面建立信息质量宏观协调机制,加强各共享联盟间信息质量的横向沟通和联系
要建立业科学数据共享工作有效的质量管理机制,重点加强各共享联盟间信息质量指导和协调工作,充分发挥国家的宏观战略指导作用,加强共享信息质量管理战略研究,紧密围绕农业科研发展的重点领域和方向,加强总体规划与系统整合,做好质量策划和组织实施,提出整合质量规范和标准。同时,还需要面向需求优选数据资源,建立精品数据库,重点形成一批基础性的、战略性的高质量核心科学数据库,尤其是结合国家一些重大工程与科研项目,有针对性地推动农业科学数据的集成与应用,实现科学数据从点到面、从局部到区域、从零散到系统的集成与整合,使农业科学数据库成为一种系统的、有一定空间分布与时间跨度的和具有方便实用分析工具的科学数据集。
2.2  建立健全农业科学数据共享的信息质量管理规范体系
科学数据共享是一项政策性很强的工作,复杂程度高,做好科学数据的收集、质量控制、资料存贮和管理、分级分类服务等各个环节的工作,均需要国家法律或法规予以规范和保障。因此,实施农业科学数据共享应建立完备的政策调控和法规保障体系,以规范农业科学数据采集、集成、共享、应用的各个环节;要组织相关人员开展专题研究,分门别类,区分不同情况、不同用途下相关的共享政策、法规和管理办法;加强IQ管理政策规范的研究工作,及时制定IQ管理规范和相应的规章制度和工作标准,并由主管机构监督执行。
2.3  整理、完善各项技术标准制度,加强标准的执行力度
根据信息技术发展的趋势,农业科学数据共享今后将重点发展以标记语言为主的各种元数据规范、数据交换的规范、学科领域数据集成和IQ控制与评估的规范等。同时,为了推动标准规范的实施,需要重点发展维护和实施标准规范的工具,如实时地自动获取和创建元数据的工具、数据格式自动转换的工具、数据与元数据的注册系统等。还应参考国家科学数据共享工程中有关的数据标准,采用已有的国家标准,研究制定农业科学数据标准和规范,使得基础数据的采集、加工处理、建库这几个环节在统一标准、统一规划下分工实施,确保数据和信息的质量。根据已制定的数据标准和规范及数据交换协议,分别建立农业数据库,同时,针对现有参与共享的数据库,设计各种数据库之间的数据转换系统。
同时,制定信息质量提升效果的定期评价标准和评价程序,以督促信息质量管理规范的实施,加强标准在各共享机构、部门及各个环节上的执行力度。
2.4  不断提升科学数据工作技术水平
随着信息技术的发展,为有效管理、整合科学数据资源,提供便捷的服务,实现农业科学数据在科研活动中的应用,需要不断研究新的技术,探索新技术、新方法,不断提升科学数据工作技术水平,发展数据库技术,探索新的方法,实现科学数据资源的整合和有效管理,以新技术解决IQ问题。
2.5  以应用为导向,加强农业科学数据与科研活动的紧密结合
随着数据密集型应用的发展,单纯数据提供服务已经不能满足研究与科研人员的需求。科技信息特别是系统的、专业的、经过科学分析与整理的科学数据已经深入到科学研究的具体环节中,利用信息技术推动科学研究方法变革和多学科交叉协同综合研究已经成为农业科学研究发展的趋势,农业科研人员在农业科学研究中能否快速、便捷地获取丰富的科学数据将直接影响到科研工作的效率,对农业科学数据及服务质量的要求将更高,科学数据共享服务已经不是一种简单的服务,而是应该贯穿到科学研究具体环节,与科学研究活动密且结合起米。因此,我国农业科学数据共享信息资源的发展应该以应用为导向,加强农业科学数据应用服务,突现科学数据与科研活动的紧密结合。
2.6  借鉴国外或其他行业信息共享的经验
固外的科学数据资源建没得较成熟,资源的丰富、检索的便利、服务的质量都优于国内,为各种用户提供了一个良好的信息环境。我国在加强引进国外农业数据库的同时应加强农业科学数据资源的国际信息资源交流与共享合作,学习国外先进的管理经验和技术,借鉴国外科学数据共享建设中IQM的经验。
同时,加强与其他行业信息共享建没在资源融合、技术交流以及信息共享质量管理经验等方面的交流与合作,为我国农业科学数据共亭管理水平提高、IQ提升、扩大信息资源共享范围,营造一个高质、高效、便捷、广泛的数据共享环境。
作者单位:(1.中国科学技术信息研究所,北京 100038;2.中国农业科学院农业信息研究所,北京 100081)
文章采集:caisy
注明:国家科技基础条件平台项目
 
注:本网站为公益性网站,若单位或个人不同意刊载本信息请与本站联系。