本体(Ontology)简介

来源:百度文库 编辑:神马文学网 时间:2024/04/30 12:56:25

最早接触Ontology是2003年4月份,当时正在做《个性化信息服务的影响因素的研究与对策》本科毕业论文,看到了Ontology方面的相关资料,但由于与论文关系不大,所以就匆匆浏览了一下,并未细看。
研究生上的是情报学专业,导师在企业竞争情报领域具有一定的知名度的,因此我的研究方向也自然选择了竞争情报。毕业论文被指定为了《基于Ontology的内容分析法的研究》,因为导师认为Ontology类似于词表,但是又比词表功能强大,因此将Ontology引入内容分析法,可以将内容分析提高到语义分析的层次上,并且又是一个很好的创新点,是实现语义内容分析的一个新的思路。因此从论文题目定下的那一刻开始,我就与Ontology卯上了。
Ontology的定义
Ontology也称为本体,它最初是一个哲学范畴,后来随着人工智能的发展,被人工智能界赋予了新的定义。而在Web飞速发展的今天,Ontology的发展已由哲学、人工智能领域延伸到了图书馆学、情报学等其他各个领域,并受到专家和学者的关注。
Ontology在不同的领域有不同的定义,关注的焦点也不同:
哲学领域:本体是对世界上客观存在事物的系统的描述,即存在论,也就是最形而上的知识。形而上学不是指孤立、静止之类的意思,而是指超越具体形态的抽象意思,是关于物质世界最普遍的、最一般的、最不具体的规律的学问。比如什么是物质,物质世界的图景、物质与意识的关系,等等。
人工智能领域:认为本体是一种知识的人工引擎。但本体究竟是什么仍是争论中的一个话题。美国Stanford大学的知识系统实验室(Knowledge System Laboratory)的学者Tom Gruber在1993年提出了第一个被广泛接受的定义:本体是概念化的显式的表示。之后Studer在Gruber的基础上于1998年扩展了本体的概念,即本体是共享概念模型的明确形式化规范说明。显然后一个定义更能够说明什么是本体。
这个定义的具体含义如下:
概念化:将客观世界中的一些现象抽象出来得到的模型。它是客观世界的抽象和简化。
明确:即显式地定义所使用的概念以及概念的约束。形式化:即精确的数学表述,能够为计算机读取。
共享:本体描述的概念应该是某个领域公认的概念集。
Ontology的种类
在介绍本体描述语言之前,我们先来看一下本体的种类。
Guarino提出了从详细程度与领域依赖度两个方面对Ontology进行划分。详细程度是一个相对的、比较模糊的概念,指描述或刻画建模对象的程度。详细程度高的称作参考(reference)Ontologies,详细程度低的称为共享(share)Ontologies。
依照领域依赖程度,可以细分为顶层Ontology、领域Ontology、任务Ontology和应用Ontology四类。
顶层Ontologies描述的是最普遍的概念及概念之间的关系,如空间、时间、事件、行为等等,与具体的应用无关,其他种类的Ontologies都是该类Ontologies的特例;
领域Ontologies描述的是某个特定领域(如医药、地理等)中的概念及概念之间的关系;任务Ontologies描述的是特定任务或行为中的概念及概念之间的关系;
应用Ontologies描述的是依赖于特定领域和任务的概念及概念之间的关系。
Ontology的用途
Ontology是共享概念的显示表述。它关注概念之间的内在的语义联系,一般具有交流、互用性、软件工程等三类用途。
交流是指人与人、组织与组织、以及人与组织之间的沟通。Ontology可以提供一组共同的词汇和概念,从而实现交流。在交流活动中,Ontology是一个标准化模型,任何大规模集成软件系统内,各种各样、背景不同的人必须对系统及其目标有一种共同的认识,因此必须建立起标准化模型,否则无法进行沟通;Ontology对软件系统中所用的术语所提供的明确定义,对于同一个事物在系统中有完全一致的认识,而且这种认识也是确定的;通过Ontology可以集成不同用户的不同观点,以形成更加全面完整的看法。
互用性是指系统间协同工作的能力。Ontology可以在完全不同的建模方法、范例、语言及软件工具之间进行翻译和转换,从而实现不同系统之间的相互操作和集成。
Ontology在软件工程方面的作用是从软件系统的设计和开发方面进行考虑的。Ontology可以在可重用性、可靠性、规格说明等方面在软件工程中发挥作用。
从Ontology的这些用途来看,Ontology可用于许多领域,如人工智能、知识工程、知识管理、语义检索、信息检索和提取、企业集成、自然语言翻译等各种信息系统。目前在上述领域中,对Ontology的应用探索开展得如火如荼。