Overview and Outlook on the Semantic Desktop

来源:百度文库 编辑:神马文学网 时间:2024/03/29 18:55:01
2008-05-13 16:39
http://hi.baidu.com/springsexy/blog/item/1205a38239991295f603a6d4.html
题目:Overview and Outlook on the Semantic Desktop
Abstract
本论文介绍了语义桌面的历史、定义、现在的工作以及它与将来知识管理的关系。本文罗列了现存的应用和研究
以及他们在构建语义桌面研究领域方面的角色。基于对现存系统的分析,我们提出了两种软件体系,一个使用于
大规模的语义桌面,另一个则是用于单一的语义桌面。同时我们考察了语义桌面和知识管理的上下文方面。基于
当下的事件和工程,我们将展望回来该领域的方向。
1 Introduction
语义桌面在语义网领域中成为桌面计算的主要动力。基于今天用户的需求和期望,软件产业会发展到将来的一种
计算--语义桌面计算。
目前的主要任务是将语义网扩展到桌面上来,这种扩展不仅包含有技术的扩展,同时也包含了哲学思想和人。语
义网的开发者今天需要一种完全的RDF与基于ontology的环境来创造桌面应用程序。终端用户会从这些应用中受
益。
1.1 The background and goals of the Semantic Desktop community
"As we may think" -> "Memex"
1.2 Today’s state of the Semantic Desktop idea
2003 语义网未被广泛应用,经分析,原因是主要的工程都是面向大的分布的组织,而最终用户能使用的很
少,只有Haystack和Protege,这两个都很复杂。网络上几乎所有信息都是由个人电脑创造的。个人电脑是个人
信息储存的地方,也是网络的主要接口。服务器上的数据也是为PC提供服务的,可能通过一个浏览器或者网络作
家工具。ontology、分类和全局标示符在普通桌面应用中并未出现。Tim Berners-Lee同时意识到最终用户的应
用程序消失了,这是不应该的。因此目标是:如果目标是有一个全球语义网,语义桌面是必须的,一个网for一
个用户。
语义网、p2p计算、在线社会关系网络。这些不同的技术最终会演化产生出联网的语义桌面--帮助人与社团
协作,并且大量降低他们过滤和组织信息的时间。他指出:
首先,语义网、p2p和社会关系网络技术被广泛发展应用。
其次,现存技术的将语义网技术搬到桌面上来,产生了语义桌面。同时,语义网与p2p合作产生了语义p2p。
社会关系网络与语义网产生了ontology驱动的社会关系网络。
最后,社会关系网络、桌面和p2p技术最后形成社会语义桌面。
基于过去的出版物,我们按下面的方式定义了一个语义桌面。
Definition 1:语义网是一个可以使个人存储所有数据信息的设备。他们被解释为语义网的资源,每个有一
个单独的URI,并且所有数据都是可访问的,可查询的,RDF图形式的。网络上的资源可以被储存,内容可以与他
人共享。ontology使得用户可以表达个人脑力的模型并形成语义交互的信息和系统。应用程序按这个方式存储组
织并通过ontology和语义网协议交互。语义桌面是对用户记忆的补充。
1.3 The near future
我们已经完成了第一步中的大部分目标,现在处于第二阶段。我们的任务是将现存稳定的语义网融入桌面计
算、p2p和社会关系网络。本论文中我们将提出一个语义桌面系统以及语义桌面在联网环境中的地位。语义桌面
是一个全局的工程,联系着不同技术领域的研究者和工业界。
为了给语义桌面创造一个焦点,很多工程被开启了:
NEPOMUK:建造一个专家社团。将学术、工业以及开源社团联系起来以创造一个新的技术和方法论的平台:
社会语义桌面。它使得用户能够建立、保持并使用工作空间里的关系。新的知识会被加入语义结构,并与现存的
东西联系起来。知识、信息项,以及元数据可以被共享而不需要一个中央的体系结构。NEPPOMUK实现了一个自由
的开源整合框架,拥有一个标准化的接口、ontology以及应用。与开源社团的协作以及与主要开源产品的整合保
证了NEPOMUK的被接受程度。
2 Semantic Desktop building blocks
一些先决条件:
2.1 Integrated projects
第一个用该术语的研究项目是Gnowsis Semantic Desktop。这个工作处理细节问题:将桌面数据源整合到统
一的RDF图中,同时解决识别资源与URI的问题。你可以找到一个介绍和一个原型用户接口,link and browse。
此工程作为一个开源工程得以继续,并且是其他研究工程重复使用的框架。与Gnowsis work相似,但是基于网络
服务的是SECO:语义网数据工程的协调服务,目标在于整合网络服务。它描述了一个体系结构使得应用程序可以
统一地访问网络数据。结果被传输到桌面,本工作是ISWC的一篇论文。在数据集成领域,同时也是配合SQL资源
的体系也应被提及。microsoft的信息桥框架目标也是同样的。他们可以被包括在office文档中,called
smarttags。这个框架实施了一个客户端-服务器的,服务器提供一个元数据服务,用于整合几个企业网络服务以
及其他数据源。客户端可以是普通office应用程序,被plugin扩展的:一个客户端收集当前的上下文和关键词,
来自开放的文档,并接受来自服务器的相关信息。
Haystack:个人管理信息,对个人意义很大。替代了很多应用程序,比如:文档处理、email客户端、图像
处理、IM工具等等。他们提供了一个完全的语义编程环境,从用户接口到数据库。不足之处是原型有性能问题。
这个问题在Hayloft中得到了处理。
MyLifeBits:microsoft。基于推测:所有个人的信息可以被及时存储到移动设备上。这个工程描述了一个
概念:如何管理大规模的多媒体信息以及分类和检索数据。
Ontoofice:一个桌面产品,将语义网服务器内容与微软office应用联系起来。这与smarttags和信息桥框架
很相似。
开源项目中也有一些工程。
Chandler:可以编辑和读email,管理约会日历,保持联系人列表。它简化了与他人共享信息,并把自己称
为交互时信息管理。
Fenfire:以统一方式处理可视化以及编辑RDF图。完全基于RDF并实施多种用户接口。部分已经可以得到,
其他由于专利原因还在保密中。
frege:最小的应用ofRDF桌面交流框架。解决核心问题并寻找最小的有效解决方式。
2.2 Tools
不想看了。
3 How to build a Semantic Desktop
本部分描述了一个语义桌面的各个部分如何联合起来,以及有什么样的新特征。我们看看人们如何表达
mental model。然后我们才能理解语义桌面如何支持他们。
3.1 Respect personal mental models
因为我们不把我们的环境视作一个没有任何内在界限的统一体,我们可以将文档分类为一些确定的属性。我
们可以通过一个实验来检验,实验室:一些人将一本新的计算技术或期刊文章放入acm计算分类系统中。
现在让我们带着这个思想来考虑语义桌面这个我们产生、接收并组织文档的地方。因为我们的大脑本性分类
和存储,我们的工作平台需要满足这个日常需要。这产生了一个观点:所有文档与我们个人的背景、正在进行的
工作以及正在进行的工程有关,或者是个人兴趣。而且,这些文档捕获了我们关于这个世界的概念:人、地点、
工程、话题等等。这些概念高度主观但是可以用基本的应用特征来表达,比如说文件系统的文件夹结构、扩展的
形式化如owl ontology和分类学。文档可以用这些结构进行分类,由用户手工决定如何分类一个文档,通过阅读
、理解它并将它与一个mental model比照,或用文本分类引擎自动分类。like brainfiler or GATE。因此存在
一个mental model与正式ontology的交互,mental model找到它们与正式符号表达的ontology的对应。
虽然个人空间里的目录是高度主观的,我们考虑一下收集者一个共有的背景。【34】中表示一个共有的背景
和合作的意识是如何建立和保持交流。这个共有的背景需要用形式化来表示出来,来处理协作者之间的相似性。
如果参与者在相似主题下工作,举个例子:生物学,那么共有的背景是可以的,在公共ontology下。这种形式化
可以被专家表示出来。使用它们可以允许发送者描述一个信息在一个类别里,接受者会理解之,因为相同的分类
存在于两台电脑中。
因此个人背景被个人mental model表达为个人概念,共有的背景呗共有ontology表达。都是在RDF和OWL种形
式化然后被桌面应用程序使用。
语义桌面应该提供一种环境使得用户可以表达新的思想并简单的联系到个人概念和共有ontology上。我们称
这些导致信息源产生的背景信息为资源X的上下文。考虑一个资源的上下文是语义桌面的关键特征。用户在做啥
,用户以前在做啥等等,同事们有关的话题,用户的公司,更多的可以被用于捕获context。
context也会转变
不要假设一个应用单独的代表用户的思想,管理个人概念与其他应用联系起来。
3.2 Context and user observation solutions
对于context表示和重用来说最主要的挑战是定义一个context模型ontology。
Beagle
context的可以飘过吧
3.3 Searching the Semantic Desktop
两种不同的搜索策略:首先,搜索路径,点击进入可能含有文件的文件夹和路径。若路径寻找不成功,则使
用全文搜索策略。今天,桌面搜索引擎是一个主要市场,很多工具。这些搜索工具提供的特征满足了很多用户,
但是远远不是商业级的以及当今研究领域的论文。
我们期待智能信息检索技术可以帮助语义桌面。
上接实验室
3.4 User interface
应用程序里一种典型的交互次序如下所述:
用户使用搜索服务或通过路径寻找感兴趣的信息。
远程或当地的数据被访问。经常直接连接到一个RDF图和一个当前资源。
ontology产生的信息被用于理解数据。接口引擎被用来增加辅助信息。
相关信息被收集,使用图和当前资源为起点。相关信息来自远程或当地资源。ontology,thesauri
,文本相似性和context被用于寻找相关信息。
用户浏览信息并做出决策。新的事实被输入,个人mental model发生改变。
用户存储改变的信息到当地或远程数据库。
这个程序工作流很简单,简单的特征是有用的软件的关键特征。复杂的系统面临着复杂性的问题。举个
例子,gnowsis是一个混合了数据库、接口引擎、用户接口和数据集成的体系。gnowsis的目标导致了复
杂的体系和性能问题,这使得我们不得不重新打造这个工程并将其拆散。Haystack同样由数据库、用户
接口和域特殊功能(email,im,图片编辑)组成。Haystack提供有用的特征而且很好管理。但是对计
算能力、内存和硬盘存储的需求太高了。同时,用户面临着复杂系统需要长时间培训才能使用和获益。
Prot´eg´e是一个很干净的体系:提供了一个快速的可扩展的用户接口来进行ontology编辑并提供存储
和推演功能的plugin。
后面的描述给了一个最初的印象:一个典型的语义桌面是什么样子。我们期望那个一个全新的交互模型
可以拓展此模型。
下面描述了作者propose的核心界面。
当打造一个语义桌面应用程序时,设计用户经验使之可以被识别和理解。
3.5 Architecture of a Semantic Desktop application
model -view -controller
model是一个RDF图。它可以从当地或远程机器装载,同时也可以被存储到当地或远程。ontology和相关
信息yeshimodel,但他们是第二数据,很少被改变。
controller是一个应用逻辑,用于描述使用推理法则或程序代码,它是高度专门的。
view是用户接口。
3.6 Semantic Desktop enabling framework
为了打造支持上述特征的系统,一个基础体系结构应该存在。这样不同的应用可以有一个核心服务,不
需要重复实现这个核心。这些服务是一个框架,运行在不可见的背景服务上,在语义桌面中。因为他们
允许我们更加简易的打造用户接口。
因此什么服务对于语义桌面来说是基础的呢?我们把目光投向gnowsis.org工程。
central RDF repository
central search
adapters
ontology
context capture
pluggable architecture
这些核心功能或多或少在今天都可以找到。下一步是使得这些接口标准化并提供稳定的实施。更复杂的
特征如context和workflow仍然是客房的但是我们期待可以在NEPOMUK种定义所需要的接口。
3.7 Merging the blocks—a Semantic Desktop