激活被遗忘的企业财富

来源:百度文库 编辑:神马文学网 时间:2024/04/29 00:53:11
2006-07-12 13:30:1
信息化的风起云涌,提升了工作效率,也创造了更多的价值。与此同时,信息化的发展也带来了信息积累效应。短短几年间实现了基础的信息化建设的企业累积了海量的数据,这些都是企业的宝贵“财富”,如果不能有效利
用,只会形成占用IT资源的信息垃圾。而这些信息往往分散在企业的各个角落,找到它们如同“大海捞针”。
在信息化发展快速的国家,对于挖掘这些信息的需求带动了企业级搜索市场的快速发展。美国Ovum Report在对全球软件市场所做的研究报告也指出,企业内部的检索需求与Google,Yahoo式的Web检索需求是相当的,呈向上增长的趋势,全球企业检索技术的市场规模到2006年将成长288%,达15.13亿美元。专家预计,中国市场将成为最新的全球增长点。年初,企业搜索市场的领导者Autonomy收购了其强大的竞争对手Verity后,对中国市场更是“志在必得”。这一领域也同样吸引了其他厂商的关注。
日前,IBM与百度共同签署一项技术合作备忘录,协作拓展硬盘搜索的应用领域,帮助用户从海量资料中快速地找到想要的信息,实现企业信息流的高效协作。
企业搜索的挑战
今天的企业员工通常要在大量的文件中找到所需资料。比如说,员工要完成某份报告就必须弄清楚很多事情,查找大量的信息。这些信息有可能分散在企业的各个部分,既要从技术人员那边获得设计数据,又要向市场部门询问销售情况。由于时间久远,有时连相关人员都无法给你满意的答复。其实这些信息数以不同的形态存在在很多不同的系统里边,关键是你如何找到它们。
相比那些结构化数据,目前非结构化数据占据了大量的企业信息资源。据权威机构统计,在所有存储的数据中,有85%采用的是非结构化格式。这就为搜索提出了新的课题。厂商也都将解决企业级搜索的关键聚焦在非结构化数据的挖掘上。IBM中国研究院院长李实恭认为,相对于网络搜索,这就是企业搜索要面临的挑战。网络搜寻要找到很多,而在企业搜寻则是为了不漏掉任何一个。
针对这一挑战,企业搜索领域的领导厂商Autonomy提出了智能搜索的概念。利用这种技术,可以搜索多种文本格式内容,如Text、Word、Excel、PPT、PDF,以及各种数据库中的数据格式,甚至还可以搜索多媒体文档内容;而且不仅可以搜索互联网内容,还可以搜索本机和局域网上的内容。这大大拓展了企业搜索的应用空间。
据悉,IBM与百度的此次合作其目标也指向了非结构化数据。双方将在UIMA(Unstructured Information ManagementArchitecture)技术进行广泛合作。UIMA作为IBM研究部门和软件部门共同设计和开发的非结构化信息管理架构,客户可以在此基础上继续开发符合自己领域和行业应用的文本分析模块。
“智能”应对
目前,IBM公司的研究和开发部门已经在UIMA平台上实现了包括词法分析(支持英文和中文等一类语言)、句法分析、知识库、问答系统、文本检索、机器翻译等多种自然语言处理功能,算法上覆盖了统计算法、规则算法、机器学习。从现状看,UIMA更像是一个大的平台,它提供的是一个接口,不同用户根据自己的实际进行有针对性、个性化的二次开发。
Autonomy则采用的是一种完全不同的实现方式。Autonomy智能搜索技术关注词语在文档中的逻辑关系。它综合考虑词语出现的上下文,同时又能够查找到那些可能不包含具体词语、但是包含相关概念的文档。除此之外,它还可以实现概念提炼或基于例子的提炼。大部分用户都可以指定一个或多个更相关的初始结果和请求,利用精选内容中完整的上下文,Autonomy能够真正聚焦用户所感兴趣而且适合的概念结果。
使用者可以对搜索需求进行详细地描述,Autonomy智能搜索技术根据对于搜索需求的逻辑思维,提供一套接近人们需求的一种信息(流)组合。通过Autonomy特有的信息呈现技术,使用者不仅能够看到搜索结果,还可以发现它们之间的逻辑联系,以及信息流向的趋势,从而作出快速准确的决策。以信息流的发展顺序为导向,Autonomy不仅能够挖掘已知信息,还能获得未知信息,将企业财富最大化。
Autonomy的智能搜索技术已经在包括全球500强在内的企业中得到广泛应用,相信随着国内企业信息化需求的升级,智能搜索将成为挖掘企业内部财富的重要手段。(AMT)