企业级搜 索会窜出第二个Google吗?

来源:百度文库 编辑:神马文学网 时间:2024/04/27 15:08:14
虽然名气远远不如Google和Yahoo等互联网搜索引擎家喻户晓,企业级搜索在相关度和智能度上却高出目前互联网搜索一大截。随着全球企业级搜索市场规模的不断增大,专注于企业级搜索的企业会出现第二个Google吗?
3个月前,中国互联网搜索市场份额第一的百度突然宣布撤销旗下的企业软件事业部。
百度这个有50多名员工,专注于企业级搜索的部门,据称整个解散过程只用了4个小时。
消息一经公布,百度立刻被传媒推上了舆论的风口浪尖,而百度和搜狐的口水仗更是一时间闹得沸沸扬扬。
3个月后,这些被裁的人员被一家名叫Autonomy的公司吸纳。记者从Autonomy方面了解到,新加盟Autonomy的前百度员工们利用以前积累的经验和资源,正帮助该公司快速在中国打开市场。
市场规模只显出冰山一角
提交一张自己陌生的图片,然后搜索引擎就能够告诉你这张图片的作者、主题等信息;提交一个关键词,搜索引擎能够大概了解你具体的搜索需求,并提供你想要的结果。这些都是目前企业级搜索能给用户带来的良好搜索体验。
虽然名气远远不如Google和Yahoo等互联网搜索引擎家喻户晓,但目前来自英国伦敦的上市公司Autonomy,在去年11月以5亿美元完成对另一家企业搜索厂商Verity的收购后,其在企业搜索市场的份额已飙升至80%(Gartner统计),远超排名第二的微软、Google、Oracle和IBM等厂商。
在国内,专注于企业级搜索十几年的TRS和天宇,虽然名气不如百度响亮,但也在中国企业级市场积累了大量经验,并独立发展出自己的一套搜索技术。
就像浮在海上的冰山,企业在互联网上的内容只显露出冰山的一个角。Gartner的研究报告表明,企业中,数据总量远远超过了互联网上信息的总量:企业发布到互联网上的信息只占信息量的1%~2%,而98%以上的信息是存储在企业内部的。
企业中的搜索方式与互联网搜索有着巨大不同。在企业中,文本文件、电子邮件、音视频文件等与人们密切相关的数字化信息,占据了主导地位,其占有率已经超过80%。而这些信息都是以非结构化的形式,散落在企业内计算机系统中的各个角落。
因此,如何方便、快捷、安全地获取企业内部的信息内容,成为企业搜索引擎的使命。
和互联网搜索引擎相比,企业搜索产品对核心技术的挑战性更高。它不仅要求搜索速度更快、结果更准确,可索引大量的文档和不同类型的媒体,同时也要求部署方便,可以与企业现有的信息系统、知识库或BI(商业智能)系统结合,并更加注重安全和隐私。
用过微软Windows桌面搜索工具的用户都知道,该工具能够将用户计算机中的非结构化信息按照关键字、时间等方式检索出来,而企业级搜索工具就相当于桌面搜索的升级版本。不同的是,企业级搜索是面对整个企业的网络及数据库,搜索的环境比一台计算复杂一些罢了。如果说桌面搜索是一台普通的家用傻瓜式照相机,那么企业级搜索就是专业的带着齐全镜头和功能的专业相机。
就在几年前,对于搜索用户来说,企业级搜索的界面和互联网上的Google、Yahoo站点没什么两样:仅仅是公司内部网上的一个搜索文本框而已。在上面输入关键字,就能找到企业网站中相关的信息。
但是,今天如果你的理解仍停留于此就落伍了。搜索技术早已沿着智能化、语意化的路线进入了新的发展阶段。研究机构Delphi集团的分析师Hadley Reynolds就曾表示:“现在的搜索技术已经形成了一个庞大的技术门类,从简单的关键字搜索,到分类学等级划分,再到文本分析都是搜索技术的组成部分。”
在中国,大多数图书馆、档案馆和政府机构、重点城市的新闻系统都已经引入了企业级搜索的应用,而金融、电信、汽车、制造等行业的不少企业也开始在OA系统中嵌入企业级搜索引擎,同时部署针对企业竞争环境的信息智能分析体系。另外,一些大型的电子商务网站,也开始借助企业级搜索技术来满足客户日趋细化的需求。
在国外,企业级搜索技术更是呈现出持续深入的应用趋势。几乎全球500强企业都有企业级搜索的需求和应用,从BBC广播公司到美国国土安全部,企业搜索的业务范围无所不包。
调查公司Ovum Report在对全球软件市场所做的研究报告中指出,企业内部的检索需求与Google、Yahoo式的Web检索需求是相当的,呈向上增长的趋势,全球企业检索技术的市场规模到2006年将增长288%,达 15.13亿美元。专家预计,中国市场将成为最新的全球增长点。
巨头们早已按捺不住
看到潜在的巨大市场,巨头们也积极踊跃地加入。这些VIP玩家就是Google、微软、IBM和Oracle。
Google在4年前就开始提供企业搜索产品,近期其Google Mini(迷你Google)和Search Appliance进行了升级。8月28日发布了专门针对商业部门开发的一个包括能够搜索电子邮件、日程表、聊天记录等内容的软件包。尽管在此之前,Google曾公开过数款如Google Mini等面向小型企业用户的搜索工具软件,但Google企业搜索部副总裁Dave Girouard仍将其称为是“Google为企业用户服务的破冰之举”。
但是微软却对Google在企业级搜索的动作不屑一顾。
“没人能从微软的地盘抢夺利润,我们不会和别人共食一个饭碗。”微软公司COO Kevin Turner在微软举办的一次7000人的商务合作伙伴会议上掷地有声地说道。这位性格耿直的领导人在11个月前刚从沃尔玛加盟微软,而在不多的几次露面中,Kevin均表现出了对企业搜索市场志在必得的决心。
分析人士指出,Google主要是依靠消费者对其品牌的高认知度慢慢向企业搜索市场渗透的。 但是目前还不能说效果理想,也和Google的其他周边产品一样,还处于尝试阶段,没有定型。而当前Google坚持在做企业搜索的原因主要是发展其企业IT技术供应商,并保持对微软等传统巨头的竞争力,着眼于未来的整体竞争格局。
越来越希望在企业级市场发力的微软已经将企业级搜索产品提到了其最新战略“全员就绪”(People Ready)中。
据微软中国专业解决方案部技术顾问熊明峰透露,微软公司的企业搜索正在超越现有的功能,即只创建文件的功能。新的软件解决方案利用了客户机和服务器丰富的资源,如Windows Desktop Search和Microsoft Office SharePoint Server 2007,通过使用这些新的解决方案,人们将能及时获取他们最需要的信息,无论是在桌面上、服务器上还是全公司——只要用一个简单、直观而熟悉的用户界面,就可实现此目的。
据悉,微软已经成功签订了35家合作伙伴。而在Vista、Office 2007以及CRM等项目中的投资,将达到200亿美元,因此扩张企业搜索市场无疑将为这个数字重重添上一笔。
据IDC数据显示,凭借过去20年的努力,微软已经成为企业搜索市场的第二名,仅落后于Autonomy。
微软出招了,IBM也决不等闲。在竞争的压力下,蓝色巨人在近期打出了一记组合拳:发布企业级搜索工具OmniFind,耗资16亿美元收购数据传输公司FileNet,旨在提高企业搜索解决方案的效率和质量。
IBM有关人士告诉记者,IBM的OmniFind软件具有查询不同类型的数据源和立即返回结果的能力,能够对多种数据源进行搜索,并具有元数据收集能力。能够提供字段搜索、参数搜索等多种搜索功能,同时支持多层次的企业级搜索安全。而且IBM中国开发中心也对企业级搜索具备很强的技术支持。
在去年完成了TripleHop公司的收购后,Oracle公司也开始在企业搜索领域叫板微软和IBM。
近期,Oracle隆重推出了进军企业搜索市场的软件安全企业搜索引擎的最新版本。为了扩大产品影响,其首席执行官拉里·埃利森还亲自跑到日本东京的首发仪式上发表演说,强调SES将抢占Google、微软等公司留下的市场空白。
Oracle中国区内容管理和协同高级业务经理何民雄告诉记者:“第10代Oracle软件安全企业搜索引擎能够在完全符合企业安全政策的前提下对企业内外部数据进行详细查找和索引。何明雄说:“Oracle公司拥有众多的搜索技术专家来开发企业搜索产品,其中包括通常搜索产品和其他一些更重要的搜索产品。”
何民雄表示,这些Oracle搜索产品还包括短语识别、人名识别、地名识别等,虽然这些能力看似不起眼,但却是包括Yahoo、Google、MSN以及美国在线在内的众多面向消费者的搜索公司目前所不具备的。
中科院研究生院管理学院副院长吕本富在接受记者采访时认为,Oracle搜索产品中最吸引人的地方是搜索技术所依赖的数据库产品,Oracle数据库产品是全球最好的,这是其他较小企业搜索公司所不能达到的。
虽然受到微软、Oracle和IBM左右夹击,Google的成绩似乎也在不断变好。近期,Google就公开表示其去年企业业务的销售额翻了近一番。
不过,市场研究机构AMR的分析师表示,在企业搜索市场,Google与微软之间的差距十分明显,而Oracle和IBM在数据库搜索领域则是术业有专攻。微软显然不希望Google在线搜索的奇迹重演,但也不能回避Oracle或IBM在搜索领域成为其另外两个Google般的竞争对手。
果真隔行如隔山?
众多VIP企业的加盟为何仍未改变专业企业搜索公司一方独大的局面?难道同是搜索,也会“隔行如隔山”?摆在互联网搜索企业和数据库巨头们面前的是怎样一道门槛?
Google近来也积极和咨询商及商业软件供应商建立合作关系,通过咨询服务和技术集成的方式来推进其企业搜索业务。
但企业级的用户并不好伺候:他们的要求远比个人用户要高。这也是Google目前难以在这个领域获得认可的重要原因。
由于在技术路线上的差异,互联网搜索引擎公司做企业搜索,其企业搜索产品在企业中应用的实际应用效果不如专业的企业搜索公司。另外,在企业信息管理需求的把握认识、企业机密数据安全性的保障能力和专业支持服务能力等方面,互联网搜索公司也被行业分析师和企业CIO们所质疑。
在TRS产品经理何东炯看来,Google等互联网公司产生的影响主要是改变了企业用户的习惯。他们产品的简洁性、易用性和可视性,给用惯了复杂烦琐的大型应用的企业用户带来了全新的感觉。
从技术角度来看,虽然互联网搜索普遍认为是技术门槛高的领域,而要玩转企业搜索,需要的技术更加复杂。
己有近20年中文自然语言及全文检索技术研究历史的天宇公司,企业级搜索引擎己在国内取得广泛的应用。该公司总经理毛楚祥认为。网络搜寻要找到很多,而在企业搜寻则不能漏掉任何一个。
针对这一挑战,企业搜索厂商Autonomy提出了智能搜索的概念。利用这种技术,可以搜索多种文本格式内容,如Text、Word、Excel、PPT、PDF以及各种数据库中的数据格式,甚至还可以搜索多媒体文档内容。
智能搜索技术关注词语在文档中的逻辑关系。它综合考虑词语出现的上下文,同时又能够查找到那些可能不包含具体词语但包含相关概念的文档。除此之外,它还可以实现概念提炼或基于例子的提炼。
国内TRS公司擅长中文信息智能处理和全文检索技术。据TRS市场部经理何东炯介绍说,在应用方面,TRS用户可以即开即用或者很容易搭建应用。避免了从应用规划到部署实施往往需要更为符合规范的应用环境、更大投入的咨询和实施队伍才能真正见效的苛刻条件。
而天宇公司开发出的新一代档案管理系统,几乎含盖了所有的业务流程,能够实现对档案全文内容的管理与全文检索。同时,天宇也在国内首次实现了对图片、文字、音频、视频等多媒体档案内容的关联管理与一体化应用。
天宇北京分公司总经理王立向记者介绍,目前,天宇数字档案综合管理系统已经成功应用于国家某办公厅、中直001部队等多个国家高端用户,新一代的档案管理系统在档案资料全文管理与快速、准确、全面的利用等方面的优势得到了用户的高度认同与良好评价。
第三代搜索引擎一统搜索江湖?
互联网搜索和企业搜索打个比方来说就像是梅塞德斯奔驰和夏利汽车,前者只提供基本的搜索功能,而后者能够给用户更多附加的、增值的服务。那么,企业级搜索技术能否推广应用到互联网搜索之上,以企业级搜索技术为主导的第三代搜索引擎能否一统搜索江湖?
从用户体验上看,目前的互联网搜索引擎强调搜索结果多,而忽略搜索质量。而业内人士则进一步指出,目前Google等使用PageRank算法为核心的第二代搜索引擎具有局限性。
虽然Google的排名算法实际上要远比PageRank算法复杂,但限于关键词搜索本身的局限,Google并没有在搜索结果的相关性等指标上与其竞争对手拉开距离,在搜索反馈快速、搜索结果众多的外表下,第二代搜索引擎技术并不能得到准确的结果。
专注于企业搜索的公司尝试将技术移植到互联网搜索中,通过提供更精准、更个性化的搜索结果,从第二代搜索引擎那里抢夺市场份额。
例如互联网搜索引擎Clusty,其公司通过借鉴Autonomy的模式识别技术以及自动分类等功能,可基于对搜索概念的理解,提供搜索结果的自动分类等功能。此外,像Grokker、Snap、Dogpile等网站,也纷纷以更个性化的搜索结果呈现方式分流Google的用户。
在国内,除了类似Bbmao这样的社会化搜索引擎开始提供能够把文本自动分成类别,帮助用户更快地找到他所需要的信息的聚类技术而崭露头角外,老牌搜索厂商Yahoo中国,也在搜索算法和呈现方式上进行了诸多改进,不仅强化了对社区内容、博客等内容的数据抓取,而且在个性化呈现、模糊搜索等方面也有较大进步。
两个月前,Yahoo中国、Yahoo全球、阿里巴巴三方联合推出了一个具有智能模糊匹配功能的搜索引擎——YahooImatch。Yahoo中国及阿里巴巴方面称,该系统可以在用户使用Yahoo搜索信息时,系统可以判断用户的搜索习惯和意图。
面对3个月就会翻一倍的非结构化的企业信息,Autonomy使用了与第二代搜索引擎截然不同的的模式匹配和概念搜索的算法,可以使计算机利用上下文的关系来理解信息。
虽然迄今为止,计算机还无法做到完全理解语言,但通过上述的概念识别技术,Autonomy已经可以做到理解信息的意义和信息间的连接。用户搜索时可以直接以自然语言输入一句话或一段文字,甚至一篇文章,Autonomy会自动判断用户查询条件所描述的概念,从企业文档库中查找所有和用户搜索概念相关的文档。显然,语义搜索比传统关键词搜索更能精准定位用户的搜索意图。
“有大量有用的信息,但是使用信息的关键一步是先理解它。也就是说,需要理解内容,将它发送到合适的人,并且将信息与其他相关的资讯和人员联系在一起。这也是Autonomy这样的企业搜索的独到之处。” 金融服务公司Zurich风险工程组总部工程师Jean-Pierre Krausse指出。
作为对第二代搜索的一种超越,资深互联网观察家王宏亮认为,第三代搜索的算法革命不仅体现于搜索结果的呈现方式,也表现为在形态上不断演进的搜索应用,例如个性化搜索、社会化搜索、本地化搜索、知识问答社区、社区内容搜索等等。而在核心搜索技术上,则大致包含人工智能、模式识别、语义分析、神经网络等发展方向。
由于神经网络搜索和人工智能搜索耗资巨大,目前还没有出现成型的搜索引擎,不过,包括Google、微软、IBM等在内的IT巨头均已将人工智能等搜索的研发提上了议事日程。而在国内,准备了7年之久的AIsou公司更是跃跃欲试,准备推出人工智能搜索产品。
不过在赛迪顾问互联网与电子商务咨询中心分析师常燕杰看来:搜索引擎,即使是风头正劲的Google的搜索算法也远未达到成熟的地步。在追求精准搜索和用户体验的道路上,不管是中国的百度、新浪还是世界级的Yahoo、Google都处于探索的初期。对于搜索准确性的缺失这是第二代搜索软肋凸现的理由。Pagerank作为第二代搜索的核心,在网页相关排名、内容呈现、搜索精度等方面存在着很多问题。
常燕杰说:对于目前新出现的第三代搜索融合了人工智能、模式识别等一系列先进的技术,确实代表了搜索技术发展的方向,但现在的互联网搜索厂商也在这方面做着不同的尝试,也就是说这些先进技术的应用不单单是这些所谓的企业级搜索引擎独创。从目前的情况来看,多数第三代搜索改进最为明显的主要还集中于搜索结果的个性化呈现上,比如做一定的分类等等。这一点的确是现有的搜索厂商应该注意的地方。
变成媒体公司?
搜索技术大有发展,前景诱人,但为何Google等公司迟迟没有大的创新?除了技术本身的原因,企业级搜索市场较小和出于对互联网搜索改进的投入产出成本等因素考量,则是Google们在技术上没有大步迈进的重要原因。
作为互联网搜索的领军企业,为什么Google在搜索上的创新这几年来却少有见到?易观国际总裁于扬指出,不是Google和Yahoo们不愿意在技术上加大投入,而是改进算法的成本比提升消费者体验要大,目前第二代搜索已经能部分满足消费者的搜索需求,而成熟的搜索广告模式更是Google们赚钱的根本,在这种情况下,除非找到一种有很高投入产出比的产品或者盈利模式,否则Google们是不会放弃目前这种搜索技术和模式的。
“Google其实是一个媒体公司,它的主要收入来自广告。和企业搜索现在的盈利模式大不相同”。于扬补充道,而要通过做软件的方法发展企业搜索则有待于宏观市场的成熟。
“这个市场还有Blooming(爆炸性成长),这也是国内公司没有做大的原因。”于杨说,“企业级搜索,必须有个前提,即相关的企业信息化程度要比较高。这时候企业才有整合散落在企业内部信息的需求。目前的情况时,中国目前整体的信息化程度较低,大多数的中小企业,信息化的程度都很低,更不要说搞企业级搜索了。”
于杨认为:“中国企业今天更多面临的是找生意的重任。这就是为什么互联网的搜索引擎广告模式能大行其道的原因。但从长期来讲,中国企业一定会摆脱同质化的价格竞争,更多地靠品牌、创新的时候,这时内部信息的整合就显得非常必要了。”
尽管如此,国内企业搜索也已经在电力、电信、金融等领域中,有了许多大型企业的典型应用案例。分析人士指出,随着搜索的普及,信息化的发展,企业级搜索在国内也会取得很大的发展。
在国内,企业市场估计有一两亿元的规模,TRS占5000万元左右,百度去年占1200万元(NASDAQ 财报的数据)。IDC最近研究报告表明,未来企业搜索的市场空间全球有7~10亿美元左右,并且伴随着企业搜索和Web搜索市场的互相渗透。上面的统计不包括Google,因为Google采取的是把软件和硬件放在一起进行捆绑的销售策略。
在TRS市场部经理何东炯看来,企业搜索市场需要培育,未来会变得比10亿美元更大。另外,企业搜索的咨询市场比产品市场还要大,这也是Google也在和咨询公司合作的原因之一。
通王信息技术有限公司首席执行官王通指出,与国外搜索引擎企业应用和互联网应用齐头并进的情况不同,在中国,搜索引擎的应用出现了一边热一边冷的现象。在互联网搜索引擎应用市场上,搜索引擎营销市场的热度不断升温,竞争也日趋激烈,而与之相对应的企业应用市场上,受限于企业信息化的水平,企业搜索的应用发展极不平衡,人们对搜索引擎的认识还仅仅停留在企业竞争情报和传统全文检索的应用上。
王通认为,造成中国企业级搜索局面没有打开的原因在于企业需求还没有起来。现在有企业搜索需求的集中在信息密集型行业,如政府、媒体、大企业,这些行业信息化水平很高,因此对企业级搜索的需求也很旺盛。这些企业在积累大量信息后,才开始想如何再利用,上升到知识管理的高度,或者想如何获得更多有价值的信息。这就产生了企业内部全文检索和竞争情报的需求。
“目前中国企业级搜索市场,专业的搜索软件厂商仍然很少,有5年以上积累的公司就更少了。”王通说。
百纳咨询高级顾问刘成效把目前企业级搜索市场面对的问题总结为:“信息化程度不高、企业搜索的观念不普及和付费模式的不确定,是目前企业级搜索市场需要克服的三大难题。”
面对这些难题,在企业内部打商业广告是个大胆的想法。而分析人士认为,Google提供企业搜索技术,就是希望有朝一日能够开发出一种平台来承载更多的广告服务,让广告接触到那些有经济能力的企业员工。但企业本身可能并不想出资赞助这样一项服务,同时也不愿意在自己的网络中看到广告的出现。
对此,Google企业产品主管Matthew Glotzbach预测道,企业搜索为广告主、搜索服务商及企业自身带来了新的市场。格罗兹巴赫认为:“想象一下为了在世界500强企业的网络中做广告,广告主们肯定愿意向这些企业的首席信息官支付巨额费用。”
但这种做法在于杨看来,目前很难走通。他指出,Yahoo比Google搜索做得早,但Yahoo当时没有走向广告模式而变成了门户,是因为当时美国的互联广告市场没有成熟。而Google在合适的时候推出的简洁的搜索和合理的广告模式,才获得成功。
“在目前企业级搜索市场没有成熟的情况下,像Autonomy和TRS这样的软件公司,很难从广告中获利,或者说在企业搜索领域像Google一样成功。”于扬说。
TRS市场部经理何东炯:企业搜索市场是需要培育的,未来会变得比10亿美元更大。
鱼和熊掌不可兼得?
网络的最大价值在于信息的自由传播,而这也直接导致了一个结果,那就是信息量的空前膨胀,使我们不得不依赖搜索引擎来查找我们需要的东西。
当记者输入“企业级搜索”几个字到3大搜索引擎中时,Google检索出2980万个结果用时0.2秒,而Yahoo返回2130万个结果用时0.23秒,而百度则是返回了463万个结果用时0.054秒。
从这些搜索结果中,我们看出互联网搜索中搜索引擎大多强调的是搜索速度和数量,而遗憾的是,在搜索引擎眨眼般的速度之后呈现出来的千百万的搜索结果,大多数人都只能看前面一小部分。
有一个著名的调查发现,美国企业中的员工平均1/8的工作时间花费在寻找藏在自己电脑或企业内网上的信息上。而企业中大量的非线性、非结构化的数据,现有的互联网搜索引擎显然不能有效地处理。这种情况下,强调覆盖面广而相关度低的互联网搜索引擎,在企业用户领域的影响开始逐渐弱化。
而要处理视频、音频、电子邮件中的附件等众多非结构化的信息并非易事,如果你装了桌面搜索的工具,你就会发现,在进行搜索前需要对计算机中的内容做长时间的索引和记录。
在搜索领域,看来效率和准确性一直都是矛盾。
通过改进算法,最新的一些企业搜索技术,已经能让很多人感到振奋。智能化、精确化的搜索功能无疑会给搜索引擎增添更多的用户黏度,其所带来的潜在经济效益难以估量。
如果越来越多的行业网站都能为自己的平台嵌入强大的搜索功能,让搜索既快速又准确,那么势必在扩大搜索引擎行业社会广泛化影响的同时,为提高企业运行效率和企业间电子商务发展创造出更值得憧憬的未来。
对于用户来说,无论搜索技术如何演变,用户搜索的界面肯定会越来越简单和方便。效率和准确之间的每一次碰撞,都可能让用户获得更加美妙的应用体验。这一切,对于用户,都是值得高兴的事。