搜索引擎Powerset助力微软

来源:百度文库 编辑:神马文学网 时间:2024/04/24 18:47:42
《财经》记者 何华峰    [07-04 20:34]  共有0条点评


Powerset首页
Powerset基于自然语言,某些搜索性能超过Google,为微软提供了一次超越Google的机会
【《财经网》专稿/记者 何华峰】微软收购从事自然语言搜索引擎公司Powerset的消息,既让人看到了微软发展搜索引擎的决心,也令自然语言搜索迅速成为行业的热点。
6月26日,美国知名IT博客VentureBeat首次披露,微软将斥资1亿美元,收购美国旧金山的搜索引擎公司Powerset。7月1日,Powerset在博客上发布声明,证实微软已与其签约。
微软刚刚放弃了对雅虎的收购,公司首席执行官斯蒂夫·鲍尔默(Steve Balmer)同时表示,要坚定不移地独立投资互联网,缩小与Google在搜索引擎方面的差距。收购Powerset进一步佐证了这一思路。
同时,Powerset的搜索是基于自然语言,某些搜索效果好于Google,这一消息也让业内不禁联想:这会不会是微软超越Google搜索引擎的一次绝佳机会?
Powerset与自然语言
Powerset公司位于旧金山。2005年9月,Powerset的首席执行官巴尼·佩尔(Barney Pell)找到了PARC实验室的罗恩·卡普兰(Ron Kaplan),后者领导着一个负责自然语言搜索的团队。佩尔说服卡普兰做一款自然语言搜索引擎。
PARC实验室(Palo Alto ResearchCenter)隶属于施乐公司(Xerox),是硅谷地区鼎鼎有名的高科技产品研究机构。20世纪80年代初,苹果公司创始人斯蒂夫·乔布斯(SteveJobs)正是从这个实验室得到了鼠标技术,并将其用在自己研发的苹果电脑上。
2007年2月,Powerset从PARC实验室获得了自然语言搜索引擎技术的排他性授权。
从理念上说,自然语言搜索是更先进的搜索技术,搜索引擎会先理解文章的意思,在此基础上进行搜索。与Google相比最大的区别是,Google的搜索以关键词为基础,根据关键词把搜索的页面进行排序,而并非以理解文章意思为先。
理论上,自然语言搜索更为先进,但这项技术的概念出现几十年,一直没能做到可应用水平。Google也曾表示要推出自然语言搜索,却始终未果。而PARC实验室的技术被认为达到了应用的水平。
这项技术很被看好,2006年,就在Powerset与PARC实验室还在谈判的过程中,已经有两个风险投资商FoundationCapital和the FoundersFund表示看好,计划以相当高的价格进行投资。最终,两家风险投资商以1250万美元的价格,获得了Powerset不到三分之一的股权。
2007年初,Powerset终于完成了与PARC实验室的谈判,前者获得排他性授权,后者除收取授权费外,还获得前者的部分股权。
2007年9月,Powerset的搜索引擎上线。比较Powerset与Google,在某些地方,前者的功能更优。比如,搜索“谁收购了IBM”,Google只识别“收购”与“IBM”两个关键词,显示结果,会是大量IBM收购的公司。Powerset则能理解,要查找的是收购IBM的公司,给出的结果主要是“联想”和“AT&T”。
如果输入更复杂的问题,如“IBM在1996年收购了谁?”,Google便会束手无策,而Powerset的搜索结果则好很多。
Powerset还有较强的学习能力,比如,扫描网页,它会发现希拉里·克林顿与“自由”“民主”“领导人”相关,当你搜索“自由民主党人对医疗政策的态度?”,就会搜到希拉里和其他自由民主党人关于这方面的言论。
微软的机会
目前,Powerset的搜索范围还只限于维基百科,未来会逐渐扩大范围。运用自然语言搜索技术,必须把网页扫描及标识一遍。只限于做维基百科的搜索,是又经济又实惠的做法。
如果有一天,Powerset真的想和Google抗衡,就必须把互联网上的所有网页扫描并标识一遍。Powerset在声明中说,“这很贵,要求的技术和计算资源,是一个新企业无法承担的。与微软合作,是让技术应用大规模化的最快途径。”此话点明了Powerset钟意微软的真正原因。
对Google来说,要做自然语言搜索并不容易。Google早已扫描并标识了上百亿页网页,但这些都是以关键词搜索为基础的。如果采用自然语言搜索技术,将不得不重新扫描和标识这些网页,且所需的时间会比关键词搜索来的更长。
微软收购Powerset后,同样必须扫描及标识所有的页面,但其显然有更强的动力。首先,这是一次超越Google的好机会;其次,相对于460亿美元的收购雅虎的预算,这点花费变得微不足道。
今年5月,美国互联网调查机构尼尔森在线(NielsenOnline)公布的数据显示,4月份,Google在美国搜索市场市场占有率为62%,与雅虎和微软的差距进一步拉大。雅虎以17.5%的份额位居第二,同比减少3.4%。微软的MSN/Windows Live Search占9.7%,同比增长30%。
微软还有一个优势,是它有一些细分领域的搜索引擎,如购物比较搜索Microsoft LiveCashback,旅行搜索Farecast,健康专业搜索health.live.com,自然语言搜索技术应用在这些细分领域,目前效果最好。Google则是面向全体用户的通用搜索引擎。
被微软收购后,Powerset还将保持相对独立的运作。在声明中,Powerset表示,公司将如常运作——办公地点不变,公司架构不变,团队不变。
在未来几个月,Powerset将整合进微软的Live搜索。Powerset说,“我们将提高搜索,通过标注网页基于意思,而不是关键词。”
Google终结者?
Powerset在技术上有一定优势,但要成为Google的终结者则相当困难。
首先,Powerset的技术优势也许不一定能维持很久。
事实上,Google研究总监彼得·诺维格(Peter Norvig)在接受VentureBeat采访时透露,Google内部已有几个做自然语言的小组,且许多人拥有这一专业的博士学位,而他本人就是其中之一。
同时,基于自然语言的搜索引擎并非独Powerset一家。另一家同类公司Hakia刚刚筹得2100万美元的风险投资,其有意扫描并标识整个互联网的网页。意大利Expert System公司做的Cogito Focus也是一款基于自然语言的搜索引擎。
这些同类者中,不乏“倾心”于Google者。Expert System的首席执行官布洛克·艾克(Brooke Aker)说,与业内强者联合,是扩展自然语言技术的最快途径。
其次,自然语言搜索没有提供视频和图片的识别技术,这是其很大的技术弱点。
再次,Google现在已是搜索的代名词,人们习惯了用Google搜索,而要改变用户的这一习惯显然并不容易。
不过,在Google关键词搜索独步天下的今天,Powerset的出现至少显示了搜索引擎未来可能有突破的可能。
“五年后,搜索行业会有巨大的变化。”Hakia首席执行官力佐·伯肯(Rizzo Berkan)说。■