解密AISou智能搜索

来源:百度文库 编辑:神马文学网 时间:2024/04/28 03:22:02
【王宏亮】【和讯传媒】  尽管不无以假乱真的跟风者和以假作真的炒作者,但无需怀疑的是,第三代搜索,作为对以Google为代表的第二代搜索的一次反动,一次否定之否定,已经渐行渐近。
大致而言,第三代搜索可以归结为如下几个方向:人工智能、模式识别、语义分析、神经网络。除神经网络较为虚无缥缈外,在其余三个领域,特别是人工智能领域,目前均已有多家搜索巨头安营扎寨。不过,这其中并不包括那些在第二代关键词搜索模式之上进行修修补补的个人信息门户、社区搜索、聊天机器人等在内。
关于人工智能,较为乐观的行业人士认为,国际互联网的下一个发展阶段将是被称为语义互联网的人工智能阶段,基于PageRank算法的第二代关键词搜索很快就会过时(微软亚洲研究院院长沈向洋语)。话说得很噎人,也多少有点儿一厢情愿,因为google也不可能无所事事,停下来静等别人来超越自己,但上述说法或多或少表明,以google为核心的第二代搜索并没有触及搜索的核心或者说穷尽搜索的边界。这也就意味着,或迟或早,对PageRank算法进行改进或清算的模型必然会出现。
暗战第三代搜索
有迹象表明,包括微软、google、IBM、雅虎等在内的搜索巨头已在研发自然语言搜索、语义搜索、人工智能搜索等第三代搜索技术,而一些新兴企业也试图借搜索技术升级换代之机争夺话语权。
不妨看看微软测试了一年多的被称为AskMSR的搜索程序。在AskMSR的搜索框内输入问题,返回的搜索结果不再是包含关键字的网页链接,而是一个简单不过的答案。不过该软件并没有利用人工智能原理,而只是使搜索程序学习了一定的语法,以此来和相关的网页内容匹配。在程序不能恰好找到相关字符串的情况下,该软件还可以根据两个关键词出现在同一个句子中的几率来判断二者的相关性,作为提供答案的依据。尽管这种做法并不能保证100%的准确,但随着网页数量的增加,AskMSR的准确度也会有所改善。
值得一提的是,除了AskMSR外,微软正着手研发的项目还包括基于Web Block(网页块)的搜索技术以及聊天机器人(微软电子百科全书Encarta和提供BBC电视节目表的Bbcbackstage)。
作为第二代搜索的代表,Google当然也没有停止对第三代搜索的研发,特别是人工智能。Google的CEO Eric Schmidt和创始人Larry Page此前就曾表示,未来的Google搜索将会实现人工智能化的搜索,即一个可以准确理解用户意图然后即时返回用户所需信息的搜索引擎。Larry并预言,人工智能化的Google搜索将在短短的几年内实现。
同样研发人工智能搜索技术的还有IBM。据悉,IBM公司的研发部门在UIMA平台上早已开始进行包括语言分析、知识库、问答系统、机器翻译等功能的自然语言搜索以及人工智能搜索技术研究,IBM将其人工智能技术称为UIMA架构,并已推出名为OmniFind的软件,该软件能将字词背后的含意解释出来,并给出合适的搜索结果。不过,该软件目前尚处于测试阶段,短期内还无法实现商用。
关注智能搜索的还包括雅虎。7月19日,雅虎中国、雅虎全球、阿里巴巴三方联合推出一个具有智能模糊匹配功能的搜索引擎--雅虎Imatch。据称,该系统可以根据用户的搜索习惯和意图,智能匹配相关的搜索结果。
与此同时,更多的准第三代搜索也开始涌现:
澳大利亚华人乔鸿亮最近推出了自然语言搜索引擎lexxe,用户可在该搜索引擎上直接搜索到类似百科全书的直接答案,与第二代搜索引擎的符号计算不同,lexxe把文字直接当作语言来处理并对文字具有一定的理解能力。不过,lexxe目前还没有推出中文版;
一款名为Preview Seek的搜索引擎,号称可以对搜索结果以更合乎人类思维逻辑的方式建立索引,进而提供相关度更高的结果列表;
Accoona,一款以人工智能为诉求的搜索引擎,声称可以基于单词含义而不是传统的关键字匹配方法返回搜索结果,并向用户提供互动式搜索服务……