刘建国:中文搜索引擎技术未来展望1

来源:百度文库 编辑:神马文学网 时间:2024/04/27 19:22:03
刘建国:中文搜索引擎技术未来展望
作者:
出处: 天极网
责任编辑: 杨剑
[ 2004-09-02 17:37 ]
【导读】从去年突然开始搜索的市场很火,实际上大家知道我们百度是1999年底,2000年初就做搜索了。
刘建国:主持人把百度放在最后一个位置,也是有一些比较深的意义。刚才三位也说了,尤其是王总刚才说,从去年突然开始搜索的市场很火,实际上大家知道我们百度是1999年底,2000年初就做搜索了,所以我们对于搜索的市场是一直非常看好的。就跟Google1999年开始做的一样,他认准了搜索引擎的服务是广大网民最基本的服务,所以我们对此有信息。说到这个竞争呢,我本人是做技术的,我自己深信,所有的竞争,最后归根到底还是用户体验的竞争。用户体验靠什么来?我个人认为是靠技术,最终还是靠技术,大家的一个竞争,就是看谁可以做的更好,更可以满足用户的需求,谁最后就在市场中胜出。

所以说我想对中文的搜索引擎技术未来进行一点展望。我的第一个展望就是搜索引擎在中国将称为互联网的第一大应用。现在大家知道,第一大应用是电子邮件,我相信,在未来的不久,搜索引擎应该会称为中文网民最长使用的一个工具。另外一个展望是中国搜索的流量,将称为世界上最大的WWW的流量,基本判断有几个。一个是中国网络民主数的成长是非常高的。在今年七个月是8700万,年增长率是15%,是华尔街,互联网一个很有名的分析师他所估计全球的平均的网民怎样的速度,但是中国,要比这个,应该比这个高很多。我们就以这个增长的速度来算的话,到十年以后,中国的网民数是3.5亿。这个网民数已经超过了美国的整个国家的。所以说互联网,肯定会成为世界上最大的一个市场,而搜索引擎是他的第一大应用,所以它的流量肯定是世界上最大的。第二,网民更加依赖搜索引擎寻找信息,因为网上的信息会越来越多,信息的海洋,会将网民的时间全部浪费掉,所以他必须依赖于搜索引擎进行导航。
第二,我认为更多的中文信息的内容将外部化,很多信息会上网,中文搜索引擎的索引量将超过20亿,这是我自己的判断。现在大家知道,百度是3亿,十年以后,肯定会超过20亿,而且这20亿应该是很高质量的20亿,不是现在互联网的一些抄袭。另外呢,更多结构化的信息变动,一些离线的内容,可以在搜索引擎里面不断的进行提供。第二个,更多的垂直内容将会在搜索引擎里面去提供,像现在我们讲的音乐的搜索,图片的搜索,产品的搜索,本地搜索,以后可能有旅游的搜索,人的搜索,等等这些搜索都会垂直化,因为它主要是来解决精准的问题。
第三个展望,搜索引擎的基本问题没有变,它仍然是准、全、新、快,这四个最基本的问题。目前对于这四个问题的解决,远没有达到一个完美的境地,在这些方面,还有很多工作可以做,怎么样提高索引的大小,新就是说,怎么样将最小的东西包括搜索引擎里面,而不都是一些国时的机器。第四点就是快,你要提供服务的速度要很快,同时还要很稳定。
第四是搜索引擎的工具,工具性更进一步加强,搜索引擎会更成为一种工具,而不是一种目标。大家是在那儿去找信息的,是在那儿导航的,是一种工具,这种工具的使用可能十年以后,大家没有觉察的。你可能不去上网,像刚才说的,也许是桌面或者是怎么样,所有的渠道都不重要了。我们认为有信息要搜的时候,就要进行搜索。另外这种方式会越来越简单和方便,使用户更宜用。我觉得另外搜索引擎会发生很大的转变,搜索引擎会像答案引擎转变。大家在搜索引擎上去找答案,而不是说我找到一个信息,点一下,再看原来的信息,它直接是要获得答案,获得信息,获得支持。另外一个就是无处不在,在任何地方,当你要找信息的时候,我都可以找到。
第五个判断,中文语言的处理技术将得到进一步的发展,并会首先在中国搜索引擎当中得到大规模的应用。大家知道,在IT产业里面,中文对于我们来讲,是一个很大的优势。像最初的中文输入,后来到方正,像中文排版,很多的都与中文息息相关,搜索引擎也不例外,你要做中文的搜索引擎的话,对于中文的语言的处理,对于中文语意的理解,对于信息的抽取,必须要达到一定的规模。
第六个是搜索的个性化将得到进一步的重视和研究,相关技术会有较大的发展。这个主要判断是对于搜索引擎来讲,用户的需求是非常重要的,你必须理解了用户的需求,你才能给它提供相关准确的信息。所以你要对用户的意图,对上下文要进行理解,另外你要对不同的查询,从不同人来得查询,要做不同的处理,要有一定的个性化,而不是说千篇一律的,谁搜什么东西都是一样的,这是我整个一点展望,谢谢大家!
刘建国:中文搜索引擎技术未来展望
作者:
出处: 天极网
责任编辑: 杨剑
[ 2004-09-02 17:37 ]
【导读】从去年突然开始搜索的市场很火,实际上大家知道我们百度是1999年底,2000年初就做搜索了。
刘建国:主持人把百度放在最后一个位置,也是有一些比较深的意义。刚才三位也说了,尤其是王总刚才说,从去年突然开始搜索的市场很火,实际上大家知道我们百度是1999年底,2000年初就做搜索了,所以我们对于搜索的市场是一直非常看好的。就跟Google1999年开始做的一样,他认准了搜索引擎的服务是广大网民最基本的服务,所以我们对此有信息。说到这个竞争呢,我本人是做技术的,我自己深信,所有的竞争,最后归根到底还是用户体验的竞争。用户体验靠什么来?我个人认为是靠技术,最终还是靠技术,大家的一个竞争,就是看谁可以做的更好,更可以满足用户的需求,谁最后就在市场中胜出。

所以说我想对中文的搜索引擎技术未来进行一点展望。我的第一个展望就是搜索引擎在中国将称为互联网的第一大应用。现在大家知道,第一大应用是电子邮件,我相信,在未来的不久,搜索引擎应该会称为中文网民最长使用的一个工具。另外一个展望是中国搜索的流量,将称为世界上最大的WWW的流量,基本判断有几个。一个是中国网络民主数的成长是非常高的。在今年七个月是8700万,年增长率是15%,是华尔街,互联网一个很有名的分析师他所估计全球的平均的网民怎样的速度,但是中国,要比这个,应该比这个高很多。我们就以这个增长的速度来算的话,到十年以后,中国的网民数是3.5亿。这个网民数已经超过了美国的整个国家的。所以说互联网,肯定会成为世界上最大的一个市场,而搜索引擎是他的第一大应用,所以它的流量肯定是世界上最大的。第二,网民更加依赖搜索引擎寻找信息,因为网上的信息会越来越多,信息的海洋,会将网民的时间全部浪费掉,所以他必须依赖于搜索引擎进行导航。
第二,我认为更多的中文信息的内容将外部化,很多信息会上网,中文搜索引擎的索引量将超过20亿,这是我自己的判断。现在大家知道,百度是3亿,十年以后,肯定会超过20亿,而且这20亿应该是很高质量的20亿,不是现在互联网的一些抄袭。另外呢,更多结构化的信息变动,一些离线的内容,可以在搜索引擎里面不断的进行提供。第二个,更多的垂直内容将会在搜索引擎里面去提供,像现在我们讲的音乐的搜索,图片的搜索,产品的搜索,本地搜索,以后可能有旅游的搜索,人的搜索,等等这些搜索都会垂直化,因为它主要是来解决精准的问题。
第三个展望,搜索引擎的基本问题没有变,它仍然是准、全、新、快,这四个最基本的问题。目前对于这四个问题的解决,远没有达到一个完美的境地,在这些方面,还有很多工作可以做,怎么样提高索引的大小,新就是说,怎么样将最小的东西包括搜索引擎里面,而不都是一些国时的机器。第四点就是快,你要提供服务的速度要很快,同时还要很稳定。
第四是搜索引擎的工具,工具性更进一步加强,搜索引擎会更成为一种工具,而不是一种目标。大家是在那儿去找信息的,是在那儿导航的,是一种工具,这种工具的使用可能十年以后,大家没有觉察的。你可能不去上网,像刚才说的,也许是桌面或者是怎么样,所有的渠道都不重要了。我们认为有信息要搜的时候,就要进行搜索。另外这种方式会越来越简单和方便,使用户更宜用。我觉得另外搜索引擎会发生很大的转变,搜索引擎会像答案引擎转变。大家在搜索引擎上去找答案,而不是说我找到一个信息,点一下,再看原来的信息,它直接是要获得答案,获得信息,获得支持。另外一个就是无处不在,在任何地方,当你要找信息的时候,我都可以找到。
第五个判断,中文语言的处理技术将得到进一步的发展,并会首先在中国搜索引擎当中得到大规模的应用。大家知道,在IT产业里面,中文对于我们来讲,是一个很大的优势。像最初的中文输入,后来到方正,像中文排版,很多的都与中文息息相关,搜索引擎也不例外,你要做中文的搜索引擎的话,对于中文的语言的处理,对于中文语意的理解,对于信息的抽取,必须要达到一定的规模。
第六个是搜索的个性化将得到进一步的重视和研究,相关技术会有较大的发展。这个主要判断是对于搜索引擎来讲,用户的需求是非常重要的,你必须理解了用户的需求,你才能给它提供相关准确的信息。所以你要对用户的意图,对上下文要进行理解,另外你要对不同的查询,从不同人来得查询,要做不同的处理,要有一定的个性化,而不是说千篇一律的,谁搜什么东西都是一样的,这是我整个一点展望,谢谢大家!
_xyz