对话:互联网核心技术的未来

来源:百度文库 编辑:神马文学网 时间:2024/04/26 10:21:38
主持人:谢谢王涛先生精彩的演讲和解答,请回座。接下来的环节是阿里巴巴首席技术官吴炯和雅虎博士陆奇进行对话。首先我简单介绍一下吴炯先生,他自2005年5月以来任阿里巴巴集团首席技术官,他创立了阿里巴巴需过办事处,他也是公司的个人投资者,他主导阿里巴巴集团、淘宝网以及公司的其他产品的技术平台设计,最近,他致力于阿里巴巴和雅虎中国的后台合并工作。他一直在关注雅虎中国的搜索引擎技术的加强。
通过他多年在硅谷的工作,吴炯先生带来了丰富的技术和管理经验,在1996年4月,他加入了在美国的雅虎公司,他指引公司搜索与电子商务工程技术队伍,是雅虎目录搜索电子商务技术,此技术已经部署在十多个雅虎电子商务服务系统里了。在加入雅虎之前,吴炯先生任甲骨文服务器技术部的开发经理。
陆奇博士于1997天加盟Yahoo!现任资深副总裁,陆奇博士有20个美国专利,并在复旦大学获得计算机科学的学识、硕士学位,在卡内基梅隆大学获得计算机科学的博士学位。
非常感谢两位,欢迎光临,我们都知道互联网平台技术,但是互联网的技术又有一个它不同于其他传统技术研发的方面,它具有非常强烈的业务驱动的特征,他们两位在互联网技术发展,特别是将互联网的技术应用于规模化的业务模式里有很多的经验,今天请两位谈一谈技术对互联网、对互联网公司的作用之是什么,他应该是什么样的定位。
吴炯:互联网是不是一个高科技的行业,但是实际上并不是很长时间以来有共识的。回答这个问题之前,我先从一个小故事说起。我从美国大学毕业的时候,是一个软件公司,我爸爸当时是在大学里叫物理的。他当时说Oracle,并不是很有名。他说你学电脑和计算机的,最牛的是在硬件里,而软件只是一个包装,并没有很多的技术含量。但是90年代开始,这个情况不一样了,跟人们的预测不一样了,90年代最风光的两家公司是软件公司,一家是我刚才所说的O,另外一家就是今天最牛的微软。
现在技术上的创新都已经解决了,互联网已经把已经有了硬件技术和软件技术作了一个包装。所以很多公司的想法说互联网公司成功的关键不是技术,而是商业模式的创新,这是在短短的7年前非常流行的看法,但是99年出了一家新的公司,证明大家的想法是不对的,已经成为了互联网的第一家品牌。就是Google公司。现在整个的产业有了一个反思,核心技术在互联网公司是非常重要的,所以要成为第一留的互联网公司必须要重视技术,技术是核心竞争力。像阿里巴巴这样的公司是做102年的公司,那么技术平台一定要扎扎实实,技术能力一定是我们公司的核心竞争力。
陆奇:今天跟荣幸跟大家见面,我和吴炯之前已经共事多年了。现在核心竞争力对互联网公司来说是一个至关重要的。对雅虎来说,从外边看,可能看不出雅虎这样的公司有怎么样的技术含量。但是到后台一看,哪怕是一个很简单的操作也是要很大的技术能力支撑。不管是说广告也好,媒体也好,搜索也好,所以我非常地赞成吴炯总结的话。
主持人:看来大家都认为互联网技术是至关重要的。那么什么样的技术是可以起到跨越和引领呢?
陆奇:其实开一个互联网公司,它背后的技术是非常多的。但是真正应该把精力放在互联网公司经营独特的技术。这样大概有四、五个技术,第一是搜索技术。就像Google这样的公司。另外的技术就是电子市场。这样的技术对互联网公司是处在核心位置的。还有一项技术对互联网公司很重要的技术就是PTP?不管是以前成功的公司,还是现在的公司,从技术上来讲,这对互联网公司以后有很多的机会,来创造更大的商业价值,可以带来很大的竞争能力。另外的技术是最近几天比较红的PlcketPC?等。
吴炯:可能有一点补充,我觉得互联网出现以后,对整个技术领域的发展实际上柳暗花明又一春,更上一个台阶了,这个前景以前是看不到的。以前PTP看不到的。完全不是一个档次的事情。现在互联网的出现技术完全已经的不是一个档次,不是一个级别了。以前网游就是做游戏,做得很辛苦,但是卖不出去多少,但是现在网络游戏的公司,他们的网络游戏用户量上去得非常快。还有一些其他的例子,有这样的公司,OracleDATAbase在出现有这样的公司他是基于互联网来做所有的数据仓库和知识发现的。他不是局限于一个公司里处理数据,发现规律,而是基于整个互联网在采集数据,进行处理。
现在我知道有一个公司在把网络上的很多数据都抓过来,变成了商品之后在出售。还有一个网站,把所有房产广告、交易量等做成了数据分析卖给房产公司。所以互联网的出现使整个IT产业技术的要求和难度都上了一个大台阶。
主持人:谢谢两位,两位都是、都是搜索技术的高手,我想能不能请两位从搜索开始,谈一谈就目前来讲,搜索有什么样的局限与挑战。在未来的几年,能不能看到一些新的发展方向,是一种渐进式还是跨越式?
吴炯:最近这一年多,大部分的时间在北京,也是在做搜索技术的进一步开发和产品方向的探讨。我的看法是搜索引擎,再往前走是越来越难了。我觉得怎么样更好地满足用户的需求,怎么样实现搜索引擎让用户更多的价值是要考虑的问题。
第一可能是智能化和垂直化。因为人获得信息无外乎是,分类信息就是垂直化搜索。你可以直接帮用户做分析,直接把结果调出来。
第二方面用户希望搜索的结果可以更加人性化和应用化。我的看法是以前的方法并不是最符合一般用户最好的展现方法。可能有更好的方法,为什么会变成这样呢?因为第一个搜索引擎,就是这么做的,那么后来的搜索引擎又照着做了。这可能并不是为用户想得更多,而是技术人员的一个想法而已。现在搜索引擎上有一个高级搜索,很多人一看高级搜索,说我是低级用户,高级搜索就不看了。其实高级搜索就是一些附加条件,可以把搜索框定在一个范围里。在每一个网站里,都有一个高级搜索都告诉地方现在用户搜索的界面不人性化,搜索界面人性化方面需要改进。
第三、搜索的信息可以直达。很多用户去搜索是直接搜信息,而不是要知道网站,这就和智能化结合起来了,知道用户真正是想要什么样的信息。这个做得好的话,就是把信息直接展示给用户了。
要实现我的想法现在难度都是非常大的。
陆奇:我现在补充一下。社区化。搜索社区化有几个方面,第一在搜索引擎的时候,可以想办法充分利用一些社区,网站的内容和提供的服务。如果我们可以充分利用信息的话,不光提高了搜索的质量,还可以把搜索用户的界面变成一个社区化。搜索的空间可以走向社区化。
从另外一个角度来看,我们把搜索引擎用户打进来的词可以分成三类。对第一类的顾客来讲,搜索引擎的作用跟地图很类似。
如果我们把三块加起来,其实我们可以看到,对每一样东西,我们都有很多的方法。在未来的两年到三年内,搜索质量会有很大的提高。对网民创造更多的价值。
主持人:从搜索的角度来说,很多都是关键字的匹配,那么现在匹配有什么新的想法?
陆奇:目前的搜索引擎是用户输入的关键字,他告诉用户目前他需要的是什么东西,但是搜索引擎还有更多其他的信息来做匹配。比如这个用户在哪里?现在是什么时间,他是属于哪个社区范围。因为一个用户有四个“W”,一是个我是谁,我跟那些人有些什么关联。第二是我在哪里搜索,如果我在杭州搜索就可以直接看到杭州的一些商家。另外一个就是你现在处在什么框架环境,是在某一个机构,跟某一样东西交道。我们大家可以相信这样可以把搜索的质量有一个非常大的提高。那么信息一来,对广告质量也有很大的提高。
吴炯:我觉得实际上这是关系到所谓的个性化,对这个人他的背景、消费层次、性格,都可以成为搜索的时间的因素、地点的因素等。
主持人:现在在技术阶段讨论得比较热烈的是,用户的意愿。怎么通过数据挖掘对用户的点击率作分析。想问一下陆奇博士雅虎在这方面有什么新的发展准备?
陆奇:这其实是非常好的问题,而且时间也非常巧。如果大家对美国的互联网工业感兴趣的话,也可以看到,在美国互联网工业目前的竞争焦点之一是广告技术。我刚看到信息说,微软并购了一家公司花了60亿美元。Google也并购了一家广告公司。在一个礼拜之前,雅虎又并购了一家广告电子市场公司。为什么有这么多商业行为,关键是刚才提的问题,互联网的技术和拿到的数据、数据的连接量,已经达到了这样的水平。我们可以用数据量来达到对客户意愿的统计。最高的境界是搜索,那么用户打进鲜花就是需要鲜花。他打进运动鞋,他就需要运动鞋,但是如果用户不告诉我们,我就可以知道他所需要的东西。那么关键就是把广告的信息做得有用。
回到刚才讲,为什么这么多工业运动,因为广告在将来会有很大的增长,因为数据量的增长已经可以给我们建立一些数据模型,我们可以根据统计的方法来草到很多用户的意愿,来提供非常非常有用的广告,关键是把这些广告的页面插到搜索的界面中。将来在美国的市场上会有很多的商业机会。
吴炯:现在互联网核心的战场在美国,这个核心战场是广告的电子市场,广告的媒体、消费者,这三者怎么样更好地匹配起来,这是互联网最尖端的技术问题。微软也好、Google也好,雅虎也好,都是看准了这一块的机会,从阿里巴巴这个角度来讲,一开始就是网上电子市场,在做这个的时候,我们也有了很多的体会。做匹配是互联网的独到优势。比以往的做匹配的方式都高出一级。这也是我们一直在思考的问题。我们在中国都是一个绝对领先的地位,我们可能有80%以上的市场份额。但是我们现在能做的事情还是非常非常多。现在阿里巴巴、淘宝更是只是一个展示的平台。而且这个平台更多是偏向于为卖家服务。而其中的匹配是借助人工自动完成的。而我们提供的只是搜索,只是一个链接。
现在在淘宝上搜一个比较流行的商品,可能是几千万的搜索结果,我们完全可以把这个搜索做得更好。如果你在亚马逊上买书的话,他会做非常多的需求分析和匹配,而他推荐给你的商品都是有道理的。所以在怎么样更好地匹配好,我们还有很多技术的难关需要去攻克。
主持人:谢谢,在电子市场的匹配技术上面,能不能谈一下目前在国内外和国际上有一些什么样新的趋势和走向?
陆奇:在美国市场上一些技术上的走向。关于电子市场其实大家可以看到,以前比较元老的是股票交易市场,他们是电子市场自动做交易的,人工比较少一点。
现在在科研方面有了很多的进展,比如在搜索广告上面,有一个拍卖市场,最早是一家公司开发的,后来被雅虎并购的。现在在电子市场上怎么拍卖,搜索广告词是有很多进展的。第一,拍卖的模式有了改变。一开始谁在和谁竞争是可以看到的。现在Google进来了之后,他们采取了不同的拍卖模式。拍卖模式不一样,对经营模式有很大的影响。雅虎的拍卖模式跟Google的又不一样,这些搞科研的人,一开始开发软体产品,帮助互联网公司开发产品。
吴炯:刚才我提到亚马逊公司,最近几年他大量在研发上做的投入。他的研发方面的目标是做整个电子商务的操作系统。这个方向受很多争议和置疑的。因为华尔街发现他的盈利率很低,很多华尔街是很急功近利的。成为第一流的互联网就要在研发上做大量的投入,这样才是一个常盛不衰的互联网公司。我们有需要更大的技术上面的投入。到现在为止,我们对卖家的分析做得比较多,而对消费者、买家就比较少了,今后我们在消费者和买家上要作更多的投入,因为你要匹配必须左右平衡,如果一头重一头轻的话就不行。所以我们必须要在电子商务方面作更好的匹配,使我们的优势进一步扩大。
主持人:就目前我们聊的搜索、匹配,怎么在规模化方面做进一步工作?
吴炯:这是SAAS另一种说法,我是非常看好的。这个概念一开始叫ASP就已经非常热了。但是很多公司没有撑下去,那么很多人就产生了怀疑。我认为通常一个模式第二次发力的时候就是发展的时候。当一个模式炒第二遍的时候就真正发力时候了。我再稍微补充一下,你如果没有房子住,就是两种方式,如果你有钱就买房子住,如果没有钱就租房子。总有地方给你住,但是以前软件行业不是这样的,如果你是大企业,你有钱,当然没有问题,可以买一批硬件和软件,可以供系统开发商做研发,再雇一批技术人员做系统维护。但是如果是一个中小企业,你跟他说要不要用软件落管理你的企业,他们一看要先买硬件、软件,再雇IT人员,那么他算一算成本,一年的利润就全泡汤了。在这以前就是这样的情况。
对一些公司来说,这个门槛很高,而且风险很大,如果搞不好,大投入下去了,成本加大了,风险加大了。对他们来说,没有钱买不起房就只有住马路的。
我们作一些用户调查,去一些乡镇企业、中小企业看了,他们管理公司是,整个人员的账、公司的仓管都是在一个帐本里。而现在给这些企业提供了一个出路,如果你买不起软件,你可以去租用软件,到阿里巴巴的网站上注册,付费很简单、只需要付一个月租费用就可以开始使用软件了,这对广大的中小企业来说是一个福音,就降低了他们使用软件的门槛。
吴炯:王涛先生讲得非常精彩,就把商业价值和经营模式讲得非常好,我从技术上补充一下。作为核心技术来讲,越来越多的公司特别是一些大型的公司,从Google开始做…到雅虎做…到微软技术开发他们的技术。从一个产品的技术角度来讲,不管是搜索还是广告,数据模式的竞争力是至关重要的,这是通过大规模的数据挖掘,必须要有很大的支撑。关键是我们怎么样把这样的技术不光对大公司有效,一般的公司也可以有用。
主持人:感谢两位精彩的分享,时间关系,大家一定有很多的问题,想跟我们的专家交流,我们进入提问环节,请举手示意。
提问1:今天讲了很多的搜索引擎,但是在互联网发展当中一个是语言问题,也一个不能回避的问题。现在有一些翻译的软件,但是他的作用不是很令人满意。在当前,关于这种翻译的软件有什么做法?将来有什么样的改进?
吴炯:我们在Oracle里购买了一种工具,他是用一种很庞大的字典,对语法进行分析。但是这个在互联网的应用受到限制,要用的资源消耗非常庞大,在互联网中这是非常困难的。有很多技术的瓶颈,效率的提高等问题也有待解决。现在我们在互联网上一些翻译的工具在,做一些即时的翻译。在这个领域里面,问题还是一样,怎么样教计算机像人类一样思考语言的含义,这是人工智能研究了很久的问题,现在有有待一个大的突破。人工智能这个领域已经有很多年的积累,但是计算机尽管发展到今天有这样的能力了,但是跟人脑相比还是有十万八千里的距离。我不是很乐观在短时间内有一个大突破。
吴炯:自动翻译是一个比较久的学识领域。大部分的方法是用语言模式,但是最近几年有希望可以看到突破性的发展,我们采用统计的方式。在互联网上其实可以找到同样的一段文章,大部分是一些新闻社。比如美国的路透社他发布了一个新闻会用十几种语言。最近几年,其实像雅虎、Google都有一些投资。最近互联网给大家带来了一个机会,如果有很多的数据,你把数据收集起来,放在一起做统计,可能有一个技术突破的可能。
提问2:我想问一个社会化搜索的问题。现在在中国或美国社会化的东西出现了很多。我想问什么时候搜索引擎的产品可以添加更多社会化的因素。这大概在搜索引擎有什么样的突破?
陆奇:对搜索或者对电子媒体,最近几年有大突破。我想是关键整个社会化的行为在网上社区必须达到一定水平。我们已经采用了一些技术,可以看到搜索的质量有提高,但是有质的提高,一般的用户进来搜索五个关键词就可以看到社会化和非社会化的区别。这个从我个人来看,可能要两到三年或更长的时间。第一代搜索引擎只是用传统的信息检索技术把网页抓取,等到Google等一些公司做第二代搜索引擎的时候是利用网页的相关性来做。所以整个社区化不是对搜索引擎,对媒体、电子商务都会起到一定的作用。
吴炯:把搜索和社区结合起来,我们已经看到了初步的结果,社区的利用对搜索引擎是一个非常好的补充,现在还是补充的阶段,未来可能是主体的阶段。实际上有很多的知识并不在书本上,不在网上,而是在很多人的头脑里,比如说购买的经验,或是旅游的经验,这个只在他的头脑里,但是如果你在网上发一些问题的话,就有一些人会把他的体验在网上写出来。这个反映在搜索引擎里就是非常有效的补充。
提问3:刚才我们所谈的都是基于文字的搜索,现在我们关于音乐、视频等搜索怎么做?我感觉未来的网页会趋向于流媒体了,这一蕾的出现对我们的文字搜索会带来一定的困难,那么将来我们对音频和视频的搜索除了文字上还有什么比较好的方式?
陆奇:我先讲一下我所知道的。这个问题是非常好的问题,互联网是越来越多媒体了,一开始是文字,而现在大部分是非文字了。那么搜索的时候需要不同的技术,很多互联网公司都有很多的技术。而目前图片的搜索还是基于文字,未来可能基于一些类似的图象来做。关于音乐搜索引擎也有了一些初步的工具研发。回到刚才这个主题,为什么互联网公司必须重视技术,为什么必须把技术作为核心力量,这就是很好的例子,像搜索音乐、图片、视频都需要很多的技术来解决。我们知道把各种各样的资源采集起来,在未来的几年里,我们会有更强的搜索能力,做更加有效的搜索方式。
吴炯:用声音做搜索,哼一段歌就可以把音乐找出来,这已经有一些公司在做了。
提问4:谢谢,我们公司是现在主要做音频的,我们考虑的多一些多媒体的信息靠文字做比较困难,而将来大家对音乐盒视频更多是欣赏,一定程度上会搜索,慢慢推荐会是一个趋势,比如个性化的。更多你不是在真正去搜,有时候我想听一个民谣,最近有一个歌手出了新的民谣,而搜索引擎的功能更强大了之后,会知道你的这个爱好,而来进行推荐。我们是做了一个音频指纹识别技术。
大家有兴趣可以来访问我们的网站。
提问5:刚才吴炯先生提到了搜索引擎精确度和智能化的问题,直接给了一个火车时刻表的例子,我觉得这里面可能存在一个矛盾,现在搜索引擎索引的方式是别的网站,这样来源网站提供了来源但是得不到回报了,这也是很多垂直引擎搜索面临的问题。
吴炯:这是一个很好的问题。怎么样对用户提供最好的搜索体验,你只有把这个用户的体验放到第一位,给他提供最好、最满意的服务,夺得了用户的眼球之后,才会有更好的发展。
如果你不给用户更好的体验,而是想怎么分割利益,那么用户就会流失到你的竞争对手那里。
现在主要的盈利模式是点击付费。而这个模式并不是一成不变的,可以有很多的利益分配的方法,比如一个信息提供商提供了天气的信息,火车时刻表的信息,他可以得到页面广告的百分比。或是他提供了火车时刻表,下面有一个购票,而他可以通过购票的交易来获得利润。这是我随便观望的,可能有这样一些方式。实际上,互联网上用户的心理也是一样的,希望循环越少越好。这是你成功的一个根本点。
主持人:今天的提问环节就到此结束了,今天上午的议程也就此告一段落了,感谢专家的分享,下午见。
原文/来源链接:http://info.china.alibaba.com/news/detail/v5003008-d1000265496-p4.html#newsdetail-content