李开复:希望做完整的搜索引擎(《财经》 2009-7-20)

来源:百度文库 编辑:神马文学网 时间:2024/04/27 18:18:16

李开复:希望做完整的搜索引擎

本文见《财经》杂志 2009年第15期 出版日期2009年07月20日  共有 6 条点评 字号: “无论在任何国家,我们都希望在不触犯法律的前提下,给用户更多的选择”
《财经》记者 明叔亮
相关新闻:
  • 谷歌“消毒”
 

  6月18日之前,谷歌中国正见起色。搜索市场份额第一次出现提升,新产品如地图搜索、移动搜索、MP3搜索等产品也相继推出,针对中国市场的产品线逐步丰富,与竞争对手相比不再那么单薄。按照李开复的计划,接下来将是谷歌开始发力的阶段。但是,这场风暴多少打乱了李开复的步伐。

  6月30日,谷歌全球副总裁兼大中华区总裁李开复接受了《财经》记者采访。采访在李开复位于北四环外的家中进行。由于刚刚完成手术,李开复回答问题时,大部分时间只能躺在沙发上。

  《财经》:6月18日之后,对于谷歌网络搜索含有低俗信息的争议一直在持续。你对此事是怎么看的?

  李开复:无论在任何国家,我们都希望在不触犯法律的前提下,给用户更多的选择。在任何一个领域里搜索,我们都希望给用户提供的结果是最全面的,我们的使命就是整合全球的信息。

  处理互联网色情的内容难度很高。第一,对于色情内容的界定缺乏统一的标准。仅仅通过搜索引擎公司自行设定关键词或bad URL,由于人力、脑力限定,不可能做干净。第二,色情网站使用很多技术,在其网站被搜索引擎屏蔽时,自动跳转到新生的URL,防不胜防。

  在这个问题上,我们是花了很大的精力的,在此问题上的投入只会比其他公司更多。谷歌在全球共抓取几千亿个网页,我们的原则是在人工辅助的基础上,尽量使用技术来实现过滤。因为如果光用人工过滤数千亿个网页,假如我们雇佣1万人,每人每天审核5000个网页,十年才能做完。我们不可能雇这么多人去这么做。

 

  《财经》:怎样从技术上去实现?谷歌做了哪些工作?

  李开复:从十天前到现在(注:6月30日),还是做了不少工作。我们的工程师已做了一个“机器学习”系统,能够根据网页上的文字还有用户的使用习惯,挑出“可能是黄色网站”的网站,再经过人工审核,来过滤黄色网站信息。这样,我们的编辑不必看几千亿个网站,只要看我们机器挑出的100多万个网页就可以了。今天,谷歌能搜到的黄色内容已经比其他搜索引擎少很多了,半个月之后会少更多。

  上面提出的技术对文字网页很有用,但是图片不是机器能够精确辨识的,虽然我们也有图片的“机器学习”。我们想了一个办法,正在做一个网民举报系统,当网民看到了不合适的图片之后,点击举报。一张图片,如果被多次举报,就会进入我们人工审核筛选的流程。这个技术一两周之内就会上线。

  最后,针对青少年上网的人群,我们在探索是否有可能做一个专门的搜索引擎,但是有一定的难度,还在评估中。

  《财经》:谷歌一直坚持减少人工干预的价值观,谷歌总部对谷歌中国实行这样的过滤机制是否认可?

  李开复:我们希望做一个既合法、又完整的搜索引擎。这一点,谷歌总部是有共识的。

  《财经》:联想词机制当中所出现的那些低俗内容,是谷歌刻意为了流量所做的吗?

  李开复:当然不是。联想词是根据用户的搜索频率产生的。大家常搜什么,什么就会出现在联想词里面。我们确实可以审查得更好,但这个问题确实不是流量驱动造成的。

 

  《财经》:6月24日晚上,Google.com的服务出现了中断,此次事件是否会动摇谷歌对在中国市场持续发展的信心?

  李开复:不会。谷歌的承诺没有改变。另外,我补充一下,谷歌中国的Google.cn服务并没有中断。我们在中国的Google.cn服务一直非常稳定。

  《财经》:此事发生之后,是否意味着中国市场经营的难度会加大?

  李开复:应该是。任何一个企业都会碰到这样或那样的挑战,我们不会逃避今天面对的挑战,这个时候,更需要的就是耐心、信心和决心。

  《财经》:除了做品牌推广,你从总部争取来的资源还会用到哪些方面?

  李开复:品牌和合作可能是主要的两个方面,其他还有投资、收购,我们希望有更多合作伙伴。基于Android平台的手机,例如在美国已经发布的G1这样的手机可能是爆发成长的产品,这可能会接触到一批新的网民。过去没有用PC上网的人,也许上网第一次是用Android。■

  http://magazine.caijing.com.cn/templates/inc/chargecontent2.jsp?id=110199963&time=2009-07-20&cl=106&page=all