Google 黑板报 -- 社区 —— 下一代互联网个性化...

来源:百度文库 编辑:神马文学网 时间:2024/04/28 11:40:26
2007年8月20日 下午 02:56:00
发表者:Google(谷歌)中国研究院副院长 张智威
(本文综述了搜索引擎的历史,并包括了谷歌中国为了支持下一代智能搜索所做出的努力)
门户网站,作为互联网第一代高速公路,将网上信息以类似图书馆的形式整理起来。在最初的门户网站中找寻信息,用户通常需要多次点击才能找到答案。举一个在北京机场附近找别克经销商的例子。用户需要打开一个个类似这样的树状分支:汽车->别克->经销商->北京,然后再查看在北京机场附近是否有这样的经销商。所以搜索引擎的迅速崛起正是因为搜索引擎仅需一次点击即可更快速地找到相关信息,大大提升了用户使用的效率。
早期的搜索引擎技术是基于传统的信息采集模型,依靠词频来排序。Google(谷歌)通过引入 Pagerank 机制,引发了搜索引擎的变革:一个网页如果被多个重要页面引用,那么它在搜索结果中将有较高排名。但是,至今仍没有搜索引擎能够真正的将个人偏好引入到排名体系中。为了将用户使用习惯引入排名标准,下一代搜索引擎必须研究、学习每位用户的真实信息,将这些信息转化为可扫描的模型,并利用这些信息来协助搜索。不幸的是,个性化搜索面临至少两大技术上的挑战:首先,个人资料经常缺失或准确性较低;其次,相对于互联网中的信息,收集到的用户信息太少了,以至于我们无法有效的处理数据。也正是因为这些原因,个性化搜索已经被讨论了很多年,但至今仍未见到一个卓有成效的解决方案。
有趣的是,近年来,“上网社交”成为互联网发展的又一热潮,这一变化给个性化搜索带来新的曙光。用户们不仅可以上网查找信息,而且也会在不同程度上参与网络社交活动(打牌、聊天、购物或者约会等等)。我们可以通过他们的行为很好的了解用户。例如,一个经常和大学生交流的用户很有可能就是一位大学生。同理,经常光顾迪斯尼企鹅俱乐部网站的很可能是孩子。当前,以下技术难题很具有挑战性:
1. 如何根据大量的网络活动信息了解用户;
2. 如何在保护个人隐私的同时利用收集到的信息去支持个性化服务。
与天涯合作的谷歌社区产品上线,使谷歌向建立支持个性化服务的下一代互联网搜索迈出了的重要一步。在今年年初新成立的谷歌研究院,作为重点研究方向之一,我们已经研发了几个并行算法来发掘海量的数据,以及在保护隐私的前提下,检测垃圾信息。当然,虽然这些优点无法立刻在我们的社区产品中得到体现,但是我们的平行算法将很快在根据用户匹配个性化的搜索结果方面发挥强大威力。
经常访问谷歌的网站,您将会了解我们这个宏伟的计划。
欢迎试用天涯问答:http://wenda.tianya.cn/
天涯来吧:http://laiba.tianya.cn/