Google vs. Twitter:实时搜索

来源:百度文库 编辑:神马文学网 时间:2024/04/24 21:11:52


最近 Twitter 可以说是互联网上最热的话题之一了,甚至已经超过了 Facebook。TechCrunch之前有文章解释了为什么会反复的讨论有关 Twitter 的话题,这其中有讨论 Twitter 本身的,有讨论 Twitter 和Facebook 的,有讨论 Twitter 如何盈利的,另外,还有相当一部分的讨论是关于 Twitter 中的实时搜索(Real-timeSearch)功能的。

Twitter 中的实时搜索功能原本是一家名为 Summize 的公司提供的,Twitter 于去年7月收购了这家公司。

我看到的第一篇讨论 Twitter 中的实时搜索和 Google 的关系的文章应该是 John Battelle 在去年十二月他的博客上发表的“Google 为何要担心 Twitter 的威胁”。他在另一篇文章“从静态搜索到实时搜索”里表示:

. . .第一次,你可以用自己的母语问一个问题,并且获得答案。感觉很快,但是如果算上 Google收集这些搜索结果的时间的话,那就不快了. . .当你使用 Google 搜索的时候,你能获得大众的智慧 -但你获得的东西是在他们经过了被说出,编辑到 HTML 语言形式,发布到网上,然后被搜索引擎收录,储存在 Google里这一系列行为之后的。诚然,Google 对很多网站每天都回去抓取好几次 - 但是对于刚刚发生的事,这种搜索的方法是无法及时收录的。

本月初,Summize 的投资者(现在自然也是 Twitter 的投资者)John Borthwick 在自己的博客上表示 “Twitter 搜索改变了一切”:

想想如果你在排队等咖啡,听说有飞机在哈德逊坠湖了。你打开 Google 搜索“飞机 哈德逊” - 今天 -几周以后,Google 上面会有有关这起事故的详细信息 - 但是就在事故发生的当时,人们在 Google上无法找到任何相关信息。但是,如果你打开 Twitter 的搜索页面 http://search.twitter.com 的话,你会发现这些信息都在你眼前。当然,实时搜索在其他话题上也适用 - 给猪涂唇膏?-对于那些实时的话题,实时的品牌分析,实时了解新产品发布情况 - 如果你想知道任何现在正在发生的事情,在 search.twitter.com 进行搜索会得到最好的结果。

可以看出,在搜索领域,Google 和 Twitter 是完全不一样的 - 这是因为他们对搜索结果相关性的判断不一样,Google 更看重链接和反向链接,而 Twitter 更看重“时间”。


图片:据 Search Engine Land 报道,Twitter 正在测试在首页加入搜索框

那么实时搜索有多重要呢?

TechCrunch 发表了一篇题为“开发思想流(Mining The Thought Stream)”的文章讨论了这个问题。Google 和其他搜索引擎的重要之处在于,从他们的数据库可以了解人们在寻找什么,想要什么,想学什么,但是如果想知道人们正在做什么,正在想什么,这些传统的搜索引擎无法做到。

Twitter 为提供了一个现在人们正在做什么,想什么的数据库,而 Twitter 中的搜索 - 即搜索现在的一个搜索引擎 -则能方便人们利用开发这个数据库。这个数据库随着 Twitter 的流行会越来越大也越来越有价值,从而这个实时搜索也会显得越来越有价值。

其实“现在”这个概念在搜索领域一直非常重要,而 Google 的成功也和“现在”密不可分 - 那就是 GoogleAdWards。Google AdWards 会显示和用户“正在”搜索的关键词相关的广告 - 而用户“正在”搜索的往往就是他们脑子里正在想的- 因此广告的效果会非常好。另外,Google 热榜(GoogleTrends)也部分体现了“现在”这个概念,现在人们最关注、搜索最多的是什么,这些关键词就会登上 Google 热榜 -但这仍不可避免的会有一段时间的延迟。一个例子就是前些天卡巴斯基对使用非法的激活码的卡巴斯基软件进行了封号,Google 热榜上一下子涌出了大量的卡巴斯基 key、破解版等关键词。但是卡巴斯基封号是在傍晚就开始了(我寝室的人也受到了影响),而直到深夜才在 Google 热榜上有所体现。

图片:Google 其实也已经在收录速度及时间的相关性上下了很大的功夫

TechCrunch表示,现在 Twitter 的实时搜索还不是很完善,他只是按照时间倒序把含有那个关键词的结果列了出来,没有任何过滤和分类整理。如果Twitter 想要更好的利用这个数据库的话,应该很好的区分有用的搜索结果和噪音(这也是 Summize 曾计划要做的),比如根据Follower 的数量,retweets 的数量或者其他进行一定的过滤整理。如果 Twitter在这方面做不好的话,肯定会有别人来做,并且如果做的好的话,肯定能 - 而我想,Google 做了十年的搜索,肯定是拥有这方面强大技术的。

那么 Google 应该怎么做呢?我觉得总结起来有三个方法:一,自己做一个实时搜索引擎;二,收购 Twitter;三,和 Twitter 合作。

Google 已经有了博客搜索和新闻搜索,这两个搜索都有自己的特点,并且都具有一定的实时性。所以从技术上来说,Google应该有能力做一个实时搜索引擎,并且可以做的比 Twitter 更好。但是 Twitter的实时搜索很大程度上得益于自己强大的实时内容数据库,就算 Google 实时搜索做的好,其中大部分内容还是来自于Twitter,那人们还不如直接去 Twitter 搜索 - 这有点类似与 YouTube - YouTube 现在已经超过雅虎成为了美国第二大搜索引擎,虽然 Google Video 是专业的视频搜索,但由于收录的大部分内容都来自 YouTube,所以人们还是更倾向于直接进入 YouTube 来搜索视频。

Google 收购 Twitter 看起来是最为轻松的方法,只要出钱就可以了。但是别忘了,Google 已经收购了 Twitter的竞争对手 Jaiku,但是却停止了开发。而且Twitter 之前曾拒绝过 Facebook的高价搜索,并且刚刚获得了3500万美元的投资,Twitter 并不缺钱。有人把搜索 Twitter 和收购 YouTube相比较,的确这两个产品都是市场的绝对领先者 - 但是,这两个产品目前都没有找到很好的盈利途径。并且在实时搜索里插入 AdSense并不会有特别好想效果,因为人们进行实时搜索和在 Google.com 上面进行的搜索的目的是不一样的。

我认为和 Twitter 合作是最好的方法。Google 在搜索方面能提供强大的技术保证,而 Twitter则能很好的充当实时数据库的角色,其他的微博客服务的数据几乎可以忽略不计(仅限英语/日语范围,暂不讨论国际化)。这样对 Google 和Twitter 来说都有好处,因为他们都只需做好自己最擅长的工作。Twitter 的投资者 Todd Chaffee 也表示,如果Google 聪明的话,应该和 Twitter 合作,把 Twitter 当成实时搜索的信息源。