Google 官方宣布新的网页索引系统

来源:百度文库 编辑:神马文学网 时间:2024/04/27 16:48:15

谷奥: Google 官方宣布新的网页索引系统 Caffeine阅读原文

尽管我们在去年8月就知道Google要上马Caffeine网页索引系统了,但是Google官方今天才正式宣布。Caffeine系统可提供比以前多一半的新的索引结果,也就是说Google可以收集到比以前... 全文↓ 来自:(author unknown)

尽管我们在去年8月就知道Google要上马Caffeine网页索引系统了,但是Google官方今天才正式宣布。Caffeine系统可提供比以前多一半的新的索引结果,也就是说Google可以收集到比以前更多的信息,而且Caffeine的索引速度比以前更快,它也是Google实时搜索可以实现的重要元素。

实际上当你在Google进行搜索的时候,Google并不是在做实时搜索,而是搜索Google之前已经索引到的存放在数据库里的内容,随着网络的进化,内容极大的丰富,不仅是数量上的增加,还包括更丰富的形式,比如视频、图片、新闻、实时更新等等,而且人们对搜索引擎的期待越来越高,他们希望找到最新的最相关的信息,内容发布商则希望他们前脚发出的内容,后脚就可以在Google搜索到。

为了赶上网络的进化和人们的期望,Google祭出了Caffeine,上图显示了老式索引系统和Caffeine索引系统的区别。老系统有多个层,一些是最新的内容而其它则是较老的内容,但大多数的层需要几周才会更新一次。为了更新一个老的索引层,Google需要重新将整个网络分析一遍才可以,所以不能保证让你看到最新的内容。

而有了Caffeine,Google可以在很短的周期里就分析一遍网络,并更新索引库。而且Google可以做到只要一发现新的网页、网页里新的信息就立即将它们加入到索引库里,它们立刻就会被你搜索到。

Google还透露说,Caffeine每一秒可以并行处理成百上千个页面,如果将这些网页都打印出来,堆在一起能达到3英里厚。Caffeine每天会在单个数据库里增加将近1亿GB的新数据,你需要62万5千个最大的iPod才能存的下这些信息,如果将这些iPod连起来能排出40英里。

Via Google Blog


musiXboy 发表于 谷奥——探寻谷歌的奥秘 ( http://www.google.org.cn ), 2010. | 9 条评论 | 永久链接 | 关于谷奥 | 投稿/爆料
Post tags: Caffeine, Google Search, Real Time Search
欢迎订阅谷安子站,关注Android新闻,技巧及更多