图说Google数据中心-月光博客

来源:百度文库 编辑:神马文学网 时间:2024/04/28 17:41:27

图说Google数据中心

  Google数据中心一直是业界中令人着迷的“对象”之一。Google这个搜索巨人很少暴露其数据中心,那么Google到底有多少数据中心?它们分布在什么地方?笔者整理收集一些有趣信息,以供分享和参考。

  Google数据中心分布图

  Google 搜索速度为什么能这么快?这主要因为Google在全球分布着众多的数据中心。根据现有信息,如果包括在建的数据中心,Google共有36个数据中心。其中美国有19个、欧洲12个、俄罗斯1个、南美1个和亚洲3个(北京-Google.cn、香港-Google.com.hk和东京各1个)。不过,Google也并非完全独享这些数据中心,他们也向其他公司出租空间。

图1:Google数据中心-全球

图2:Google数据中心-北美

图3:Google数据中心-欧洲

  Google的第一个“数据中心”

图4:Google的第一个“数据中心”——BackRub

  Google 的首个“数据中心”是在佩恩的宿舍楼。一句话概括:麻雀虽小,五脏俱全。详细配置请看《成名之前的Google:斯坦福大学期间的Backrub原貌

  数据中心的服务器

  大部分公司都是向Dell、HP、IBM和SUN厂商直接购买服务器。购买服务器需要一大笔费用,如果 Google的服务器均从其他公司购买,估计Google也无法有今天。时至今日,Google的所有服务器均为自己一手打造。Google服务器厚度 3.5寸,2U(两机柜式),它有2个CPU、2个硬盘,采用技嘉主板,有8个内存插槽。Google采用AMD与英特尔的x86处理器。在同样大的空间 内,Google的服务器比其他厂商的服务器能容纳更多的CPU.

图5-1:Google服务器

图5-2:“世纪互联”机房中谷歌的一组服务器(DELL Precision 390 工作站)

  数据中心以集装箱为单位,每个集装箱里面有1160台服务器,每个数据中心有众多集装箱。

  数据中心的核心技术

  Google一直都钟情于开源软件,也一直支持开源技术 (Google对手之一的Facebook也同样重视开源技术)。Google服务器使用的是Linux操作系统。Google的工程师按照平行计算的要 求对Linux进行了优化。Google开发自有核心软件,开发语言是Java和C++。

  Google的三大核心元素:

  1、Google文件系统(GFS);(GFS负责服务器数据储存工作)

  2、Google大表;Bigtable:是Google一种对于半结构化数据进行 分布存储与访问的接口或服务);由于Google的文件系统异常庞大,以至于甲骨文和IBM公司的商业数据库在方面无用武之地。另外,商业数据库都是按 CPU数量来收费,如果Google使用商业数据库,可想而知,这是一笔天文数字。所以,Google量体裁衣地设计了符合自身的大表。

  3、Mapreduce 算法;它是Google开发的C++编程工具,用于大于1TB数据的大规模数据集并行运算。MapReduce能够找出一个词语在Google搜索目录中 出现的次数;一系列网页中特定词语出现的频率;链接到某个特定网站的所有网站数量等。

  虽然Google依靠许多开源项目实现了企业的腾飞,但Google始终对这三大核心元素保密。

  数据中心的专利

  1、服务器内置电池。 每台服务器都有一颗12伏特电,确保万一主断源断电时还可持续供电。最终目的,节约成本。

  2、可移动的数据中心集装箱。2008年10月获得该项专利,每个集装箱中最多可容纳1160台服务器。

  数据中心的开销

  根据Google的盈利报告,2006年Google在数据中心上的开销是19亿美元,2007年是24 亿,2008年23.6亿,2009年8亿9百万,2010年上半年已开销7亿1千5百万。

图7:Google数据中心“烧钱”曲线图

  数据中心的选址标准

  1、大量的廉价电力;

  2、绿色能源,更注重可再生能源;

  3、靠近河流或湖泊;(设备冷却需要大量水源)

  4、用地广阔;(隐秘性和安全性)

  5、和其他数据中心的距离;(数据中心之间的快速链接)

  6、税收优惠。

图8:Google的服务器(左)Google俄勒冈州Dalles数据中心(中)Google服务器机柜特写(右)

  Google的特殊数据中心——圣吉兰数据中心

  Google在比利时的圣吉兰(Saint Ghislain)数据中心(图3中编号26)根本没有冷却装置,完全依靠纯自然冷却(即:用数据中心外面的新鲜空气来支持冷却系统)。一般来说,绝大部分数据中心都是采用水冷却装置。(这也就是为什么数据中心选址时要考虑水源。)

图9:Google比利时数据中心

图10:比利时国王(左五)参观Google比利时数据中心

  Google的Dalles(达尔斯)数据中心

  Dalles数据中心(图2中编号8)位于俄勒冈州的波特兰以东约80英里,旁边是哥伦比亚河,河上有座大坝——Dalles大坝,大坝为数据中心提供便宜的电力。数据中心有2座4层楼高的冷却塔。(注:“Dalles”不是“Dallas”,Dallas达拉斯在德州。)

图11:Dalles数据中心鸟瞰图

  以下这段话来自Nicholasg Carr,他曾经在2009年访问Dalles数据中。括号部分是笔者的注释。

  Dalles数据中心有3个超大机房(在图11中有4个白色建筑,但只有3个是服务器机房),每个机房有45个集装箱,每个集装箱可以放置1160台服务器,故Dalles数据中心可以存放约15万台服务器。

  Google的秘密

  Google在其数据中心的位置和数量方面的保密工作做得很好。比如说:如果你反查Google各种爬虫或者是Google各个域名的IP地址,所得结果几乎看起来都是加州山景城的IP地址。因此,想通过反查IP地址,基本无法推断出其数据中心的真正位置和真正数量。

  此外,Google通常把其数据中心“伪装”成有限责任公司, 表明上看起来和Google毫无瓜葛。比如:北卡罗来纳州Lapis公司和爱荷华州的Tetra公司。

  既然Google在其数据中心方面的保密工作做得很出色,所以本文的信息未必是百分百正确。

  其他相关旧闻

  2008年1月28日有报道称,Google将在TW建立一数据中心。TW经济负责人陈瑞隆已确认此消息,并且表示已在TW西部彰化的彰滨工业区内为Google预算了一块地。TW还将向 Google提供各种优待,包括土地税折扣、保证电力供应稳定在内。不过至今一直没有听到这个数据中心在台的任何动静。

  在陈瑞隆确认消息 后的第二天,马来西亚总理也宣布,Google有意在马来西亚建立数据中心。

  另据报道,Google有意在东欧的立陶宛新建数据中心。

  另外,Google曾于2007年在南卡罗来纳州的布利西伍德购买466英亩(1英亩约合4000平方米)土地,似乎是打算建立南卡的第二个数据中心。

  来源:伯乐在线投稿,原文地址



原创文章如转载,请注明:转载自月光博客 [ http://www.williamlong.info/ ]

本文链接地址:http://www.williamlong.info/archives/2300.html
  • 相关文章:
  • 对未来Google搜索技术的深度分析

    没有Google的世界会是怎样

    Google Buzz推出转发功能、全平台移动版和API

    Google Buzz:机器人的世界

    Google推出动物语言翻译

    Google Buzz高级使用技巧

    Google Buzz的试用体验

    Google发布Gmail微博客Google Buzz

    Google推出免费DNS服务

    Google热门服务一览

    用户起诉Google恶意软件提示被驳回

    Google宣布将推出电脑操作系统

    Google国际网站遭到域名劫持

    Google Profiles可使用自定义地址

    Google是寄生虫吗——反思传统媒体与网络媒体之争

    谷歌软件精选的替代品

    Google关闭视频、记事本等多项服务

    Google Social Graph API智能寻找链接

    从Google的服务中导出数据

    Google Lively虚拟现实世界使用技巧

    Google Ad Planner初体验

    使用Google Gears的网站应用列表

    Google今天9岁啦

    Google告诉你现在几点钟

    访问Google被劫持的解决办法

    Google取代微软成最具价值品牌

    Google的世界地球日

    Google的愚人节玩笑

    Google网站导航发布

    Google的收购扩张史