用户名: 密码: 注册
搜索   
收藏本站 设为主页
首页
新闻 供求 报价 技术 下载 商家 商城 博客
论坛
新品上市 行业动态 技术前沿 产品评测
首页 > 新闻频道 > 技术前沿 > 浏览新闻 关键字: Google  海量数据   
Google目前每天要处理20PB的海量数据  
2008-1-11 0:36:12  编辑:Equal Null  来源:中华服务器网   点击:1971次    加入收藏夹

     Google现在通过在巨大的服务器群集上运行平均100,000个MapReduc任务,来每天处理超过20PB的数据。在2007年9月,一个普通的MapReduce任务运行在大约400台服务器上,一个月大约运行11,000服务器。这些是在Google员工Jeffrey Dean 和 Sanjay Ghemawat一篇ACM论文上透露出搜索巨人的计算处理架构。

按此在新窗口浏览图片


   每天20PT(20,000TB)是一个恐怖巨大的数据处理数量,也成为了Google一直延续着市场优势的关键。竞争对手微软(Dyrad)和 雅虎(Hadoop) 的搜索存储和处理系统
正在后面苦力的追着Google的GFS,MapReduce和BigTable。

   Google一个标准的机器群集节点(node)是由2个2GHz Intel至强处理器(超线程),4GB内存,2个160GB IDE硬盘和1个千兆网络连接组成。这种类型的机器成本通过Penguin Computing或Dell厂商大约每台$2400元。

   一个普通的MapReduce任务jobs运行在价值$100万的硬件群集上,还不包括带宽费用,数据中心费用及人力。

   概要

   2008年1月的MapReduce论文为我们对Google的硬件和软件处理每天上10PB的数据提供了新视觉。
Google在2003年将它的搜索索引系统转换为MapReduce系统,并且现在每天除了超过20PB的原始
网页数据。它的吸引人的超大扩展能力,处理着让你头晕的海量数据,和优越性能的分布式计算让Google轻松的应对着当今日益增长Web海量数据处理的大难题。

(the end)

上一条新闻: IBM筹划15年来最大规模的重组
下一条新闻: Sun10亿并购MySQL数据库

 
新闻查找 
  按标题 按全文
Advertisement
最近头条
· 思科年度大会宣布进军绿...
· 传百度因服务器硬盘大量...
· 周伟焜:Internet上IBM驾...
· IBM公布世界最快计算机技...
· 恒盛新锐联合IBM在深圳发...
· 联想工程师与海拔最高IT...
最新供求
· IBM 服务器/RS6000系列4...
· PowerEdge 700, 800 托架...
· HP Compaq HP9000 托架
· IBM x206, x226 托架
· IBM 2.5 SCSI SAS Hard...
· Dell PowerEdge 1900 托...
最新技术
· 安装和配置IBM刀片服务器...
· 如何恢复IBM存储服务器的...
· IBM x3850M2/3950M2服务...
· HP 9000小型机上Unix 11...
· HP 9000小型机中卷的建立...
· IBM磁带加密PoC测试方案...
       

关于我们 法律声明 广告服务 友情链接 联系我们
版权所有:中华服务器网©2001-2008
粤ICP备05008160号 由深圳市七乘二四信息技术有限公司提供技术支持。
 客 服
 客 服
 投 诉