介绍Facebook的Hadoop和AvatarNode集群方案
2020-12-31 14:26:11 阅读(172) 评论(0)
Facebook作为世界知名的社交网站,拥有3亿多活跃用户,其中约300万用户每天至少更新一次状态;用户每月上传10亿多张照片和1000万视频;每周共有10亿条内容,包括日志、链接、新闻、微博等。因此,Facebook需要存储和处理的数据量非常大。每天增加4TB压缩数据,扫描135TB大小数据,在集群中执行7500多项Hive任务,每小时计算8万次。因此,高性能云平台对Facebook非常重要,Facebook主要用于日志处理、推荐系统和数据仓库。Facebook将数据存储在由Hadop/Hive构建的数据仓库中。该数据仓库内核4800个,存储容量5.5PB。每个节点可以存储12TB大小的数据。同时,它还有两层网络拓扑。Facebook将数据存储在由Hadop/Hive构建的数据仓库中。该数据仓库有4800个核心和5.5PB存储容量。每个节点可以存储12TB大小的数据。同时,它还有两层网络拓扑。Facebook中的Mapreduce集群是动态变化的。它可以根据负载和集群节点之间的配置信息动态移动。Facebook数据仓库架构,在这个架构中,网络服务器和内部服务生成日志数据,Facebook使用开源日志收集系统,它可以在NFS服务器上存储数百个日志数据集,但大多数日志数据将复制到同一中心的HDFS实例,HDFS存储的数据将放置在使用Hive构建的数据仓库中。Hive提供类SQL语言,结合Mapreduce,创建并发布各种摘要和报告,并在其基础上进行历史分析。基于浏览器的Hive接口允许用户进行Hive查询。Oracle和MySQL数据库用于发布数据容量相对较小的摘要,但查询频率较高,需要实时响应。一些旧数据需要及时归档并存储在更便宜的存储器上。以下是Facebook在Avatarnode和调度策略方面所做的一些工作。AvatarNode主要用于HDFS的恢复和启动。如果HDFS崩溃,原始技术恢复首先需要10美元~读取12GB的文件镜像并在15分钟内写回,并使用20分钟~处理来自2000个Datanode的数据块报告30分钟,最后使用400分钟~NameNode和部署软件需要60分钟才能恢复崩溃。表3-1显示了Backupnode和Avatarnode的区别,Avatarnode作为普通Namenode启动,处理所有来自Datanode的消息。AvatarDatanode类似于Datanode,支持多线程和多主节点的多队列,但无法区分原始和备份。人工恢复使用Avatarshell命令行工具,Avatarshell执行恢复操作,更新Zookeper的znode,恢复过程对用户来说是透明的。现有文件系统的上层实现了分布式Avatar文件系统。基于位置的调度策略在实际应用中存在一些问题:如果需要高内存的任务可能分配给低内存的TaskTracker;有时候CPU资源没有得到充分利用;也很难配置不同硬件的TaskTracker。Facebook采用基于资源的调度策略,即公平享受调度方法,实时监控系统,收集CPU和内存的使用。调度器将分析实时内存消耗,然后公平分配任务之间的内存消耗。它读/读/读/读proc/目录分析过程树,收集过程树上所有CPU和内存的使用信息,然后在心跳中通过TaskCounters(heartbeat)发送信息。Hive用于Facebook的数据仓库,HDFS支持三种文件格式:文本文件(TextFile),其他应用程序读写方便;顺序文件(SequenceFile),只有Hadoop能读取并支持分块压缩;RCFile,根据块的存储方式,每个块按顺序存储,具有良好的压缩率和查询性能。未来Facebook将在Hive上进行改进,以支持索引、视图、子查询等新功能。现在Facebook使用Hadoop面临的挑战有:服务质量和隔离,大任务会影响集群性能;在安全性方面,如何处理软件漏洞导致NameNode事务日志崩溃;数据归档,如何选择归档数据,如何归档数据;性能提升,如何有效解决瓶颈。2004年,Mapreduce创建了Mapreduce,Mapreduce系统成功的原因之一是为编写需要大规模并行处理的代码提供了简单的编程模式。Mapreduce集群可以包括数千台并行操作的计算机。同时,Mapreduce允许程序员在如此庞大的集群中快速转换数据并执行数据。它受到Lisp函数编程特性和其他函数语言的启发。Mapreduce与云计算非常匹配。Mapreduce的关键特点是能够隐藏开发人员并行语义并行编程的具体工作模式。HDFS(HadoopDistributedFilesystem)它是专门为Mapreduce框架下的大规模分布式数据处理而设计的。HDFS可以将大数据集(TB级)存储为单个文件,而大多数文件系统没有这种能力。(编者:NTFS5MaxFilesonVolume:264bytes(16Exabytes)minus1KB,1EB=1,000,000TB)。这也是HDFS风靡全球的一个重要原因。目前,FacebookHadop集群中的HDFS物理磁盘空间承载着100多个PB数据(100多个集群分布在不同的数据中心)。优化HDFS已成为Facebook为用户提供高效可靠的服务的关键因素,因为HDFS存储Hadop应用程序需要处理的数据。HDFSNamenode是如何工作的?HDFS客户端通过被称为Namenode单服务器节点执行文件系统的原始数据操作。同时,Datanode将与其他Datanode进行通信,并复制数据块以实现冗余,使单个Datanode损坏不会导致集群数据丢失。但是NameNode失败的损失是无法容忍的。Namenode的主要职责是跟踪文件如何分割成文件块,文件块存储在哪些节点,分布式文件系统的整体运行状态是否正常。然而,如果NameNode节点停止运行,数据节点将无法通信,客户端将无法向HDFS读取和写入数据。事实上,这也将导致整个系统停止工作。TheHDFSNamenodeisasinglepointoffailure(SPOF)Facebook也知道“Facebook”Namenode-as-SPOF因此,Facebook希望建立一个系统来打破问题的严重性Namenode-as-SPOF"隐患。但在了解这个系统之前,让我们来看看Facebook在使用和部署HDFS时遇到了什么问题。Facebook数据仓库的使用在Facebook数据仓库中部署了最大的HDFS集群。数据仓库的使用是传统的Hadopmapreduce工作负载——由于集群非常大,一小部分Mapreduce批处理操作在大型集群中运行,客户端和许多Datanode节点和Namenode节点传输大量原始数据,这导致NameNode的负载非常重。来自CPU、内存、磁盘和网络带来的压力也使得NameNode在数据仓库集群中的高负载情况屡见不鲜。来自CPU、内存、磁盘和网络带来的压力也使得Namenode在数据仓库集群中的高负载情况屡见不鲜。Facebook在使用过程中发现,HDFS引起的故障占数据仓库总故障率的41%。HDFSNamenode是HDFS的重要组成部分,也是整个数据仓库的重要组成部分。虽然高可用的Namenode只能防止数据仓库10%的计划外停机,但消除Namenode对SPOF来说是一个重大胜利,因为这使得Facebook可以执行预订的硬件和软件回复。事实上,Facebook预计,如果Namenode能够消除集群50%的计划停机。那么高可用性NameNode是什么样子的呢?它将如何工作?让我们来看看高可用性NameNode的图表。在这种结构中,客户端可以与PrimaryNamenode和StandbyNamenode进行通信。同样,许多Datanode也有能力将Blockreports发送给PrimaryNamenode和StandbyNamenode。本质上,Facebook开发的Avatarnode是一种具有高可用性Namenode的解决方案。Avatarnode:为了解决单Namenode节点的设计缺陷,Facebook在大约两年前开始在内部使用Avatarnode。同时,Avatarnode提供了高可用性的Namenode、热故障切换和回滚功能。目前,Facebook已经为开源社区贡献了Avatarnode。AvatarNode经过无数次的测试和bug修复,已经在Facebook最大的Hadoop数据仓库中稳定运行。很大程度上要感谢Facebook工程师Dmytromolkov。发生故障时,AvatarNode的两个高可用NameNode节点可以手动转移故障。AvatarNode将现有的NameNode代码打包并放置在Zookeper层。Avatarnode的基本概念如下:1.拥有PrimaryNamenode和StandbyNamenode2。目前,Master主机名保存在Zokeper中。3.改进后的Datanode将blockeports发送到PrimaryNamenode和StandbyNamenode4。改进后的HDFS客户端将在每件事开始前检查Zokeper,如果失败会转移到另一件事上。同时,如果在写入过程中出现AvatarNode故障转移,AvatarNode机制将允许完整的数据写入。Avatarnode客户端Avatarnodedatanode有人可能会对Facebook的解决方案名称感到好奇,因为FacebokHadop工程师Dhrubabortakur来到公司时,正好是Jamescameron电影《阿凡达》的热播时间。(我们应该很高兴,如果是1998年,也许应该叫TitanicNode)。(我们应该很高兴,如果是1998年,可能叫Titanicnode)。Avatarnode经受住了Facebook内部最恶劣的工作环境,未来Facebook将继续大大提高Avatarnode的可靠性和HDFS集群的管理性。整合与一般高可用性框架的整合,也将实现无人值守、自动化和安全故障转移的特点。Facebook已将自己使用的Hadop和AvatarNode解决方案托管到GitHub。有兴趣的朋友可以下载研究。当然,不仅Facebook试图解决Hadop的缺陷,Mapr和Cloudera的产品也有类似的能力。
推荐阅读
- 2022最新清理垃圾软件 手机最强深度清理软件
我们的手机使用的时间长了多多少少会有一些垃圾出现,那么肯定是需要借助垃圾清理软件去清理的,这样的话才能保证手机的内存够用,如果你一直不清理的话,时间长了,堆积的垃圾越来越多,就会导致手机出现卡顿的现象。 1、系统优化大师 一…查看详情
- 一键去水印的APP有哪些?去水印好用的软件推荐
很多人特别喜欢拍照片或者是选择一些比较好的图片,这个时候如果图片上有水印就需要进行图片修理,如果想要去掉图片上的水印,那么也应该要选择一款专业的软件。有了软件之后就能够将图片上的水印更好的去除,打造出自己想要的图片效果。那么一键…查看详情
- java的特点是什么
java是什么文件格式?Java一般存在两种文件格式,如下: 1.*.java文件是保存源代码的文本文件(*代表类名)使用javac*.java可以编译该文件使用java*可以运行该类2.*.class是用于保存Java类的二进制编码以及…查看详情
- 作者许可他人版权登记,著作权归属为谁?
通常情况下,著作权一般都归原创作者。我国同时又实行著作权登记制度,谁登记谁就拥有对作品的使用权。那么若是作者许可他人版权登记,作品著作权应归谁所有呢? 图片来源于网络 作者许可他人版权登记,著作权归属如何确定? 首先,作者许可他人版权登记在…查看详情
- ems网点的优缺点总结大全
ems网点作为全国范围最广的快递网点,相信许多人都用它寄存过东西。作为中国速递行业的最大运营商和领导者,它能吸引人们的不仅仅是因为它的范围广阔,还由于它各处优于其它网点的特点,那么今天我们来分析一下ems网点的优缺点。…查看详情
- lrc是什么文件
LRC文件是什么意思?lrc是英文lyric(歌词)的缩写,被用做歌词文件的扩展名。以lrc为扩展名的歌词文件可以在各类数码播放器中同步显示。LRC歌词是一种包含着形式的“标签(tag)”的、基于纯文本的歌词专用格式。最早由郭祥祥先生(Dj…查看详情
- 好用的安卓锁屏软件 免费的安卓锁屏软件
现在越来越多的用户都比较喜欢追求个性化,很多的人都对自己手机的锁屏软件比较在意,下面万商云集小编就为大家分析5款好用的好用的安卓锁屏软件。 【Top.5】天天锁屏 网友点评:漂亮又赚钱的锁屏,还能下载DIY锁屏模板,制作属于自己的锁屏,…查看详情
- 7款免费收银软件系统排行
随着时代的进步,使用现金的年轻人越来越少,但更多的年轻人纷纷开始使用了在线支付。不仅省去了找零钱的麻烦又省去收到假钱的麻烦。那么我给大家推荐7款实用又免费的收银系统软件如下。 1中国移动云pos收银台 中国移动云pos收银台是中国移动面向手…查看详情
- 企业网站建设的功能需求和性能要求
互联网技术在发展,人们对技术的依赖和需求也越来越强,企业在网站建设上的投入也越来越大,对于网站建设功能的要求也越加严格和完善,当网站需要进行功能拓展的时候,就需要整合主站、分站和其它内外网的工作,这样的拓展工作是很花费时间和人力的。也容易让…查看详情
- fprintf函数的用法matlab
matlab中的fprintf('y[%2.0f]=%12.6f'?1、首先,fprintf如果没指定文件句柄,则直接在屏幕上输出。 2、格式字符串中,其它内容都是原样输出,只有百分号后面的内容是要转换的,%2.0f表示要…查看详情
- 知识产权服务机构进行项目评估的实施流程
知识产权评估是指知识产权服务机构的注册资产评估师依据相关法律、法规和资产评估准则,对知识产权评估对象在评估基准日特定目的下的知识产权价值进行分析、估算并发表专业意见的行为和过程。知识产权评估中所涉及的知识产权内容比较多,一般主要对商标权、专…查看详情
- 几款免费在线观看电视软件,好剧再也不错过
看电视可以直接在电视上看,还可以在手机上看,不过现在大多数人都会在手机上看,而且方便,不需要准时准点,随时都可以看,那么,关于看电视软件都有哪些,许多人还不知道。 1、腾讯视频 腾讯视频是腾讯公司旗下的视频在线观看产品,定位…查看详情
- 免费好用的安卓模拟器有哪些 安卓模拟器排行榜
对于android开发者来说,模拟器是开发工具,但是对用户来说,可能就是薅羊毛、找漏洞的赚钱工具。不管是活动风控还是内容保护等等其他的出发点,应要求可能会要识别Android模拟器,甚至禁止模拟器登录或后续操作。但是对于用户来说很多的模…查看详情
- 来电显示软件苹果 苹果手机来电提醒软件
现在很多的用户都喜欢在手机里装来电显示软件,下面万商云集小编就为大家详细介绍下来电显示软件的相关内容、。Callkit是很多朋友期待已久的一个功能,目前iOS版微信和QQ 都已处于内测阶段,引发大量用户的关注。不过,还有很多人对Call…查看详情
- 版权登记补贴 | 成都、武汉、深圳等各地奖励政策都不相同
登记版权可以保护版权人的权利免受损失,无论是对企业还是个人来说,它都是应该值得重视的问题。如今,各地政府都有版权登记补贴,相当于自己进行版权登记无需任何花费,只是具体的政策各地都有不同。 图片来源于网络 各地版权登记补贴政策如下: ▼ 成…查看详情
猜你喜欢
最新文章
扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121
关注微信公众号
和10万中小企业共同成长
扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有 蜀ICP备12001963号-2 川公网安备 51010402000322号
快速找产品
找一找哪款产品适合您?
咨询热线:400-0033-166
免费查找信息保护中请放心填写-
-
电话沟通
在线咨询
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达
关注万商云集
和10万中小企共成长
TOP
企业首选的数字选用平台