分析美团的Ursa分布式存储系统
2020-12-30 13:39:48 阅读(260) 评论(0)
1.Ursa云硬盘在IaaS云计算平台中起着至关重要的作用,几乎已经成为亚马逊EBS等必备组件(ElasticBlockStore)、盘古、OpenStack中的Cinder等阿里云。云硬盘可以为云计算平台带来更高的数据可靠性和可用性、灵活的数据快照功能、更好的虚拟机动态迁移支持、更短的主机故障恢复时间等诸多优秀特性。随着万兆以太网的逐渐普及,云硬盘的优势得到了加强和突出,其必要性变得非常强。云硬盘的底层通常是分布式块存储系统。目前,CephRBD等开源领域也有一些这样的项目、Sheepdog。此外,虽然MooseFS和GlusterFS被称为文件系统,但它们也可以用来支持云硬盘,因为它们的特性接近块存储系统。在评估中,我们发现这些开源项目存在一些问题,使其难以直接应用于大规模生产系统。比如CephRBD效率低(CPU使用过高);Sheepdog在压力测试中丢失数据;Mosefs的POSIX语义支持、基于FUSE的架构、不完全开源的2.0版本等问题给其自身带来了诸多局限性;GlusterFS和Ceph属于红帽收购的开源存储系统,主要用于scale-out文件存储场景,在云计算领域使用不多。此外,这些存储系统在未来很难充分发挥万兆网卡和SSD的性能潜力。此外,这些存储系统很难充分发挥万兆网卡和SSD的性能潜力,也很难在未来承担沉重的责任。由于上述原因,美团云开发了一种新的分布式块存储系统Ursa,通过简单稳定的系统架构、高效的代码实现和仔细考虑各种非典型场景,实现了高可靠性、高可用性、高性能、低成本、可扩展性、易操作维护、易维护等目标。Ursa的名字起源于Dota中的熊战士,他具有很高的攻击速度、攻击力和生命值,分别隐喻存储系统中的IOPS、吞吐量和稳定性。2.1分布式块存储相关项目及技术Ceph(主要参考:https://www.ustack.com/blog/ceph_infra/)Ceph项目起源于其创始人Sageweil在加州大学SantaCruz分校攻读博士学位期间的研究课题。该项目于2004年开始。Sage在2006年的OSDI学术会议上发表了关于Ceph的论文,并提供了项目的下载链接,因此开始广为人知。2010年,Ceph客户端部分代码正式进入Linuxkernel2.6.34。Ceph还提供三个层次的分布式存储服务:对象、块和文件,其中只有块层存储与我们有关。由于块存储在IaaS云计算系统中占有重要地位,近年来Ceph的关注度显著提高。许多基于Ceph的云计算系统实例提供块存储服务,如UnitedStack、MirantisopenStack等。ceph性能测试测试版:0.81操作系统:centos6.x测试工具:fio服务器配置:CPU:IntelXeone5-2650v2@2.6GHzRAM:96GBNIC:10GbeHDD:6NLSAS,7200RPMRAIDController:DellH710p(LSI2208with1GBNVRAM)服务器数量:4。其中一个是兼职客户端。注意:由于客户端位于存储服务器上,四分之一的吞吐率不通过网卡。测试结果如下:读IOPS:16407(此时客户端CPU占用率超过500%,5台服务器CPU的总利用率接近500%。写IOPS:941顺序读吞吐率:21859KB/s顺序写吞吐率:67242KB/s顺序读延迟:1.6ms(664IOPS)顺序写延迟:4.4ms(225IOPS)网络ping值:0.1324ms本地硬盘顺序读写延迟:0.03332ms(29126IOPS)从测试角度看。Ceph阅读吞吐率正常,但吞吐率低于阅读的1/3,性能低;读写延迟率明显大于网络延迟和磁盘I/O延迟之和;CPU占用率太高。2.2Sheepdog(主要参考:http://peterylh.blog.163.com/blog/static/12033201221594937257/)Sheepdog是日本NTT实验室Moritakazutaka为虚拟化平台创建的分布式块存储开源项目,2009年开源[1]。自2011年9月以来,一些淘宝工程师加入了Sheepdog项目和Corosyncc等相关开源项目、开发Acccord。自2011年9月以来,一些淘宝工程师加入了Sheepdog项目和Corosyncc等相关开源项目、Accord的开发。Sheepdog主要由集群管理和存储服务两部分组成,其中集群管理目前由Corosync或Zookper完成,存储服务是新实现的。Sheepdog采用无中心节点的全对称架构,基于一致性,实现从ObjectID到存储节点的定位:每个节点分为多个虚拟节点,像ObjectID一样,采用64位整数唯一标识,每个虚拟节点负责一段ObjectID范围,包括节点ID。ObjectID对应的虚拟节点存在于Dataobject副本中,以及后续的节点。Sheepdog没有单点故障问题,存储容量和性能可以线性扩展。新节点可以通过简单的配置添加到集群中,Shepdog可以自动平衡负载。节点故障可以自动发现并修复副本。它还直接支持QEMU/KVM。Sheepdog的服务流程不仅是数据服务的责任,也是客户端的责任(QEMU)gateway访问数据。QEMUShepdogdriver将对volume的请求转换为对object的请求,然后通过unixdomainsocket或TCPsocket连接shepdog服务流程,并将访问请求发送到该流程以完成后续步骤。Sheepdog的服务流程也可以打开数据缓存功能,以减少网络I/O。SheepdogI/O路径是“clientSheepdog数据可靠性问题我们对Sheepdog开展了可靠性、可用性测试。测试中共有3台服务器,每台配备6个机械硬盘。配备Sheepdog后,每台服务器启动10个VM,每台VM内无限循环运行Fio分别进行小随机读写和大顺序读写测试。在进行压力测试一周后,对集群中的所有数据进行一致性测试(collieclustercheck),发现一些数据块副本与另外两个不一致(”fixedreplica..”),有些数据块的三个不同(”nomajorityof..”):复制代码代码如下:[root@node3-10gtest~#collieclusterchecheckfixditest1-399.9%[=================================================================>]50GB/50GBfixedreplica3e56000000fca99.9%[=================================================================>]50GB/50GB fixedreplica3e560000000fec1000.0%[================================================================>]50GB/50GB fixedreplica3e560000026f51000.00[================================================================>]50GB/50GB fixedreplica3e56000002da61000.0%[================================================================>]50GB/50GB fixedreplica3e5300001e8c100.000[================================================================>]50GB/50GB fixedreplica3e5630000...fixvditest2-950.9%[=================================> ]25GB/50GB nomajoritofd7813000012351.0%[===================================> ]26GB/50GB nomajoritofd7813000015951.2%[===================================> ]26GB/50GB nomajoritofd7813000018a53.2%[====================================> ]27GB/50GB …2.3MooseFS(主要参考:http://peterylh.blog.163.com/blog/staticMoosefs是一个容错的分布式文件系统,/120320125179139592/标准POSIX文件系统接口由FUSE支持。Moosefs的架构与GFS相似,由管理服务器Master四部分组成:与GFS类似,Master主要有两个功能:(1)存储文件和目录元数据。文件元数据包括文件大小、属性、相应的Chunk等;(2)管理集群成员关系和Chunk元数据信息,包括Chunk存储、版本、Lease等。元数据备份服务器Metalogerserver:Master元数据根据元数据文件和log实时备份。元数据备份服务器Metalogerserver:Master元数据根据元数据文件和log实时备份。存储服务器chunkserverr。:负责存储Chunk,提供Chunk读写能力。默认情况下,Chunk文件为64MB大小。客户端Client:将FUSE挂入本地文件系统,实现标准文件系统接口。Mosefs本地不会缓存Chunk信息,每次读写操作都会访问Master,Master压力很大。另外,MooseFS写作流程长,成本高。MooseFS支持快照,但CoW是以整个Chunk为单位进行的(Copy-on-Write),以牺牲系统规模为代价,减少Chunk的大小,可能会导致响应时间恶化。Mosefs基于FUSE提供POSIX语义支持,现有应用程序可以直接迁移到Mosefs,不需要修改,这给应用程序带来了极大的便利。然而,FUSE也带来了一些负面影响,如POSIX语义不需要块存储,FUSE会带来额外的费用等。2.4GFS/HDFS(主要参考:http://www.nosqlnotes.net/archives/119)HDFS基本上可以算是GFS的简化开源实现,所以两者有很多相似之处。首先,GFS和HDFS都使用单一主控机 多台工作机的模式由一台主控机组成(Master)存储系统的所有元数据,实现数据的分布、复制和备份决策。主控机还实现了元数据的记录和回放功能。工作机存储数据,并根据主控机的指令存储数据、数据迁移和数据
推荐阅读
- 国外的直播app软件哪个好用吗?
最近几年直播行业是非常的火爆的,很多国外的直播app也是实现了指数级的增长,下面万商云集小编给大家来详细介绍一下国外的直播app软件哪个好用吗?这方面的内容,看一看有没有你喜欢的直播平台。 1、Periscope Periscope是一…查看详情
- display block是什么意思?怎么用?
急求css代码怎么写才可以让超链接的文字和前面的文字显示在同一行?把超链接 转换为区块display:block;然后设置你想要的width和height,最后float:left;基本上就可以了!还有一种方法是给他们都加上一个列表 然…查看详情
- 怎么免费创建网站 免费创建网站流程
新手快速建立一个网站,需要从以下方面着手建设,只需要简单的5步,就能节省千元以上的建站费用。下面小编就给大家来详细介绍一下怎么免费创建网站 免费创建网站流程这一块都内容,希望能帮助到大家。怎么免费创建网站 1、网站域名(网站地址…查看详情
- 购物APP哪个好?这几款比较受欢迎
现在的网络购物可以说是越来越发达了,大家已经不用出家门,就能够买到自己喜欢的东西,尤其是选择一个可靠的购物APP,还能够减少买到假货的几率,但是现在的购物APP越来越多,大家在选择的时候,也难免会十分的纠结,那么购物APP哪个好…查看详情
- 在线CRM客户关系管理系统功能有哪些?
据国外权威数据报告,越来越多的企业倾向于采用在线CRM客户关系管理系统来管理客户关系、商机、营销及销售团队等业务应用程序。传统的CRM系统已逐渐被在线CRM客户关系管理系统彻底超越!那么,为什么在线CRM客户关系管理系统与传统的CRM的战役…查看详情
- 怎么做网站推广 2022网站推广方法技巧
企业和个人都加入了互联网团队,希望通过互联网获得更多的经济效益。运营好了,无论是企业还是个人都会获得巨大的利润,会让更多的人加入互联网领域,下面万商云集小编就给大家来详细介绍一下怎么做网站推广 2022网站推广方法技巧这一块的相关内容。…查看详情
- 怎么找买房的精准客户
如何找到买房的精准客户 房地产行业一直是一个竞争激烈的行业。作为买房的精准客户,往往是房地产公司最为关注的对象。然而,在如今市场竞争加剧、信息过载的时代,如何找到买房的精准客户,成为了房地产公司需要面对和解决的难题。本文将从以下几个角…查看详情
- 如何在 Windows 11 上更改亮度
如何设置屏幕亮度?关于如何设置屏幕亮度的具体分析如下: 自动调亮或调暗屏幕 进入设置>显示和亮度,开启自动调节。 手机会根据周围光线的变化情况,自动调节屏幕亮度。 手动调亮或调暗屏幕 通过以下任一方式,手动调亮或调暗屏幕:…查看详情
- 在html怎样使用radio
怎么把html的radio的值,在asp.net获取到?如果20个问题固定,每题的4个分数值固定。为啥不用asp.net的服务器控件呢,用了服务器控件,在后台取值,然后保存倒数据库不是非常方便么另外应该是给单选按钮设定css样式的,而不是用…查看详情
- 淘宝店铺权重在哪看?
优质答案(1) 手淘拍立淘有权重,拍立淘就算通过拍照或上传图片,来帮助用户会自动检索和产品相似的宝贝。大家可以通过淘宝的猜你喜欢的渠道让消费者找到你店铺的产品,然后收藏加购下单,进而就会提高淘宝店铺权重。 做基础销量的方法有很多,常…查看详情
- 易语言编程软件
易语言是什么软件?易语言(EPL)是一门以中文作为程序代码编程语言,其以“易”著称,创始人为吴涛。易语言早期版本的名字为E语言,也通常代指与之对应的集成开发环境。其最早的版本的发布可追溯至2000年9月11日。创造易语言的初衷是进行用中文来…查看详情
- 3款一键电脑系统还原软件,告别电脑卡顿
对于电脑的系统,如果使用的时间长了,肯定是需要重新装系统的,不然的话,用的时候会特别的卡,导致在短时间之内没办法完成对应的工作,那么大家可以先了解一下系统还原软件都有哪些? 1、PowerShadow影子系统 选用最先进服务…查看详情
- 中央空调品牌有哪些?
中央空调品牌是指在室内安装一个或多个中央空调机组,并通过管道系统将制冷剂或制热剂传送至各房间,使整个室内空气得到调节和净化的设备。中央空调是大型建筑物中常用的空调方式,其优点是空调面广、占地少,能够实现整体控制等。因此,中央空调品牌在市…查看详情
- mvc框架是前端还是后端
mvc框架淘汰了吗?淘汰了。 前后端分离来了,Node.js来了,前端工程师把MVC的职责都给抢走了,后端工程师真正成为了后端,只需要提供API给前端就行,再也不用关心redirectforward有什么区别,再也不用关心session、…查看详情
- iphone必备软件 iphone手机必备软件
不知各位手机上有多少款年度精选APP,下面万商云集小编就给大家介绍下iphone必备软件,也许你手机里面也有这些软件、。1、拦截100 拦截浏览器跳转广告。我们在用Safari浏览器搜索内容时,会碰到滑到内容底部就会弹出广告或者是跳转…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品
找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
在线咨询
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达
关注万商云集
和10万中小企共成长
TOP

企业首选的数字选用平台






