服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

发展案例:豌豆荚从自建机房迁移至AWS云计算

2021-01-04 17:03:21 阅读(155 评论(0)

自2009年12月发展以来,豌豆荚作为创新工场的首批孵化项目之一,用户数量已增加到4.1亿。豌豆荚的主要业务是帮助用户在手机上找到、获取和消费应用、游戏、视频、电子书、壁纸等娱乐内容,并在东南亚等海外市场进行类似的业务探索。这样一个快速增长的系统对IT的底层支持也是一个相当大的挑战。本文将介绍豌豆荚在IT基础设施、工具和过程中所做的一些事情,如何平衡不同的需求,如何划分团队责任,以及一些挑战。在挑战豌豆荚成立初期,中国没有可靠的公共云服务。因此,自2010年以来,随着豌豆荚在中国市场发展的逐步扩大,豌豆荚在中国建立了大型数据中心。豌豆荚于2014年开始国际化布局,但在国外很难复制自建数据中心的方式。“不同国家有不同的采购流程和管理政策。在一些东南亚国家,甚至基本的网络提供商也有很大的不同。自建机房不仅速度慢,而且无法控制进度。豌豆荚工程生产力部质量总监高磊说:“业务部门对快速提供IT资源支持有着非常紧迫的要求。最后,我们发现只有云服务才能真正解决我们的问题。“为什么使用AWS决定使用云服务,豌豆荚决定使用AWS,”我们的工程师团队和运维人员熟悉AWS,如果使用其他公共云产品必须需要一个适应和学习过程,但我们使用AWS学习成本很低,所以使用AWS是合乎逻辑的。质量总监高磊说。AWS服务与自身业务的高度契合,除了降低团队的学习成本外,也是豌豆荚决定使用AWS的重要原因。通过AmazonelasticcomputeCloud(AmazoneC2),豌豆荚提高了海外新产品的发布速度,服务器计算资源可以根据实际使用量确定,不仅提高了工作效率,而且显著降低了成本,而且由于AmazoneC2的高可用性结构,也大大提高了应用的稳定性和可用性。此外,豌豆荚还使用AmazonElastiCache自动检测和更换运行不良的缓存节点,从而降低了基础设备的日常管理成本。同时,豌豆荚还使用AmazonElastiche集成的AmazonCloudWatch功能来监控设备,从而对Redis等节点相关的性能指标有更准确、更清晰的了解,确保服务和产品的稳定性。如果豌豆荚采用传统的自建数据中心的形式,保守估计每个机房需要3-4个月才能完成,而在AWS上完成所有基础设施的调试只需要几分钟。如果豌豆荚采用传统自建数据中心的形式,保守估计每个机房需要3-4个月才能完成,所有基础设施的调试只需要几分钟就可以在AWS上完成。更重要的是,豌豆荚并没有增加任何运维人员,因为它开始扩大海外业务,与负责传统数据中心的人员投资相比,管理AWS日常运营所需的人力几乎可以忽略不计。与自建数据中心相比,AWS的使用也能在一定程度上节约固定资本投入。不仅如此,豌豆荚还通过加深对AWS收费政策的理解,找到了更多降低使用成本的方法。豌豆荚和AWS的合作正处于起步阶段。随着对AWS业务了解的加深,豌豆荚将继续向AWS转移更多业务。豌豆荚的建设和增长始于2009年12月,机房部署始于2010年初。当时因为云服务还没有成熟,所以选择了自建机房的方案。到目前为止,豌豆荚已经在全国各地建立了许多节点,特别是在北京和天津。从使用基础设施资源的角度来看,豌豆荚的主要业务将消耗带宽和CDN资源;从单一业务的角度来看,各种数据挖掘和分析是服务器资源的最大份额。豌豆荚从创建之初就是数据驱动的业务,用户行为导向强,所以数据挖掘的工作量很大。以Hadoop集群为基础的数据挖掘。豌豆荚有一个专门从事产品研发的数据挖掘团队(主要面向内部),而豌豆荚提供硬件资源和底层的Hive、支持和维护HBase等基础设施。总体数据量和计算量一直在增长。在最初的几年里,增长非常快,近年来增长速度略慢,每年增长几倍。2011年左右,豌豆荚开始尝试制作海外版的豌豆荚Snapea。当时,对海外自建机房的可行性进行了评估,并对不同地方、不同IDC进行了调查、经过不同运营商的选项后,豌豆荚发现,即使进展顺利,也至少需要两三个月才能完成,而且成本太高。如果你不建造自己,那么只有公共云的选择。当时,许多工程师使用了亚马逊的AWS。出于时间、知识门槛和成本的考虑,他们决定在海外使用AWS作为豌豆荚的基本支持。团队EP团队的目标非常明确:在主要产品的完整生命周期内,实现一流的效率、质量和服务稳定性;对于具体的技术或方法,没有限制。一开始豌豆荚团队更注重流程、开发工具等方面,现在豌豆荚对CI、代码库、自动化测试、运行维护、基础设施建设等方面做了大量工作,有时工程师引入一些新的基础设施相关技术或框架,豌豆荚也可靠,总体目标是让产品从开始开发到在线生产环境运行,其稳定性和质量得到保证。目前,全队全职工程师不到30人,其中运维团队10人,他们还将承担开发任务(豌豆荚称为SRE,网站可靠性工程师)。他们自己开发了运维过程中需要的工具和支持系统。目前,全队全职工程师不到30人,其中运维团队10人,他们还将承担开发任务(豌豆荚称为SRE,网站可靠性工程师)。他们自己开发了运维过程中需要的工具和支持系统。运维团队的主要工作是维护豌豆荚自建的机房系统。AWS上的平均维护人力几乎只有三分之一。一方面是因为AWS的维护成本确实很低,另一方面也是因为AWS上豌豆荚的规模不算太大。从代码库到生产环境豌豆荚的产品发布过程仍然相对成型。不同的产品线有不同的发布频率,每周两次相对稳定,一些早期项目可能每天一次,压力不大。下一个release产品将发布哪些featureee?、主要由产品经理和设计师决定发布周期设置为多长时间间隔,工程师满足需求。在发布日期结束前,从代码库的主干拉一个发布分支进行featurefreeeze和最终验收测试,到发布分支只能进行bug修复,不再接受新的feature。有的产品线有统一的测试机制,有的产品线主要由工程师自己测试。无论采用哪种测试模式,在进入CI集成之前和之后都会进行静态检查和现有的单元测试用例,然后进入staging环境。就像两颗豌豆环境中的两颗豌豆一样,它属于操作和维护的领域。豌豆荚没有真正的流量,但环境与在线完全相同。可以说,它一直处于最新版本的服务中,然后staging与在线环境同步。虽然这套自动发布和部署的过程不是很完美,比如连续集成的检查点不够,单元测试率相对较低,但运行得很好。现在AWS也是一套相同的部署过程,适应起来也很快,大约一周后就跑上去了。监控豌豆荚的监控系统只有两个目的:实时报警和可追溯的历史数据,其他都是衍生功能。和大多数互联网公司一样,豌豆荚最初是用开源软件进行监控的,但现在开源监控软件越来越不能满足豌豆荚的需求。有两个挑战:性能问题数据收集的定制问题数据收集的定制主要涉及一些业务数据的收集。一般的开源软件仍然需要适应,需要自己写和实现。事实上,这很好。性能问题是一个更严重的问题,它来自三个方面:越来越多的机器、越来越多的收集项目和越来越高的收集频率。过去,豌豆荚监控可以在5分钟内捕获一次数据;现在豌豆荚希望在几秒钟内收集。监控系统需要有实时分析日志的能力,当机器数量增加到1000台以上时,需要进行第二次收集和分析,数据收集和数据分析的速度都会遇到瓶颈。因此,豌豆荚现在正在重写自己的监控系统,专门为豌豆荚建立的机房系统,包括对多机房结构的支持、与资产系统的对接等。其CloudWatch监控功能直接用于AWS上的豌豆荚,目前已经足够了。由于业务与数据密切相关,豌豆荚部门负责为数据分析团队提供基础设施。业务对数据报告的需求一般有两种:1、定制和定期的数据指标报告包括日、周、月或小时。一般来说,它们是传统的监控指标。持续监控和分析,中间数据保留完整,所需的计算量和存储容量易预测。这种报告需求更容易满足。2、根据需要报告此类需求通常是针对以前没有中间数据的监测值。我以前不知道需要分析这些值。现在我突然发现有必要。业务部门将要求对过去六个月到一年的数据相关趋势进行一次性分析。这种报告通常很耗时。有时候豌豆荚需要多长时间来估计一年的数据分析。结果可能是豌豆荚目前的计算资源,可能需要一个月的分析才能生成他想要的报告,但不能满足业务需求。为了提高分析速度,最直接的方法是投入更多的计算资源——豌豆荚建造的机房是扩展容量,如果使用公共云是更多的例子。一方面要扩容,另一方面AWS现在已经进入中国,豌豆荚也在考察使用AWS来完成这项任务的可能性。事实上,豌豆荚使用AWS后,也逐渐发现豌豆荚之前的系统设计并不是那么好。例如,根据海外豌豆荚的数据分析,我原本想使用EMR,但我发现豌豆荚现在很难直接使用,所以我不得不基于EC2来做这件事。为什么呢?因为AWS的概念是让不同的组件做不同的事情,比如EC2只做计算,数据持久存储最好放在S3;然而,豌豆荚系统在设计开始时并没有考虑到这一点。数据存在于本地计算节点中。如果要重建,还需要很多时间。包括scaling在内的scaling也是如此。现在豌豆荚基本上不使用scaling,因为豌豆荚在上下游的应用过于依赖,所以对scaling机制的支持不好。这些都是需要努力的方向。一件更好的事情是,豌豆荚豌豆荚的工程师更有感情,更支持重构。当然,也有投入成本和产出的考虑。豌豆荚首先要满足业务需求,解决业务问题。至于重建工作,随着豌豆荚在AWS上的业务规模越来越大,优先级会越来越高。最后想分享的是,如果EC2的reservedinstance用得好,可以比ondemand模式节省很多。一开始,我不知道AWS除了ondemand之外,还有reservedinstanceeend。、最近才知道spotinstance这些玩法。Reservedinstance非常适合webservice,spotinstance更适合临时数据分析。

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

淘宝开鞋店的流程是什么?

  优质答案(1)  操作如下  1.公司名义入驻:就是安装师傅自己当老板,根据淘宝平台的要求填写资料,以及提交公司的资质、材料等等  2.网点授权入驻:安装师傅和产品售后网点合作,授权也好、承包也好,提交资质、材料、费用等即可  3.打工…查看详情

2022免费自助建站空间有哪些?

对于初学者来说,想要搭建一个网站的话并不容易,不过也不用担心,因为现在有很多免费的自助建站空间,可以帮助到大家不仅在使用的时候,完全不用投入金钱,创建平台也是比较简单的,那么免费自助建站空间有哪些呢?一起来了解吧。1、OpenShift这个…查看详情

3款合同管理系统免费app整理

众所周知,当前计算机已经广泛的应用于各个领域,作为与世界交流广泛、信息密集、事务繁多的企业必须有效、科学的管理公司业务,经过筛选,本文盘点了3款合同系统免费的app,大家可按需收藏。 1.TurboCIS合同信息系统免费app TurboC…查看详情

网络订货系统:3大功能、4大好处,尽早使用

在网络发展如此迅速的现在,很多事物都离不开网络了,现实和网络相结合使我们的生活中增添了非常多的便利,在买卖东西、采购等方面,再常见不过了,网络订货系统已经用于非常多的行业领域,下面就和大家介绍下网络订货系统的好处吧。图片来源于网络 网络订货…查看详情

易特仓库管理软件免费版之类的软件到底有哪些?

仓库管理的工序和水平随着互联网发展的不断加快而加快,大数据和云储存的应用让仓库数据可以被智能保存。使用易特仓库管理软件免费版能够提高对仓库的管理水平。无论是从管理人员雇佣还是消耗时间上都有了很大的提升,还能让仓库数据整理更加便捷清晰。那么好…查看详情

免费仓库管理系统软件大盘点!

这个时代是互联网的时代,在一些库存的应用场景里,如果还采用以往的人工库存的方式,那会使工作流程会变得非常麻烦,这时管理仓库如果再用以前的方式就会事倍功半,这里给大家盘点几款免费仓库管理系统软件! 1.里诺仓库管理软件 这是一款通用性极强的仓…查看详情

wmiprvse.exe是什么程序

wmiprvse占用过高解决方法?按Ctrl+Shift+Esc键,调出Windows任务管理器,点击进程标签,找到WmiPrvSE.exe这个进程,鼠标点击右键,选择“设置相关性(A)”--->处理器相关性中:允许哪些处理器运行“WmiP…查看详情

ip地址怎么改 ip地址修改方法

  很多朋友使用电脑时,会遇到提示“IP地址错误,网络无法接通”的提示,如果从网络上找教程,很多教程都是教大家如何通过路由器查询正确的IP地址,然后重新填写,或者将电脑的IP地址获取方式设置成“DHCP”,虽然这种方法的确管用,但操作步骤比…查看详情

前端工程师需要掌握哪些知识

前端工程师需要学会英语吗?答案为需要。 因为前端工程师也需要看文档查资料并且查看的一手资料都是外文的,查看二手资料都是经过他人翻译过来的,对原文的理解并不是很透彻,所以最好还是学会英文自己去查第一手资料比较好一点。 另外在编程的时候变量…查看详情

盘点近年热门的管理系统软件定制版

21世纪是个信息化,数字化时代。各个企业为了能给顾客带来更好的体验,满足顾客的个性化需求,他们研究出了各式各样的软件。今天小万为大家讲解一些比较热门的管理系统软件定制版。 1企业管理软件 企业管理软件是面向企业的,能够帮助企业管理者优化工作…查看详情

商标争议是什么,商标争议有哪些类型

  商标是指生产者或者经营者为了将其生产的产品或者提供的服务与其他产品或者服务相区别而采用的标识。但现实生活中会发生商标争议的案例,那么,商标争议是什么,商标争议有哪些类型?万商云集小编给大家详细的介绍一下相关内容,。  商标争议是什么  …查看详情

国内主流WiFi共享软件,一秒让你免费获取WiFi密码

WiFi称作无线网,有了无线网的存在,就可以无线上网,不需要出任何费用,尽情的打游戏,看电视聊天等等,比流量好用的多,那么,如果出差就需要蹭别人家的无线网,WiFi软件有哪些? 1、WIFI伴侣 WIFI伴侣是迅速有效的联网…查看详情

4款可以随时在线观看电影的软件推荐

如今人们的娱乐生活也丰富了,很多人会在下班后或者节假日去选择看一个电影来放松自己,但是有些电影票可能就比较贵,所以有些人就会选择在线电影软件,很多人不知道,下面是我给大家的介绍。 1.葫芦视频 是当贝与华视网聚合作开发的一款…查看详情

作业辅导软件有哪些呢?这几款解决你的难题

现在的父母工作都比较忙,通常是老人负责接送孩子,而辅导作业方面就变得力不从心了,其实不妨将这个难题交给一些作业辅导的软件,现在的软件功能不仅强大,使用起来也非常的简单方便,可以帮助大家解决更多的难题,那么作业辅导软件有哪些呢?这…查看详情

php是什么文件类型

迅雷下载为什么都是down.php文件?是因为要下载的资源所在的网站屏蔽了迅雷等下载工具的使用,所以下下来就是php为后缀的文件,可以右键点击你想要下载的文件,在弹出的选项中选择目标另存为,用最原始的下载方法进行下载。git可以管理什么格式…查看详情

最新文章