服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

运用经验:新浪微博和Pinterest以及Viacom对Redis数据库

2020-12-31 09:15:03 阅读(226 评论(0)

新浪微博:历史上最大的Redis集群TapeisDead,DiskisTape,FlashisDisk,RAMLocalityisKing.—Jimgrayredis不是成熟的memcache或mysql的替代品,是大型互联网应用架构的良好补充。现在基于Redis进行架构改造的应用越来越多。首先简单公布Redis平台的实际情况:2200 亿commands/day5000亿Read/day500亿Write/day18TBT Memory500 Serversin6IDC20000 instances应该是国内外比较大的Redis使用平台,今天主要从应用的角度来谈Redis服务平台。使用Redis场景1.Counting(计数)计数的应用在另一篇文章中有详细的描述,计数场景优化http://www.xdata.me/?p=这里就不多描述262了。可以预见,很多学生认为把所有的计数都存储在内存中是非常昂贵的。我在这里用一张图表来表达我的观点:在很多情况下,每个人都会想象纯内存使用方案的成本会很高,但实际情况往往会有所不同:COST,对于有一定吞吐需求的应用程序,DB肯定会单独申请、Cache资源,许多担心DB写入性能的学生也会主动将DB更新记录在异步队列中,而这三部分的资源利用率一般不会太高。算下资源,你会惊讶地发现,纯内存的解决方案会更简洁!当你计算资源时,你会惊讶地发现纯内存的解决方案会更简洁!KISS原则对开发非常友好。我只需要建立一个连接池,不用担心数据一致性的维护和异步队列的维护。Cache穿透风险,如果后端使用DB,肯定不会提供很高的吞吐能力,如果Cache停机处理不当,那就是悲剧。大多数初始存储需求,容量小。2.Reversecache面对微博上经常出现的热点,比如最近流行的短链,成千上万的人在短时间内点击跳转,这里经常会出现一些需求,比如我们在快速跳转时判断用户级别,是否有一些账户绑定,性别爱好,已经向他们展示了不同的内容或信息。memcacachee通常使用 Mysql的解决方案,当调用id合法时,可以支撑更大的吞吐量。但是,当调用id无法控制,更多的垃圾用户调用id时,由于memcache没有命中,会大量穿透mysql服务器,瞬间导致连接数疯狂增长,整体吞吐量减少,响应时间减慢。在这里,我们可以用redis记录所有用户判断信息,如stringkeyy:uidint:type,做一个反向cache,当用户在redis中快速获取自己的等级信息时,再去Mcche Mysql层获取全量信息。如图所示:当然,这也不是最优化的场景,比如用Redis做blomfilter,可能会节省更多的内存。3.top10list产品运营总会让您展示最近、最热、点击率最高、活动度最高等条件的toplist。如果使用MC,许多更新更频繁的列表 如果MySQL进行维护,缓存更容易失效,鉴于内存占用较小,使用Redis作为存储也是相当不错的。4.Lastindex用户最近的访问记录也是redislist的好应用场景。lpushlpop自动过期的旧登录记录对开发非常友好。5.RelationList/MessageQueue在这里把两个功能放在最后,因为这两个功能在实际问题上遇到了一些困难,但在某个阶段确实解决了我们的许多问题,所以这里只解释一下。MessageQueue是通过listlpop和lpush接口编写和消耗队列,因为它的性能也可以解决大多数问题。6.FasttransactionwithluaredisLua的功能扩展实际上给Redis带来了更多的应用场景。您可以编写一些command组合作为小型非阻塞事务或更新逻辑,例如:当您收到message推送时,同时,1.给自己增加一个未读对话2。给自己的私信增加一个未读信息3。最后,给发送人一张完成推送信息的收据,这个逻辑可以在Redisserver端完全实现。但需要注意的是,Redis会在aof中记录luascript的所有内容,并将其传输给slave,这对磁盘和网卡来说也是一笔不小的开支。但需要注意的是,Redis会在aof中记录luascript的所有内容,并将其传输给slave,这对磁盘和网卡来说也是一笔不小的开支。7.Insteadofmemcache的许多测试和应用都证明,Redis在性能上并不落后于Memcache,而单线程模型给Redis带来了很强的可扩展性。在许多情况下,Redis对同一数据的内存费用小于memcache的slab分配。Redis提供的数据同步功能实际上是对cache的强大功能扩展。Redis使用的重点1.rdb/aofBackup!超过95%的在线Redis承担后端存储功能。我们不仅将其用作cache,还将其用作k-v存储。它完全取代了后端存储服务(MySQL),因此,数据非常重要。如果出现数据污染和丢失、误操作等情况,将难以恢复。所以备份是非常必要的!为此,我们有共享的hdfs资源作为我们的备份池,希望能够随时还原业务所需的数据。2.Smallitem&Smallinstance!由于Redis单线程模型(严格意义上不是单线程,但认为Request的处理是单线程),大数据结构list,sortedset,hashset的批量处理意味着等待其他请求,因此使用redis的复杂数据结构必须控制其单key-struct的大小。此外,Redis单实例的内存容量也应受到严格限制。单实例内存容量大后,直接带来的问题是故障恢复或Rebuild从库中需要很长时间。更糟糕的是,Redisrewriteaof和Saverdb将带来非常大和长的系统压力,并占用额外的内存,这可能导致严重影响性能的在线故障,如系统内存不足。在线96G/128G内存服务器不建议单实例容量大于20/30G。3.BeenAvailable!Redissentinel(哨兵)更多地用于行业信息和使用http://www.huangz.me/en/latest/storage/redis_code_analysis/sentinel.htmlhttp://qiita.com/wellflat/items/8935016fde25d486d92000行C实现服务器状态检测,自动故障转移等功能。但由于自己的实际结构往往比较复杂,或者考虑的角度比较多,所以@徐琦eryk和我一起做了hypnos项目。然而,由于他们自己的实际结构往往很复杂,或者从更多的角度考虑,@徐琦和我一起做了hypnos项目。hypnos是神话中的睡眠,字面意思是我们的工程师不需要在休息时间处理任何故障。:-)其工作原理如下:Talkischeap,showmeyourcode!稍后将单独写一篇博客详细介绍Hypnos的实现情况。4.InMemoryornot?在沟通后端资源设计时,我们经常忽视对真实用户的评价,因为我们习惯于使用和错误地理解产品定位。也许这是一个历史数据,只有最近一天的数据被访问,把历史数据的容量和最近一天的请求留给内存存储是非常不合理的。因此,当您使用什么样的数据结构存储时,请务必先衡量成本。内存中需要存储多少数据?对用户真正有意义的数据有多少?因为这其实对后端资源的设计非常重要,1G的数据容量和1T的数据容量在设计理念上是完全不同的。1.slavesync改造所有在线master-slave数据同步机制,借鉴了mysqreplication的思路,利用rdbber-slave数据同步机制 aof 作为数据同步的基础,pos简要说明了为什么官方提供的psync不能很好地满足我们的需求:假设有两个来自库B和C,以及A`—B&C,此时,我们发现mastera服务器存在停机隐患,需要重启或A节点直接停机,如果A、B、C不共享rdb和aof信息,C在从库作为B时仍会清除自己的数据,因为C节点只记录与A节点的同步。因此,我们需要有一种方法可以让AA`–B&C结构切换换为A`–B`–虽然psync支持断点续传,但仍不能支持master故障的平滑切换。事实上,我们在定制的Redis计数服务中使用了上述功能的同步,效果非常好,解决了操作和维护的负担,但我们仍然需要推广到所有的Redis服务,如果可能的话,我们也会向官方Redis提出相关的Syncslave改进。2.更适合redisname-systemorproxy的学生发现,除了使用DNS作为命名系统外,我们还记录了zookeper。为什么不让用户直接访问系统,zk或DNS选择其中一个?事实上,这仍然很简单。命名系统是一个非常重要的组成部分,dns是一个相对完善的命名系统。我们做了很多改进和试错。zk的实现仍然相对复杂,我们没有强大的粒度控制。事实上,这仍然很简单。命名系统是一个非常重要的组成部分,dns是一个相对完善的命名系统。我们做了很多改进和试错。zk的实现仍然相对复杂,我们没有强大的粒度控制。我们也在思考什么样的命名系统更符合我们的需要。3.使用后端数据存储大内存必须是成本优化的重要方向,flash磁盘和分布式存储也在我们未来的计划中。二、Pinterest:Pinterest已经成为硅谷最疯狂的故事之一。2012年,基于PC的业务增加了1047%,移动终端增加了1698%。今年3月,其独立访问量飙升至533亿。在Pinterest中,人们关注的是100亿件事——每个用户界面都会查询board或用户是否关注的行为,这导致了极其复杂的工程问题。这也让Redis得到了用武之地。经过多年的发展,Pinterest已成为媒体、社交网络等领域的领导者,其辉煌成就如下:推荐流量高于谷歌 、YouTube和Linkedin的总和与Facebook和Twitter一起成为最受欢迎的三大社交网络参考Pinterest购买的用户比其他网站更高,Pinterest的高规模基于其独立访问量,促成了对IT基础设施的高需求。最近,Pinterest工程经理Abhikhune通过缓存优化了用户体验,分享了公司的用户体验需求和Redis的使用经验。即使是繁殖的应用程序创建者在分析网站的细节之前也不会理解这些特征,所以首先对使用场景有一个大致的了解:首先,对每个粉丝提到的预检查;其次,UI将准确显示用户的粉丝和关注列表页面。即使是繁殖的应用程序创建者在分析网站的细节之前也不会理解这些特征,所以首先对使用场景有一个大致的了解:首先,对每个粉丝提到的预检查;其次,UI将准确显示用户的粉丝和关注列表页面。为了有效地执行这些操作,每次点击都需要一个非常高的性能架构。Pinterest的软件工程师和架构师使用了MySQL和Memcache,但缓存解决方案仍然达到瓶颈;因此,缓存必须扩展,以获得更好的用户体验。在实际操作过程中,工程团队发现缓存只有在用户sub-graph已经在缓存中工作时才能工作。因此。任何使用该系统的人都需要缓存,这导致了整个图片的缓存。与此同时,最常见的问题是“用户A是否关注用户B”的答案往往是否定的,但它被用作缓存丢失,以促进数据库查询,因此他们需要一种新的方法来扩展缓存。最终,他们的团队决定使用Redis来存储整个图表,以便为许多列表提供服务。2.使用Redis存储大量Pinterest列表Pinterest使用Redis作为解决方案,并将性能推到内存数据库级别,为用户保存多种类型的列表:关注者列表你关注的board列表粉丝列表关注你的board用户列表你没有关注的board列表每个board关注者和非关注者Redis为7000万用户存储了以上所有列表,本质上可以说是通过用户ID存储了所有的粉丝图片。鉴于您可以通过类型查看上述列表的数据,分析系统的存储和访问,这些系统看起来更像是事务。鉴于您可以通过类型查看上述列表的数据,并分析系统存储和访问看起来更像事务的概要信息。Pinterest目前的用户列表仅限于10万,初步统计:如果每个用户关注25个board,用户和board之间将有17.5亿的关系。更重要的是,随着系统的使用,这些关系每天都在增加。3.Pinterest的Reids架构和运营通过Pinterest的一位创始人了解到,Pinterest开始使用Python和定制的Django编写应用程序,直到它拥有1800万用户的410TB用户数据。虽然数据存储使用多个存储,但工程师根据用户ID使用8192个虚拟分片,每个分片都在运行

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

2022年专利转让需要多少钱(新整理)

  如果一项专利有很大的市场前景,专利的转让可以给专利发明人带来很大的收益。专利的转让在中国也越来越普遍。下面小编就给大家来详细介绍一下2022年专利转让需要多少钱这一块的相关内容,希望下面的内容能帮助到大家。  2022年专利转让需要多少…查看详情

Windows10我的电脑在哪里

  Windows10是操作系统中最常用的版本之一。因为它整体性能表现优秀,因此很多用户都喜欢使用这个操作系统。但是还有很多用户不熟悉Windows 10的操作,比如——我的电脑在哪里?如果你也有这一疑惑,我们一起来看看。  如果你想要打…查看详情

发明公开到实审需要多久?

    在平时很多的小伙伴都不知道发明公开到实审多久的基本情况,而且对发明公开到实审多久都不是很熟悉,下面万商云集小编就为大家整理了发明公开到实审多久这方面的相关内容,希望下面的内容能帮助到各位。    一、发明公开到实审需要多久?  发明…查看详情

新手常见问题:跨境电商平台是做什么的

跨境电商是小万最近听到讨论频率最高的词汇,很多中小企业老板都有加入跨境电商平台发展的想法。但是对这个新兴的的跨境电商平台,不少人仍然是不太明白。到底跨境电商平台是做什么的,它具有什么优势值得大家放弃国内熟悉的电商环境去尝试。就这些疑问,小万…查看详情

一键去水印的APP有哪些?去水印好用的软件推荐

很多人特别喜欢拍照片或者是选择一些比较好的图片,这个时候如果图片上有水印就需要进行图片修理,如果想要去掉图片上的水印,那么也应该要选择一款专业的软件。有了软件之后就能够将图片上的水印更好的去除,打造出自己想要的图片效果。那么一键…查看详情

root权限怎么开启 root权限有什么用处

  首先,需要解释什么是root权限。在Linux或Unix操作系统中,root用户是具有系统上最高权限的用户。拥有root 权限的用户可以执行任何操作,包括修改系统配置、安装软件、访问所有文件等等。  在默认情况下,Linux和Unix…查看详情

在线客服系统软件

网页上的在线客服软件都有哪些,大家推荐?在线客服软件在国内应该是选择余地非常大的,没加都有各自的特色Live800:老牌在线客服厂商,行业品牌度较高一洽在线客服:在线客服系统新秀,服务了很多大型企业,基本开放了所有的业务接口有较强的业务集成…查看详情

WPS办公软件好用吗

WPS办公软件是一款功能丰富、易于使用的办公软件套装,广泛应用于文字处理、表格编辑和演示文稿制作等领域。下面将从用户界面、功能特点和兼容性等方面介绍WPS办公软件的优点。 首先,WPS办公软件拥有直观友好的用户界面,使用户能够快速上手并地完…查看详情

什么是客户关系管理 如何做好客户关系管理

  客户管理对于销售以及销售团队来说,是多么的重要。作为销售管理者,到底该如何做好客户管理?下面万商云集小编就给大家来详细介绍一下什么是客户关系管理 如何做好客户关系管理这方面的内容,希望能帮助到大家做好客户管理。  1管好销售的客户资料查…查看详情

小程序怎么发到朋友圈

  小程序链接怎么发朋友圈?  小程序发朋友圈的方法:  1、分享朋友圈能力,点击分享链接就可以进入小程序,但是需要小程序开发者开启可分享页面功能的开发。  2、通过发朋友圈图片上带小程序二维码,长按识别可以打开小程序。  微信小程序转发到…查看详情

免费的远程办公软件有哪些 远程办公软件排行榜

  从疫情进入常态化时代以后,网上办公也就一并成为了常态。下面小编就给大家来详细介绍一下免费的远程办公软件有哪些 远程办公软件排行榜一块的相关内容,下面的这些远程办公软件都是非常不错的。  这个时候,我第一个想到的就是远程控制软件的,只要…查看详情

电脑显示ip冲突怎么办?

WINDOWS检测到IP地址冲突怎么办?1右击电脑屏幕右下角的“网络联接”,点击打开“网络与共享中心”选项。 2在弹出的窗口中,单击“以太网”选项。 3在弹出的窗口中,点击“属性”,进入到属性对话框。 4选择“Internet协议版本…查看详情

企业须知丨网站建设设计公司的设计重点在哪里?

网站建设是竞争性比较激烈的行业,互联网市场中的网站建设设计公司数量很庞大,各个公司的建站价格差异也比较大,几千到几万元不等。网站建设设计公司想要在激烈的竞争中不被淘汰,就需要在技术上创新,设计上用心,在网站建设和设计的过程中融入搜索引擎优化…查看详情

值得收藏的免费营销软件大排名

我们知道,在日常生活中,营销占着不可小觑的地位,特别是在信息大爆炸,互联网大发展的今天,如果作用好行销手段,那我们将会事半功倍,这里给大家盘点几款值得收藏的免费营销软件大排名供大家参考! 1.百分百QQ营销软件 这是一款由国内老牌软件品牌百…查看详情

集成灶哪个牌子最好 集成灶十大公认品牌

现在用集成灶的人非常多,因为集成灶相比普通的灶具,他更加卫生一些,而且可以自动的把一些油烟什么的都抽走,根本不用担心家里会出现油烟味,那么我们要看一下集成灶排行榜前十名都有什么,从前十名中有什买的话会更加靠谱一些。 1、帅丰…查看详情

最新文章