服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

乐视如何通过跟进开源技术的更新来应对日益庞大的数据量的处理?

2020-12-31 09:18:41 阅读(153 评论(0)

乐视从年底破百亿的“芈月传”和有毒的“太子妃”到年初举报快播的“背锅侠”,几乎赢得了全民的关注。现在看来游戏才刚刚开始,最近乐视又忙着升级,换Logo换域名,这意味着乐视已经准备好火力全开,进入全球市场。小编认为,乐视之所以如此雄心勃勃,是因为它背后有大数据作为支撑,未来大数据也将在乐视全球化战略中发挥关键作用。从内容上看,乐视大数据打造的超级IP实力确实很强。2013年,乐视首次利用大数据赢得宣传档案,对即将上映的《小时代》进行了最准确的预测和分析,开展了美丽的电影营销,开启了大数据电影营销模式。后来,国内影视开始掀起IP浪潮,2015年是IP炒作最热的一年。年底,乐视给用户提供了令人满意的答卷,其自制的《十年剧王》《芈月传》以全网200多亿播出量创下纪录。网络雷剧《太子妃升职记》,目前全网播出量已接近15亿。大数据 超级内容IP为乐视进入全球市场注入了无限动力。然而,这并不是重点,“内容 乐视生态是乐视生态的亮点。《米月传》播出后,乐视还推出了超级电视、智能手机、米酒、手机壳、经典台词版《米月传》手机铃声等个性化产品,并与天猫合作打造《米月传》衍生品旗舰店。《米月传》手机游戏也发布了。请注意,这是360°乐视超级IP形成了一个完美的闭环,没有死角的IP布局。假如说IP是软件,那么乐视云就是硬件。在大数据时代,最重要的是“云”。乐视云是一个专注于视频领域的云计算平台。2016年,乐视云与戴尔达成两年全球战略合作,与世界领先的大数据运营商Equinix合作,法国最大的电信运营商Orange、澳大利亚最大的电信公司澳大利亚电信、世界领先的综合国际电信公司西班牙电信、世界顶级通信方案运营商香港和全球电信有限公司,打破数据岛,加快视频生态系统建设,未来乐视大数据触角将延伸到更多的行业。再看市值,乐视网成立于2004年,2010年上市,当年市值只有50亿。从市值来看,乐视成立于2004年,2010年上市,当年市值只有50亿。五年来,乐视依托大数据平台,深入培育互联网视频、影视制作、智能终端、电子商务等垂直领域。到目前为止,总市值已接近1100亿元。不过,看看乐视这次全面升级冲击全球的姿态,看来乐视的故事才刚刚开始!白德新目前正在从事乐视超级电视的数据挖掘。他说,最初的业务无法适应当前的业务发展,因此需要进化。在构建一切时,分析数据的平台,为乐视的超级电视提供数据挖掘服务。如何从最初的业务发展到现在,包括在超级电视上进行实时分析和用户离线挖掘,并通过数据挖掘为许多业务部门提供数据挖掘支持。白德新提到自己是谷歌的粉丝,目前正在进行第一批超级电视数据挖掘。云视频找到播放机时,当时是屌丝,只有几万个数据,当时数据也比较少,做了一些开机数等日常数据。在业务中做,在数据节点中做计算。  随后性能越来越低,因为数量越来越多,当时每天的数据量,当时感觉很大,每天只有几千万行数据。在这个时候,我觉得我需要尝试一些新技术,所以我使用Cassandra作为存储。存储日至,简单处理切割后放入其中,使用Hodop计算,并将结果插入MySQL。每天计算数据是你自己的中间数据。一些报表可以出来。数据组合很多,刚开始只是盒子和应用,后来有一些视频播放内容,开始尝试分析MySQL和Kettle的日常数据。但是做了三四个月,又换了,用了Kafka、Storm、Hodoop、Hpase、Hive、Oozie、Sqoop,唯一的修改是有一些大的,跟随开源社区进行相应的升级,并尽可能与社区保持一致。  乐视网大数据的起点  白德新说,一开始只有一个数据分析师抓住了一些数据,这是一个分析。电视盒,包括电视启动,看什么电视节目,因为乐视网做视频内容,点击什么视频节目,通过心跳看视频节目多久,三分钟心跳,放在终端记录下来。播放有开始,有心跳,电视比较好,但是盒子里有些用户看着直接断电,结束就没了,只能从心跳挖回来。  自从超级电视发布以来,盒子的价格一开始比较贵,没人买。后来盒子卖了299,卖了很多。数据量按三分钟心跳计算。数十万用户观看视频。他们有心跳,播放视频和心跳。数据量特别大。没有办法。乐视当时上了四台。四个数据,看怎么发布。然后输出,然后分析。看看有什么问题。  一个人在做这些事情的时候。然后有人离开了,然后Cassandra就没人了,交接的时候写完了,对系统影响很大。这时没人接手,他走了技术也走了,一个萝卜一个坑,萝卜走了坑不容易填。后来想找个技术比较好的人帮乐视做,但是一个多月没找到了。要继续做系统,数据也在疯狂增长,没有办法去掉Cassadnra,把它放进MySQL。  另一方面,分析师对乐视有很大的看法。他花了两个多小时。这取决于今天的启动量和昨天的比较,然后根据时间段查看启动量。两个小时过去了。他说系统老死机,我说查询太慢。希望系统能更大。  现阶段数据量的变化  白德新自己说,乐视的数据量从年初的三个月翻了一番,现在我写得早一点,每周翻一番。现在每天的数据量是100G,超级电视和盒子卖得很快。从设备行为到用户行为的快速转变。我的计划是多少,卖得更多的人开始考虑商业行动,根据互联网,用户拿着我的盒子看什么,是看电影还是看电视剧,所以这次很多用户行为来分析。现在每周有一个电视版本和一个盒子版本,每周更新一个系统版本,用户是否接受,这些都是乐视分析的。  另一个是乐视在这里做了一些测试,因为在盒子里,乐视叫UI做一些测试,今天做海报推荐,明天加一个分析,看用户是高是低。  用户数据增长迅速,没有人。在寻找土豪劣绅开发商帮助乐视解决这个问题的同时,他们必须自己解决这个问题。看数据分析的人,团队从内部调整,数据分析招聘。还有一个比较牛的人是从公司其他部门挖出来的。从今年年初开始,从原来开始。最后换成现在的方式。这是我自己做的,R&D团队有两个人,现在也有两个人。  新平台通过Kafka建立,通过许多业务系统、点播和第三方,包括一些日志、存储数据和需要分析用户的数据,建立了近半年的新平台。还有一些元数据进行加工和处理。整合后,其实前段所有的请求都在这里。Storme是最后的数据。此外,Hodoop已经更改。数据量大后,更改其他数据库。刚开始选择,公司开始自己做数据库。通过Hodoop和数据服务wad-HOC的构建和处理,实时查询和开放数据平台也进行了查询和报告,为一些实时数据分析系统和门户网站提供数据服务,以及需要调整哪些数据。运营商需要知道四川电信和某电信部门的视频点播量。这些都是内部挖掘的。  乐视的数据源来自前端,从三到六,所有的数据都在这里。其优点是,随着开源社区系统的升级,数据仍然可以在不影响业务的情况下接收。然后随便操作。稍微处理数据,放入STORE,实时计算数据,然后拆分。现在没有PEED,用户互动就是OEE,把多个任务组合起来,放进去,最后是一个结果,一个业务流程的管理工具。  数据输出后,通过查询提供给他人,反馈给前端数据。这就是所谓的矩阵业务。这是一个测试。两台4corecpup服务器、6G,用户约38万,有效数据38万。与官网50万对比略差。由于乐视的机械性能比它们差得多。  当时两个节点做的,一个发送,同步发送,消息格式两种,格式30字节,50字节,200字节。假如30字节38万,其它数据基本在30万左右。这是单台数据。单位近30万。这是乐视的Spout集群,做一些业务拆分。例如,一些数据需要组织、点播和心跳。事实上,有些信息是随机的。虽然它们是连续发送的,但每台机器都会发送并写入数据,例如播放时间、每部剧的播放时间和按时间段计算的数据。  借用官网的这张图,我用的是0.9。其实标准是一个,但是乐视怕数据丢失,所以做了两个。其实做起来比较简单,复制数据。存储的一些数据,这些没什么好说的,当时做了一些简单的优化,这就不多说了。默认情况下,垃圾被关闭并自动回收。如果你不想让它自动回收,你必须手工处理。这是Sqoop,原始数据都存储在这里,乐视导入集群,乐视用这个来做。当时,我做了一些事情来抽取和整合数据。  OLD没有写在上面,包括查询,一些数据处理的中间结果,中间结果最终没有,不可能达到使用阶段。  ROI分析  数据量每月翻一番。现在不仅如此。乐视原有的架构无法满足新的需求。以前是日报,现在每天都有很多实时数据。Kettle数据集成时间越来越长,使用hadoop-storm方案,不会对数据挖掘产生太大影响,资源稍丰富,集群不足以添加机器,数据每天运行一次,每天晚上12点收集数据生成报告,现在实时查询,时间相对较长,约5分钟。因特尔给乐视推荐了一个,但是对内存要求太高,暂时做不到。现在都是6G内存服务器。支持硬件设备。  目前还有很多事情要做。事实上,乐视在不同阶段选择不同的解决方案。一开始,一年卖几万个盒子,一开始卖3000个盒子,不可能建十几个节点的数据。人员流失会导致技术流失。与招聘牛人相比,技术储备和内部自荐速度更快。现在招聘也很困难,hadoop圈人少。要小心对待新的业务平台。否则,问题很难解决。这个数据更好,如果前端没有,对业务影响很大。  数据安全非常重要,乐视有40多个T数据,放在两个备份存储上。服务器多了就爽了,四台不够加八台,计算量可以很快。

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

公司名称变更后还需要变更哪些

  一、引言  随着公司发展,有些公司可能会根据业务变化或其他原因需要修改公司名称。在名称变更后,公司除了需要修改各种证照、执照、文档等,还需要对多个方面的事项进行调整和更新。本文将针对名称变更后需要变更的方面进行详细描述和解释。  二、法…查看详情

在线客服系统免费的有哪些?

51客服是什么?51客服是一款专业的网上在线客服系统 51客服网上上客服是完全基于WEB实现的一款免费网页对话系统,简洁明快,无需安装任何插件。在提升服务质量的同时,也为使用者带来了新的客户来源和订单。免费客服系统有谁用过吗?用过很多,还…查看详情

小程序游戏制作工具

  小程序游戏怎么做的?  小程序游戏需要掌握一定的编程知识,使用开发工具进行开发。  游戏的设计需要考虑玩家的体验和游戏的趣味性,同时还需要考虑游戏的流畅度和响应速度,以及吸引力和推广方案。  小程序游戏开发需要注意微信官方的规定和用户隐…查看详情

北京市规范双11商品价格,不允许价格先涨再降

目前各大电商平台的商家激战正酣,都想在这个每年一次的全民狂欢购物中分得一杯羹,各大商家做了看起来非常有吸引力的活动,比如1元抢6重优惠、第二家0元、全场3.5折起等等。因为往年有些商家都会在双11开始前一段时间先把商品价格涨价最后在双11当…查看详情

五个常见的数据库管理系统

数据库包含哪几个板块?数据库系统由4个部分组成: 1、数据库(database,DB)是指长期存储在计算机内的,有组织,可共享的数据的集合。数据库中的数据按一定的数学模型组织、描述和存储,具有较小的冗余,较高的数据独立性和易扩展性,并可为各…查看详情

2022年商标注册需要多久下来

  商标只能到商标管理部门进行注册,才受法律的保护,注册的商标是不容侵犯的,而注册商标需要满足一定的条件,并且要经过一定的程序,而这个程序是比较长的,那么注册商标一般要多长时间?万商云集小编给你来详细解答一下这一块的相关内容。2022年商标…查看详情

公认游戏性能最强手机,各大电竞手游职业选手都在用

近年来,电子手游行业发展迅猛,每年都有各种大型的赛事展开。细心的朋友们会发现,赛场上的各位职业选手们所使用的手机与我们平时用的常见手机有很大的区别。这是因为他们所使用的是更适合玩游戏的专业游戏手机,其各种性能都要比我们平时买的手机有很大的区…查看详情

windows10语言栏怎么设置

  Windows 10语言栏是一个非常重要的工具,它可以设定你想要使用的语言,使得你的电脑界面上显示相应语言的文字,帮助你更加方便的进行操作和使用。  一般情况下,语言栏的默认设置可能是英语或者其他语言是英语,但如果你不想使用英语,想要…查看详情

计算机经历的四个时代是什么?

计算机的发展经历了哪些阶段?计算机发展经历了四个发展阶段: 1、第一个发展阶段:1946-1956年电子管计算机的时代。 特点:体积大,功耗大,速度慢 2、第二个发展阶段:1956-1964年晶体管的计算机时代:操作系统。 特点:采…查看详情

6款功能比较强大的手机浏览器排行

手机浏览器是手机里很重要的一款应用软件,即使手机硬件系统跟不上,但是浏览器一定是里面功能最强大的软件,没有之一。接下来,就让我来给大家介绍6款功能比较强大的手机浏览器排行吧。1.西瓜浏览器它是全新一代手机移动设备开发的一款手机浏览器,它可以…查看详情

一键免费生成微信小程序 免费小程序制作软件

现在的小程序非常多,只要把小程序做起来,就可以赚很多的钱,包括还会有人主动找你合作,所以,想要开发自己的小程序,就需要看看小程序制作软件都有哪些,要用软件制作。 1、上线了 一个好评很高的小程序开发平台,几乎包含各个行业,包…查看详情

钉钉视频会议爆满怎么解决,这几种方法可以解决

  相信大家平时在疫情期间都使用过钉钉来进行学习和进行视频会议, 但是很多的时候会遇到一个问题就是视频会议爆满的情况,下面小编就给大家来详细介绍一下如何解决这个问题。  钉钉视频会议爆满怎么解决  1、在钉钉软件我的界面里,点击设置按钮。…查看详情

想要进行手机网站建设,选择平台要注意这几点

现在我们的手机可以说功能是越来越强大了,智能化越来越高,所以很多企业和个人,也利用了这一点进行互联网方面的营销,的确也带来了不错的效果,如果想要进行手机网站建设的话,在选择平台上需要注意这几点,因为选择好平台,才能够建立好更完美…查看详情

笔记本软件如何选?推荐这几款

现在的人们,已经慢慢的放弃使用纸质的笔记本了,更多的开始选择一些笔记本软件,来记录事情,或者是写各种学习的笔记和工作的笔记等等,但是在选择笔记本软件的时候,一定要注意根据自己的需求,那么笔记本软件如何选择呢?推荐这几款,一起来了…查看详情

it培训机构哪家好

哪个IT培训机构比较好?我是两年前中公优就业学出来的,当时网上也找了很多资料自己听……反复比对,最后觉得还是去中公,学的前端,目前在北京一家不算小的公司搬砖。我觉得培训了一趟还行,最起码现在工作不愁,生活也没啥太多担心的。当时网上也找了很多…查看详情

最新文章