服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

分析案例丨朝阳医院在2018年里的销售情况

2020-12-28 11:18:47 阅读(196 评论(0)

1、数据分析的目的数据分析是指通过适当的统计分析方法对收集到的大量数据进行分析,提取有用的信息,形成结论,并对数据进行详细研究和总结的过程。在本文中,假设以2018年朝阳医院的销售数据为例,目的是了解2018年朝阳医院的销售情况,需要了解月平均消费次数、月平均消费金额、客户单价、消费趋势等几个业务指标。2、数据分析的基本过程包括:数据获取、数据清洗、模型构建、数据可视化和消费趋势。2.1获取数据Excel中数据部分的截图:先导入包,再读取文件,读取时用object读取,防止一些数据无法读取:In[1]:importpandasaspdIn[2]:#读取数据(最好使用object类型) ...:data=pd.read_excel("2018年朝阳医院销售数据.xlsx",dtype="object")In[3]:#修改为DataFrame格式 ...:dataDF=pd.DataFrame(data)In[4]:dataDF.head()Out[4]:       购药时间     社保卡号  商品编码  销售商品名称的数量 应收金额 实收金额0 2018-01-01星期五   001616528 236701 强VC银翘片  6 82.8  691 2018-01-02星期六   001616528 236701 清热解毒口服液  1  28 24.642 2018-01-06星期三  0012602828 236701   感康  2 16.8  153 2018-01-11星期一 0010070343428 236701  三九感冒灵  1  28  284 2018-01-15星期五  00101554328 236701  三九感冒灵  8 224  208查看In[5]这些基本信息:#查看数据的形状,即几行几列 ...:dataDF.shapeOut[5]:(6578,7)In[6]:#查看索引 ...:dataDF.indexOut[6]:RangeIndex(start=0,stop=6578,step=1)In[7]:#查看每列列表头的内容 ...:dataDF.columnsOut[7]:Index(['购药时间','社保卡号','商品编码','商品名称','销售量','应收金额','实收金额'],dtype='object')In[8]:#查看每列数据统计数量 ...:dataDF.count()Out[8]:购药时间  6576社保卡号  6576商品编码  6577商品名称  6577销售数量  6577应收金额  6577实收金额  6577dtype:int64共有6578行7列数据,但“药品购买时间”和“社会保障卡号”两列只有6576个数据,“商品代码”到“实收金额”这两列只有6577个数据,这意味着数据缺失值,可以推断数据缺失值,除了“药品购买时间”和“社会保障卡号”两列各有一个缺失数据,这些缺失数据需要在以下步骤中进一步处理。2.2数据清洗数据清洗过程包括:选择子集、列名重命名、数据处理缺失、数据类型转换、数据排序及异常值处理2.2.1在我们获得的数据中选择子集,数据量可能非常大,不是每个列都有价值需要分析。此时,我们需要从整个数据中选择合适的子集进行分析,以便从数据中获得最大的价值。在这种情况下,不需要选择子集,这一步暂时可以忽略。2.2.在数据分析过程中,一些列和数据容易混淆或模棱两可,不利于数据分析。此时,需要将列替换为易于理解的名称,可以通过rename函数实现:In[9]:#使用rename函数,把"购药时间"改为"销售时间" ...:dataDF.rename(columns={"购药时间":"销售时间"},inplace=True) ...:dataDF.columnsOut[9]: Index(['销售时间', '社保卡号', '商品编码', '商品名称', '销售量', '应收金额', '实收金额'], dtype='object')2.2.在缺失数据处理获得的数据中很可能存在缺失值,通过查看基本信息,可以推断“购药时间”和“社保卡号”存在缺失值。如果不处理这些缺失值,会干扰以下数据分析结果。缺失数据的常用处理方法是删除包含缺失数据的记录或使用算法来补充缺失数据。为方便起见,dropna函数直接用于删除缺失的数据,具体如下:In[10]:#在删除缺失值之前  ...:dataDF.shapeOut[10]:(6578,7)In[11]:#使用dropna函数删除缺失值  ...:dataDF=dataDF.dropna()In[12]:#删除缺失值后  ...:dataDF.shapeOut[12]:(6575,7)2.2.在导入数据时,4数据类型的转换是为了防止导入不进来,所有数据都是object类型,但在实际数据分析过程中,“销售数量”、“应收金额”和“实收金额”需要浮点类型(float)数据、“销售时间”需要改为时间格式,因此需要转换数据类型。可以将astype()函数转换为浮点数据:In[13]:#将字符串转换为浮点数据  ...:dataDF["销售数量"]=dataDF["销售数量"].astype("f8")  ...:dataDF["应收金额"]=dataDF["应收金额"].astype("f8")  ...:dataDF["实收金额"]=dataDF["实收金额"].astype("f8")  ...:dataDF.dtypesOut[13]:销售时间  object社保卡号码  object商品编码  object商品名称  object销售数量  float64应收金额  float64实收金额  64dtypefloat64dtype:在“销售时间”这一列数据中,object存在星期这样的数据,但是在数据分析过程中不需要使用,所以要用split函数来划分销售时间列的中日期和周期,分割后的时间,Series数据类型返回:In[15]:#星期去除定义函数  ...:defsplitsaletime(timeColser):  ...:  timelist=[]  ...:  fortintimeColser:  ...:    timelist.append(t.split("")[0]) #[0]表示选定的分片,这意味着切割后选择第一个分片  ...:  timeser=pd.Series(timelist) #将列表转换为一维数据Series类型  ...:  returntimeser  ...:In[16]:#获取"销售时间"这一列数据  ...:t=dataDF.loc[:,"销售时间"]  ...:#调用函数去除周,获取日期  ...:timeser=splitsaletime(t)  ...:#修改"销售时间"这一列日期  ...:dataDF.loc[:,"销售时间"]=timeser  ...:dataDF.head()Out[16]:     销售时间     社保卡号  商品编码  商品名称 销售数量 应收金额  实收金额0 2018-01-01   001616528 236701 强大的VC银翘片 6.0 82.8 69.001 2018-01-02   001616528 236701 清热解毒口服液 1.0 28.0 24.642 2018-01-06  0012602828 236701   感康 2.0 16.8 15.003 2018-01-11 0010070343428 236701  三九感冒灵 1.0 28.0 28.004  2018-01-15    00101554328  236701    三九感冒灵   8.0  224.0  然后将切割后的日期转换为时间格式,以下数据统计方便:In[17]:#字符串转日期  ...:#errors='coerce'如果原始数据不符合日期格式,则转换值为Nat  ...:dataDF.loc[:,"销售时间"]=

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

商标注册证是什么?都会存在哪些问题?

说到商标注册的时候,很多企业都是了解的,因为大家都知道都会拥有自己的商标设计,只有自己的商标设计注册成功之后,才能够代表自己的企业形象,也能够抓住更多的潜在客户。那么商标注册证是什么呢?关于商标注册证这个问题可能很多人并不是很清楚,下面就一…查看详情

好看的视频网站有哪些?2022国内视频网站排行

  现在很多人都想找免费的视频网站看视频,毕竟不想付费冲会员,下面万商云集*就给大家整理了5个好看的视频网站,希望对大家有帮助,  1.139影视  这是一个老牌电影网站了,基本上新上映的电影、电视剧都可以在这个网站看到,影视资源特别多,也…查看详情

支付宝小程序如何打开?

  我怎么申请支付宝小程序?  第一步:注册  开发者使用企业支付宝账号登录蚂蚁开放平台,在入驻前请确保已完成支付宝账号的注册。  如需注册企业支付宝账号请访问:注册企业支付宝账号。  第二步:入驻  使用企业支付宝账户登录,依照入驻指引选…查看详情

淘宝滞销宝贝怎么处理?这几个方法你一定不知道

  每一家淘宝店铺内总是避免不了存在一些无法获取流量没有销量的商品。甚至连点击数都少得可怜。看着这些商品是不是觉得头疼呢?这篇文章我们就来说一说淘宝滞销宝贝怎么处理这一块的内容,希望能帮助到大家。  想要知道店铺中是不是存在滞销商品,首先就…查看详情

电脑上有哪些好用的变声器?圆完美声音的梦

任何人都希望自己能够有完美的声音,男人希望自己的声音更富有磁性,女人希望自己的声音更甜美,但大多数人的声音难以做到完美,随着科技的快速发展,变声器被研发了出来,这一软件的出现,圆了人们拥有完美声音的梦,那么电脑上到底有哪些好用的…查看详情

电商系统开发未来发展都有哪些趋势

伴随着电子商务的发展,电子商务与新兴各个产品相结合,开辟出了电子商务的各种渠道。比如电子商务APP、电商商城小程序、微商城等。电子商务的迅猛发展,使得很多传统企业纷纷开始转型。电商平台变得越来越重要,电商系统开发也在不断的发展、完善。202…查看详情

怎么查产品是否有专利?查产品是否有专利的方法

    在平时很多的小伙伴都不知道怎么查产品是否有专利的基本情况,而且对怎么查产品是否有专利都不是很熟悉,下面万商云集*就为大家整理了怎么查产品是否有专利这方面的相关内容,希望下面的内容能帮助到各位。    一、查产品是否有专利的方法  (…查看详情

2021美发收银软件免费版大盘点

随着时代的发展,科技的进步,像美发店这样的高流量门店,需要一款好用的商业收费管理系统,在这里给大家推荐几款免费实用的美发收银软件! 1.鹏点美容美发收银 是一款专门为美发行业设计的美发管理软件,广泛适用于美发会所,美发信息化管理,鹏点美发管…查看详情

适合读文学名著的app排行榜,重点推荐这几款

通过阅读名著不仅能够陶冶情操,同时还可以提升自己的文化内涵,如果家中有孩子的话,选择多读名著,自然也会给孩子带来终身受益的影响。不过现在越来越多的人开始放弃纸质书,而选择一些APP来阅读名著了,那么适合读文学名著的APP有哪些呢…查看详情

电脑如何打开dos命令窗口

windows中进入msdos的方式有几种?1.若电脑虽然有问题但还能进入Windows,请依次点击“开始→程序→MS-DOS方式”,你还可以点击“开始→运行”,在打开的对话框里输入“command”(不带引号,下同)。若你的系统是Wind…查看详情

erp解决方案能给中小企业带来什么?

erp解决方案有什么具体的功能?它能够帮助中小企业带来什么?图片来源网络erp解决方案可以从每个部门、每个业务流程中获取信息,打破部门之间的信息壁垒,将企业发展所需的信息高度集成。生产、销售、市场、分销、财务、人力资源、项目管理、存货管理、…查看详情

建网站的流程,网站建设的流程与步骤

虽然说随着技术的发展有很多辅助的工具出现,让网站的建设变得更加简单轻松了,也给了不少非专业人员,建这个网站的时候还是有相关步骤的。需要按照规定的流程步骤,这样去完成网站的建设,才能够保障日后更好的推广应用,那么建网站的流程是什么…查看详情

3.15特辑:中小企业线上做生意,如何更有尊严?

又是一年3.15国际消费者权益日,虽然3.15晚会延迟举办,但国家对这一大事件的重视不减,隆重推出“让消费者更有尊严”这一主题,万商云集的客户来自百行百业,4000+万中小企业都是万商云集的服务对象,对万商云集而言,“让客户更有尊严”亦是对…查看详情

万商云集2019品牌服务大使候选人专访之——北京团队郝磊

“不负客户信任,连夜帮客户抢注小程序”,是万商云集北京分公司客户代表——郝磊,所拥有的优质服务事迹。2017年,郝磊正式加入万商云集北京团队。两年来,她从一个新人成长为经验十足的老员工,并且是团队中值得大家学习的骨干。在工作中,郝磊仿佛有用…查看详情

写日记的软件哪个好用 写日记的软件推荐

有的人从小的时候就养成了一个爱写日记的习惯,一直到成年之后,这个习惯都一直存在,那么,对于现在互联网的时代,可以直接在软件上面写,写日记的软件都有哪些呢,相信很多人都还不知道。 1、纸言日记 是一款可以记载许多事情的一种ap…查看详情

最新文章