服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

分析案例丨朝阳医院在2018年里的销售情况

2020-12-28 11:18:47 阅读(183 评论(0)

1、数据分析的目的数据分析是指通过适当的统计分析方法对收集到的大量数据进行分析,提取有用的信息,形成结论,并对数据进行详细研究和总结的过程。在本文中,假设以2018年朝阳医院的销售数据为例,目的是了解2018年朝阳医院的销售情况,需要了解月平均消费次数、月平均消费金额、客户单价、消费趋势等几个业务指标。2、数据分析的基本过程包括:数据获取、数据清洗、模型构建、数据可视化和消费趋势。2.1获取数据Excel中数据部分的截图:先导入包,再读取文件,读取时用object读取,防止一些数据无法读取:In[1]:importpandasaspdIn[2]:#读取数据(最好使用object类型) ...:data=pd.read_excel("2018年朝阳医院销售数据.xlsx",dtype="object")In[3]:#修改为DataFrame格式 ...:dataDF=pd.DataFrame(data)In[4]:dataDF.head()Out[4]:       购药时间     社保卡号  商品编码  销售商品名称的数量 应收金额 实收金额0 2018-01-01星期五   001616528 236701 强VC银翘片  6 82.8  691 2018-01-02星期六   001616528 236701 清热解毒口服液  1  28 24.642 2018-01-06星期三  0012602828 236701   感康  2 16.8  153 2018-01-11星期一 0010070343428 236701  三九感冒灵  1  28  284 2018-01-15星期五  00101554328 236701  三九感冒灵  8 224  208查看In[5]这些基本信息:#查看数据的形状,即几行几列 ...:dataDF.shapeOut[5]:(6578,7)In[6]:#查看索引 ...:dataDF.indexOut[6]:RangeIndex(start=0,stop=6578,step=1)In[7]:#查看每列列表头的内容 ...:dataDF.columnsOut[7]:Index(['购药时间','社保卡号','商品编码','商品名称','销售量','应收金额','实收金额'],dtype='object')In[8]:#查看每列数据统计数量 ...:dataDF.count()Out[8]:购药时间  6576社保卡号  6576商品编码  6577商品名称  6577销售数量  6577应收金额  6577实收金额  6577dtype:int64共有6578行7列数据,但“药品购买时间”和“社会保障卡号”两列只有6576个数据,“商品代码”到“实收金额”这两列只有6577个数据,这意味着数据缺失值,可以推断数据缺失值,除了“药品购买时间”和“社会保障卡号”两列各有一个缺失数据,这些缺失数据需要在以下步骤中进一步处理。2.2数据清洗数据清洗过程包括:选择子集、列名重命名、数据处理缺失、数据类型转换、数据排序及异常值处理2.2.1在我们获得的数据中选择子集,数据量可能非常大,不是每个列都有价值需要分析。此时,我们需要从整个数据中选择合适的子集进行分析,以便从数据中获得最大的价值。在这种情况下,不需要选择子集,这一步暂时可以忽略。2.2.在数据分析过程中,一些列和数据容易混淆或模棱两可,不利于数据分析。此时,需要将列替换为易于理解的名称,可以通过rename函数实现:In[9]:#使用rename函数,把"购药时间"改为"销售时间" ...:dataDF.rename(columns={"购药时间":"销售时间"},inplace=True) ...:dataDF.columnsOut[9]: Index(['销售时间', '社保卡号', '商品编码', '商品名称', '销售量', '应收金额', '实收金额'], dtype='object')2.2.在缺失数据处理获得的数据中很可能存在缺失值,通过查看基本信息,可以推断“购药时间”和“社保卡号”存在缺失值。如果不处理这些缺失值,会干扰以下数据分析结果。缺失数据的常用处理方法是删除包含缺失数据的记录或使用算法来补充缺失数据。为方便起见,dropna函数直接用于删除缺失的数据,具体如下:In[10]:#在删除缺失值之前  ...:dataDF.shapeOut[10]:(6578,7)In[11]:#使用dropna函数删除缺失值  ...:dataDF=dataDF.dropna()In[12]:#删除缺失值后  ...:dataDF.shapeOut[12]:(6575,7)2.2.在导入数据时,4数据类型的转换是为了防止导入不进来,所有数据都是object类型,但在实际数据分析过程中,“销售数量”、“应收金额”和“实收金额”需要浮点类型(float)数据、“销售时间”需要改为时间格式,因此需要转换数据类型。可以将astype()函数转换为浮点数据:In[13]:#将字符串转换为浮点数据  ...:dataDF["销售数量"]=dataDF["销售数量"].astype("f8")  ...:dataDF["应收金额"]=dataDF["应收金额"].astype("f8")  ...:dataDF["实收金额"]=dataDF["实收金额"].astype("f8")  ...:dataDF.dtypesOut[13]:销售时间  object社保卡号码  object商品编码  object商品名称  object销售数量  float64应收金额  float64实收金额  64dtypefloat64dtype:在“销售时间”这一列数据中,object存在星期这样的数据,但是在数据分析过程中不需要使用,所以要用split函数来划分销售时间列的中日期和周期,分割后的时间,Series数据类型返回:In[15]:#星期去除定义函数  ...:defsplitsaletime(timeColser):  ...:  timelist=[]  ...:  fortintimeColser:  ...:    timelist.append(t.split("")[0]) #[0]表示选定的分片,这意味着切割后选择第一个分片  ...:  timeser=pd.Series(timelist) #将列表转换为一维数据Series类型  ...:  returntimeser  ...:In[16]:#获取"销售时间"这一列数据  ...:t=dataDF.loc[:,"销售时间"]  ...:#调用函数去除周,获取日期  ...:timeser=splitsaletime(t)  ...:#修改"销售时间"这一列日期  ...:dataDF.loc[:,"销售时间"]=timeser  ...:dataDF.head()Out[16]:     销售时间     社保卡号  商品编码  商品名称 销售数量 应收金额  实收金额0 2018-01-01   001616528 236701 强大的VC银翘片 6.0 82.8 69.001 2018-01-02   001616528 236701 清热解毒口服液 1.0 28.0 24.642 2018-01-06  0012602828 236701   感康 2.0 16.8 15.003 2018-01-11 0010070343428 236701  三九感冒灵 1.0 28.0 28.004  2018-01-15    00101554328  236701    三九感冒灵   8.0  224.0  然后将切割后的日期转换为时间格式,以下数据统计方便:In[17]:#字符串转日期  ...:#errors='coerce'如果原始数据不符合日期格式,则转换值为Nat  ...:dataDF.loc[:,"销售时间"]=

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

python怎么下载安装

华为matebook14怎么下载python?下载方法如下 首先需要到python的官网上下载安装包,然后点击安装,选择默认安装路径,然后一直下一步下一步即可。 2.单击左下角的开始菜单,然后右键点击【计算机】,选择【属性】这个选项…查看详情

实时监控系统到底指的是什么呢?随小编一起揭密实时监控的真面目

如今足不出户就能了解到外面的世界,即使你没空看管你的门店,也能靠实时监控让自己放心,实时监控在现在高信息化时代随处可见,而随处可见的实时监控系统到底指的是什么呢?接下来就让我为大家揭晓实时监控的真面目吧。 实时监控是一种包括数据…查看详情

推荐几款超全面的画图软件,功能众多且老少通用

画图是一种艺术,随着时代的发展,我们从纸上画图到各大电子产品里画图,有些人拿它来放松,有些人拿它来工作,有些人拿它来赚钱。今天就来推荐几款超全面的画图软件。希望大家可以喜欢呀! 1.AdobePhotoshopCS6 这个A…查看详情

psd是什么文件的格式

psd格式图片有什么用?psd,格式,1.最大的作用是保持文件的最原始的信息,而其它格式都会失真! 2,可以在其它支持PSD格式的设计软件上通用,而文件信息能够适应当前软件配置的同时本身不会有很大的失真! 3.PSD格式支持多种…查看详情

企业注册cn域名到底好不好?

很多企业在搭建官网想法萌芽之初,关于域名的知识还是一知半解,大多只知道最为常见的com域名认为它便是最好的选择。而对于cn域名,根本不了解甚至不曾听说。下面小万就给大家细数一下cn域名的好处有哪些,解答企业注册cn域名到底好不好。 图片来源…查看详情

常见的CRM系统内容和功能

CRM系统是一种企业管理软件,也是一种管理理念,CRM系统内容是以客户为中心来统一实施的客户关系管理系统,为实施企业提供统一的管理界面和体系化的企业管理流程。运用先进的数字化技术,整理、分析和挖掘客户信息,为客户提供专属服务的同时,为企业寻…查看详情

有这6个信号,企业还不用CRM就晚了

许多销售人员在向企业推荐CRM产品时,老板总觉得自己不需要。殊不知,你正遭遇的经营管理困惑正亟待CRM来拯救。小万总结了企业该使用CRM产品的6个警告信号,一旦出现1个或多个信号时,企业就是时候考虑引入CRM产品了。1、部门之间缺少协作企业…查看详情

手机上怎么打开ai文件

  AI文件是Adobe Illustrator文件的缩写。它是一种不可压缩的向量图形文件,通常用于创建和编辑矢量图。然而,由于其格式独特,AI文件不是所有设备都可以直接打开的。本文将向您介绍如何在手机上打开AI文件,以便您能够在任何地方…查看详情

购物网站运营不能随波逐流,创新思维才能有所突破

全行业数字化趋势造就了大批购物网站,除去行业内几个大型网站平台可以凭借平台规模和流量,自由设置运营规则以外,各行各业的购物网站都需要努力学习运营知识来提升购物网站运营效果。很多人花了大量的时间和精力在运营上,但是取得的实际效果却不理想,下面…查看详情

盘点那些好用的收银系统免费软件

随着经济的高速发展,当今社会的收银方式也越来越多样化,分别有线上收银,线下收银等等,进行合理化便捷化的收银就需要一定的收银系统免费软件,今天就给大家推荐一波。 1.微收银系统免费软件 这款软件专门为各大门店和商铺的店长和工作人员所打造,提高…查看详情

炒股软件排行榜 免费的炒股软件

随着互联网时代的不断蔓延,我们可以发现,各种各样的炒股软件。上大学时,我们可以利用自己的一点逻辑思维进行炒股,赚一点小小的零花钱,下面为大家推荐几个炒股软件APP大家可以自己选择自己合适的闲暇时间来炒股一下。1、国泰君安app这款软件图线条…查看详情

干洗店加盟连锁费用大概要多少钱

  干洗店加盟连锁是一种快速开办自己的干洗店的方式,通过加盟,在总部的帮助和支持下,开店时间和风险都得到减小。但是,不同的连锁品牌,加盟费用和其他费用也会有所不同。本文将详细描述干洗店加盟连锁的费用,并为您提供一些有关开设干洗店的建议。  …查看详情

如何激活windows10专业版

  激活Windows10专业版是一个简单而重要的步骤,它确保您的操作系统深度集成并使用所有可用功能。激活Windows 10产品密钥是非常重要的,因为它提供了Windows操作系统的完整安全,更新和新特性。在这篇文章中,我们将介绍如何激…查看详情

What,年轻人现在都使用声音交友软件交友了?

当您需要靠交友来缓解孤独时,优美好听的声音总会给人带来无限的遐想。通过声音交友软件去结交新朋友,也是一见非常有意思的事情,我们可以通过声音交友软件和来自世界各地的朋友聊天,找到你心中的那个灵魂伴侣。为此小编帮大家收罗了几款高质量的声音交友软…查看详情

供应链管理系统可以解决企业哪些问题

供应链管理系统可以解决企业面临的许多问题。以下是其中一些主要问题和供应链管理系统的解决方案: 1.库存管理:供应链管理系统能够帮助企业有效管理库存,避免过量或不足的库存。它可以跟踪销售数据、预测需求、优化采购计划,并确保库存与需求相匹配。 …查看详情

最新文章