对于Citi Bike和用户骑行的分析
2020-12-31 14:46:10 阅读(209) 评论(0)
“花旗银行”是纽约2013年5月27日启动的自行车共享计划(CitiBank)赞助并命名为“花旗自行车”(CitiBike)。皇后区和泽西市有8000辆自行车和500个车站,在曼哈顿,布鲁克林。为纽约居民和游客提供方便、快捷、省钱的出行方式。到处都可以借到CitiBank,并在他们的目的地归还。使用CitiBank的方法很简单,购买会员资格,然后在附近找到可用的CitiBank,使用会员key解锁,在有效时间内(30或45分钟)归还并锁定CitiBank。由于每个CitiBank租赁站点都有GPS位置信息,因此可以记录用户租赁和骑行过程中的数据。“CitiBank“官方网站为用户提供每次骑行的数据,包括租赁开始和结束的位置和时间、整个骑行过程的时间、自行车ID、用户的性别和出生日期。我们将使用python对“CitiBank为了了解纽约自行车共享计划,分析了2015年的数据。并回答问题,比如谁在使用CitiBike时开始每次骑行的时间和距离,以及哪些骑行路线最受欢迎。首先,我们将需要使用的库文件导入python,包括numpy,pandas,datetime和pyplot用于数据可视化,我们将根据不同的分析方向导入其他库文件。123456importnumpimpandaspdimportime,datetimeimportmatplotlib.pyplotasplt#读取CitiBike数据,创建数据表cb1=pd.DataFrame(pd.read_csv('201501-citibike-tripdata.csv'))按月存储CitiBike数据,因此,我们需要每月阅读并拼接每个月的数据。12345#拼接导入的数据表,总结后的数据表称为cbcb=cb1.append(cb2,ignore_index=False)#查看数据表维度cb.shape(9937969,15)2015年CitiBike数据共包含993万行,15列数据。每一行数据都代表“一次”CitiBank租赁和骑行记录。每一行数据都代表“一次”CitiBank租赁和骑行记录。我们首先对2015年的“惊人的990万次骑行”进行了调查CitiBank统计数据中的几个关键指标,每年共有497个租赁点,即车站,8477辆自行车被使用。自行车的使用次数高达993万次,平均每辆自行车每天租3.21次。可见人对“可见人对”CitiBank”的热情。平均每次骑行时间为16.13分钟。以下是每个关键指标的统计代码和结果。12346791111211141618(cb['startstationname'].unique()497#唯一的自行车ID计数len(cb['bikeid'].unique()8477#骑行次数计数cb['starttime'].count()9937969#每辆自行车租赁频率cb[ལbikeid'].count()/len(cb['bikeid'].unique()1172.34505133239#每辆自行车每日租赁频率cb['bikeid'].count()/len(cb['bikeid'].unique()/3653.21904250178966#每次租赁的平均时间(分钟)cb['tripduration'].sum()/cb['bikeid'].count()CitiBike在6016.134942371323582015年的总体使用趋势由低到高,CitiBike在2月份使用量最低,然后使用量逐月增加,直到9月份使用量最高。十一月份使用量开始下降。11月份使用量开始下降。这可能是由季节和温度因素引起的。以下是对骑行数据的季度汇总和比较。以下是每月汇总骑行数据和折线图的代码。123467891111211114161718#starttime设置日格式cb[ལstarttime']=pd.to_datetime(cb['starttime'])#将startime设置为数据表索引cb=cb.set_index('starttime')#按月计算骑行数据cb_month=cb.resample('M',how=len)#bikeid字段group提取汇总cb_month=cb_month['bikeid']#按月汇总的骑行次数折线图plt.rc('font',family='STXihei',size=15)a=np.array([1,2,3、4、5、6、7、8、9、11、12)plt.plot(group_cb_month,'g8',group_cb_month,'g-',color='#39A2E1',linewidth=3,markeredgewidth=3,markeredgecolor='#39A2E1',alpha=0.8)plt.xlabel('月份')plt.ylabel('租赁骑行次数')plt.title('2015年,CitiBike每月骑行次数')plt.grid(color='#95a5a6',linestyle='--',linewidth=1,axis='y',alpha=0.4)plt.xticks(a,('1月','2月','3月','4月','5月','6月','7月','8月','9月','10月','11月','12月'))plt.show()根据2015年第四季度的数据,用户对CitiBike的使用受季节因素的影响,第一季度气温最低,CitiBike使用量也较低。夏秋交替,第二季度和第三季度使用量最高。12346791111211415#季度计数自行车数据cb_quarterly=cb.resample('Q',how=len)#bikeid字段group按季度总结提取_cb_quarterly=cb_quarterly['bikeid']#按季度总结的骑行次数绘制柱状图plt.rc('font',family='STXihei',size=15)a=np.array(1,2,3,4)plt.bar(1,2,3,4),group_cb_quarterly,color='#39A2E1',alpha=0.8,align='center',edgecolor='white')plt.xlabel('季度')plt.ylabel('租赁骑行次数')plt.title('2015年,CitiBike每季度骑行次数')plt.legend(['次数'],loc='upperright')plt.grid(color='#95a5a6',linestyle='--',linewidth=1,axis='y',alpha=0.4)plt.xticks(a,('一季度','二季度','三季度','四季度'))plt.show()谁在使用CitiBike?我们很好奇993万次骑行的巨大数据背后是谁在使用CitiBike。由于获得的数据只包括用户性别、出生日期和会员类别的数据,我们只从这三个维度简要描述CitiBike用户。由于获得的数据只包括用户性别、出生日期和会员类别的数据,我们只从这三个维度简要描述Citibike用户。2015年,66%的男性用户使用Citibike服务,66%是男性用户,女性用户占20%,13%的用户性别未知。这让我想起了北京自重25公斤的自行车共享。以下是计算用户性别比例和绘制饼图的代码。12345678910#根据用户性别总结并计算不同性别的user_gender=cb.groupby('gender')['bikeid'].agg(len)/cb["bikeid"].count()*100#总结用户性别比例饼图pltt.rc('font',family='STXihei',size=15)colors=["#052B6C","#39A2E1","#EA1F29"]name=['未知','男性','女性']plt.pie(user_gender,labels=name,colors=colors,explode=(0,0,0),startangle=60,autopct='%1.1f%%')plt.title('Citibike用户性别比例')plt.legend(['未知','男性','女性'],loc='upperleft')plt.show()30-50岁的用户热衷于骑自行车。我们将Citibike的用户年龄分为四组,0-18岁为青年组,18-30岁为青年组,30-50岁为中年组,50岁以上为老年组。其中,青年组的租赁和骑行次数最少,中年组的租赁和骑行次数最多,其次是青年组。其中,青年组的租赁和骑行次数最少,中年组的租赁和骑行次数最多,其次是青年组。50岁以上的老年组也有相当多的记录。以下是用户年龄分组和汇总柱状图的代码。用户年龄由出生日期和当前年份计算,包括一些极端值。123#查看出生日期的cb['birthyear'].min(),cb['birthyear'].max()(1885.0,199.0)这里1885年很奇怪,根据这个出生日期,2016年用户的年龄已经达到了131岁。具体原因我们不知道,但由于CitiBike的整体数据比较规范,不需要清洗,所以我们选择保留这个值。2015年和用户出生日期计算年龄cb[#;age']=2015-cb['birthyear']#最小年龄为17岁,最大年龄为131岁cb['age'].min(),cb['age'].max(17.0,131.0)#用户年龄分组bins=[0,18,30,50,131]group_age=['少年','青年','中年','老年']cb['group_age']=pd.cut(cb['age'],bins,labels=group_age)#数据按年龄分组汇总user_age=cb.groupby('group_age')['group_age'].agg(len)#生成用户年龄分布柱状图pltt.rc('font',family='STXihei'
推荐阅读
- linux怎么样查看端口占用情况
怎么看linux下tomcat的80端口是否打开?使用telnet命令可以检查在防火墙和selinux都关闭的情况下,使用telnet192.168.x.x80即可如果80端口是打开的,则会进入telnet界面,一般显示为空界面如果80端口…查看详情
- 实测六款图片压缩软件,用完都说好
当前手机相机已经大部分取代了相机,因此很多人都会利用手机拍照,但是手机内存也是有限的,很多人的照片都是很有回忆的,所以不会选择删除,最好的办法就是对图片进行压缩,以下是我给大家推荐的图片压缩软件。1、美图秀秀美图秀秀为手机拍照,具备照片特效…查看详情
- 学linux能干什么
学python有什么用?1、Python可用于开发基于控制台的应用程序。例如:IPython。IPython是一个交互式计算系统。主要包含三个组件:增加的交互式“Pytho1hell”,解耦的双过程通信模型,交互式并行计算的架构。支持变量自…查看详情
- 2021 年度编程语言排行榜?
2021年度编程语言排行榜?今日,IEEESpectrum发布了2021年度编程语言排行榜,其中Python在总榜单以及其他几个分榜单中依然牢牢占据第一名的位置。另外值得关注的是微软C#语言,它的排行从2020年的第23名跃升至了今年的第6…查看详情
- 多屏管理软件是什么?
在办公的时候,可以通过一些软件,把自己想要表达的东西播放出来,多屏管理软件就有这种功能,它可以很好的把我们想要播放的东西通过多个屏幕来呈现,包括在家也可以办公,那么,多屏管理软件介绍是什么? 1.多屏管理软件介绍 Displ…查看详情
- 家装设计软件哪个好?家装设计软件推荐
家庭设计装修其实是非常关键的,一般都会找到比较靠谱的装修公司装修公司的设计师,在选择家庭设计装修的时候都会使用到比较靠谱的软件,因为只有靠谱的软件在进行设计装修的时候,才能够带来更好的设计效果。那么家装设计软件哪个好?下面就一起…查看详情
- 专利加10分政策会不会变?
在平时很多的小伙伴都不知道专利加10分政策会不会变的基本情况,而且对专利加10分政策会不会变都不是很熟悉,下面万商云集小编就为大家整理了专利加10分政策会不会变这方面的相关内容,希望下面的内容能帮助到各位。 一、专利加10分政策会不会…查看详情
- 怎样利用好自己的安卓平板?推荐8款安卓平板软件
使用安卓平板很多年了,随着时代的进步,安卓平板软件也一直在推陈出新,我给大家推荐8款好用的安卓平板软件,体验过它们之后,你就会对安卓平板爱不释手,大家快快去下载吧。1.星尘浏览器安卓平板适应最好的浏览器。2.Xodo主要的功能就和Adobe…查看详情
- 商标设计可以选择哪些软件呢?这几款的功能强大
对于企业来说,商标就像是一个形象代言人,并且对于产品和企业都能够起到很好的推广作用,所以说在设计产品的商标时,也一定要引起重视,最好在各个细节上也要有所把握,设计一个能够让人耳目一新的商标,才可以让产品更容易被消费者记住,那么商标设计可以选…查看详情
- 做网络推广好吗?给你列出它的好处,你自然就知道答案了
随着时代的发展,人人都开始接触互联网。随着而来的,是网络推广在企业发展中的重要性愈发明显。据了解,在当下市场不断发展与完善的过程之中,已经有越来越多的公司开始将互联网当作了其销售的重要渠道。但很多企业,也都有一个疑问:做网络推广好吗?图片来…查看详情
- 2019双十一暗战:二选一将持续
2019的电商行业变化不可谓不大,亚马逊推出中国市场,阿里巴巴收购网易考拉,中国电商市场已经形成阿里巴巴、京东和拼多多三足鼎立之势,而双十一即将到来,今年的双十一又将上演怎样的一幕呢?对于我们很多人来说,十一国庆节是假期,但是对于很多电商从…查看详情
- 选择网络运营公司到底有什么好处?
术业有专攻,专业的事情交给专业的人来做,这样就会将资源最大限度的利用。互联网时代,一个企业想要自己的网站在互联网中众多的官网脱颖而出,更离不开互联网工具、离不开专业的人才,但摆在老板面前的事实却是组建运营团队成本太高。对此,网络运营公司应运…查看详情
- 如何给压缩文件加密
压缩文件怎么设置密码?1、在右键点击文件夹后弹出的菜单栏中选“添加压缩文件”。; 2、在进行压缩文件操作时,选择左下角的“添加密码”。; 3、输入密码及再次输入密码,点击确认。; 4、然后点击“立即压缩”。; 5、压缩后,选择压缩文…查看详情
- 操作系统软件有哪些?常用的6个操作系统
作为操作软件对于我们现在的社会当中是比较常见的存在,无论是电脑还是手机上的操作系统都是有很多不同的存在,在电脑中分的系统更是比较多的存在,那么今天我们就来盘点一下操作系统软件都有哪些。 1、Windows 作为行业老大来说…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品
找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
在线咨询
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达
关注万商云集
和10万中小企共成长
TOP

企业首选的数字选用平台






