服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

12亿条纽约出租车出行数据

2021-01-04 10:26:03 阅读(245 评论(0)

纽约出租车和汽车委员会(NYCTaxiandLimousineCommission,TLC在其网站上公布了2009年1月至2015年12月纽约整个城市共有12亿条出租车出行记录(压缩前数据量约为200GB)。这些数据详细记录了每辆出租车上下乘客的时间和地理位置(精确到经纬度)、旅行距离、旅行费用、支付方式和司机报告的乘客数量。作为城市发展和社会变革的见证人,出租车的活动轨迹为我们一窥纽约背后的故事提供了一扇很好的窗户。在阐述纽约出租车的分析结果之前,让我们简要介绍一下纽约出租车的行业背景。黄色出租车长期以来一直是城市的象征之一(YellowTaxi)这是纽约唯一一辆可以合法经营的出租车。自2013年夏季以来,TLC为数千辆绿色出租车提供了数千辆绿色出租车,以更好地服务于不受黄色出租车欢迎的地区(GreenTaxi)营业执照已颁发。从此,纽约人出行又多了一个选择。因此,TLC发布的数据仅包含了2013年8月以来的绿色出租车数据。然而,与纽约五大行政区域的黄色出租车自由载客不同,绿色出租车的上客区域有一定的限制。下图为TLC公布的绿色出租车合法营业区。绿色出租车可以在绿色区域自由载客,只能在灰色区域(肯尼迪国际机场和拉瓜迪亚机场)预约载客,不能在黄色区域载客。正是由于这个商业区的限制,我们下面看到了很多有趣的现象。首先,让我们来看看上下客地点的整体分布地图。为了显示效果,这两张地图没有包含Statenisland(斯塔滕岛)的数据(主要是因为斯塔滕岛的地理位置远离纽约其他四个行政区域,如果添加,显示效果不太理想)。这两张图分别显示了2009年至2015年7年出租车上下客场的分布地图。黄点代表黄色出租车,绿点代表绿色出租车。亮度越高,频率越高,分布越密集。曼哈顿地区是最密集的地区,无论是上客点还是下客点的分布地图(中间灰色长方块对应纽约中央公园)。除曼哈顿外,机场还有两个高度密集的地区:肯尼迪国际机场和拉瓜迪亚机场。黄点和绿点的分布大致符合黄色出租车和绿色出租车自由载客区的分布,尤其是上客点的分布。最后,通过比较上下客点的分布,我们发现,虽然两者主要集中在曼哈顿岛,但下客点的分布明显向外延伸。在阅读了空间维度的分布地图后,从时间维度来看,从2009年到2015年,特别是在2013年夏季引入绿色出租车后,旅游活动的数量发生了变化。首先是纽约人口最多的行政区--布鲁克林。在引进绿色出租车之前,黄色出租车的客户数量从20万开始/2013年月增长40万/在此期间,纽约人口逐渐从曼哈顿迁移到布鲁克林。在2013年夏季引进绿色出租车后,黄色出租车的客户数量急剧下降,并在半年内被绿色出租车超越。虽然出租车总客量继续增加,但到2015年,黄色出租车的客量已降至2009年的水平。其次是曼哈顿的情况。虽然从2014年开始,黄色出租车的客户数量开始下降,但总客户数量相对稳定。虽然绿色出租车被允许在上城区乘客,但整个地区仍然是传统黄色出租车的世界,绿色出租车只占很小的份额。不同于布鲁克林绿色出租车的强劲崛起,覆盖了黄色出租车和曼哈顿黄色出租车的国王地位,尽管皇后绿色出租车的市场份额在短短一年内上升到40%,但之后稳定下来,一直没有超过黄色出租车,而且后者的客户数量一直比较稳定。结合之前的绿色出租车免费乘客区和地理分布图,一个合理的解释是,除了曼哈顿,肯尼迪国际机场和拉瓜迪亚机场是纽约另外两个密集的地方,两个机场都在皇后区。由于黄色出租车可以在机场自由载客,而绿色出租车只能在机场预约载客,机场巨大的客户数量基本上流向黄色出租车。在对威廉斯堡北部的行政区域进行分析后,我们将重点关注具体的街区。从2009年到2015年,我们来看看纽约城出租车活动增长最快的街区。与皇后区快速增长的街区不同,布鲁克林区增长最快的街区集中在威廉斯堡北部。现在让我们关注威廉斯堡北部,看看这些年发生了什么。上图显示了威廉斯堡北部上客点的动态变化图。从总体趋势来看,从2009年到2014年,旅游活动迅速增长,然后开始稳定下来。具体到地理位置,快速增长的上客点主要集中在威思大街。(WytheAve)、贝里街(BerrySt)、北7街(North7)thSt),北11街(North11thst)和北12街(North12thst)附近。其中,Output在威思街、北11街和北12街附近、Verboten夜总会(通过谷歌地图,我们可以很容易地了解这些地方的类型)和威斯酒店(WytheHotel);在贝里街和北11街附近,ThewhiskeyBroklyn(酒吧);Shelter(餐厅)在威思街和北7街附近、RosaritoFishShack(餐厅)和D..O.CWineBar(餐馆)。这些消费场所基本上都是在过去的七年里开放的(或者万能谷歌),带动了当地的消费活动和旅游活动。这些消费场所基本上是在过去七年开放的(或通用谷歌),并推动了当地的消费活动和旅游活动。然而,随着2014年以后旅游活动数据的稳定,目前尚不清楚这是否意味着该地区的业务发展已经达到饱和阶段。结合美国国家气象中心提供的纽约中央公园的观测数据,我们可以分析雨天和雪天对旅游活动的影响。一般来说,雨天对纽约人的旅行没有明显影响;雪天有负面影响。雪越大,人们就越不愿意旅行。最后,让我们来看看旅行支付方式的变化。TLC提供的数据包括现金和信用卡两种有效的支付方式。我们可以看到,信用卡支付的比例从2009年的20%上升到2015年的60%,反映出信用卡在日常消费中越来越普遍。根据支付金额的细分,虽然信用卡支付的总体趋势越来越普遍,但当金额较小(小于10美元)时,人们仍然倾向于用现金支付。综上所述,由于时间和长度的关系,在本文中,我们只是用12亿条出行记录做了一些简单的分析,有权抛砖引玉。感兴趣的读者可以利用这些数据进行更有趣的分析,如纽约夜总会集中在哪里,从曼哈顿中心城市到机场需要多长时间,华尔街银行家通勤时间,9.11事件10周年纪念仪式交通,以及布鲁斯。威利斯和塞缪尔。杰克逊是否能在30分钟内从曼哈顿到西城到华尔街地铁站,等等。在去年11月的一篇博客文章中,Todschneider基于PostgreSQL使用他的苹果笔记本+PostGIS+R+GoogleMapi技术栈对这些数据进行了一系列分析,并对其进行了代码分析(SQL,将Shell和R脚本放在GitHub上。GitHub代码README.md文件中的一个问题引起了我们的兴趣:为什么不使用BigQuery和Redshift呢?BigQuery和Redshift分别是Google云平台和AmazonWebService上的数据仓库服务。本文中的数据分析也是基于Todd提供的脚本,并添加了2015年下半年的数据(Todd写文章时TLC还没有披露这部分数据)。然而,与Todd使用PostgresQL不同,虽然我们没有使用BigQuery和Redshift,但我们使用了另一个功能相似的云数据仓库--HashData(关于HashData数据仓库的详细介绍,请参考我们之前的文章)。因此,本文中使用的数据分析技术栈是:HashData+PostGIS+R+GoogleMapAPI。在HashData强大的并行执行引擎的帮助下,我们将Todd用他的苹果笔记本电脑完成的数据分析任务缩短到不到两个小时,不到20元。为了方便感兴趣的读者进行更深入的分析,我们在青云对象存储QingStor中放置了12亿条加工后的出行记录数据。HashData数据仓库提供直接从QingStor加载数据的功能。读者一旦将数据加载到数据仓库,就可以利用上述技术栈对数据进行分析。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

烂片排行榜 豆瓣公认的十大烂片

每个人在选择电影的时候,会按照自己所喜欢的类型去选择,类型不一样,对应的电影也是不相同的,所以,我们在看电影之前,需要先了解一下烂片排行榜都有哪些,从排行榜中选择更节省时间。 1、《返老还童(亚历克斯・巴顿奇事)》 推荐原因…查看详情

办公软件有哪些?一起来看看电脑上必装的10款Windows办公软件

电脑上好用的办公软件非常多,今天就给大家分享一下,电脑上必装的10款Windows软件,使用舒适感立刻提升,一起来看看吧。01*优效日历一款日历软件,界面设计简洁,无弹窗无广告,非常良心。最重要的是它能够与Windows原生日历无缝结合,不…查看详情

xor指令含义是什么

三菱取反指令的用法?三菱的取反指令(-/-)是放在输入与输出的连线之间的,取反指令的前面(条件端)为0(断开状态),取反后则为1(其后面的输出端被接通);取反指令的前面(条件端)为1(接通状态),取反后则为0(其后面的输出端不接通)。 取…查看详情

建筑装修企业网站建设重点在哪里?

网站建设流程、功能布局、视觉设计......别提!作为建筑装修企业,一座座高楼大厦,一套套暖心住宅都搞定了,还需要谈网站建设中关于设计的那些事儿吗?只谈重点,怎么做到建筑装修行业网站建设差异化,在用户选择中脱颖而出,才是企业想了解的。 极致…查看详情

正则表达式r如何匹配

正则表达式怎样匹配任意字符?.*匹配除\n以外的任何字符。/[\u4E00-\u9FA5]/汉字/[\uFF00-\uFFFF]/全角符号/[\u0000-\u00FF]/半角符号---------------------这个正则我写的,仔…查看详情

2021有哪些好用的新零售分销系统?

什么是新零售分销系统?其新就在于代理+零售+线上线下一体化结合,提供更好的结合运营模式的新零售方案,实现实现快速推广、多层分销机制等功能,那么2021有哪些好用的新零售分销系统? 1.微商来新零售分销系统 这是一款“商城+多级分销+分红代理…查看详情

最受年轻人欢迎的社交软件有哪些?好用的社交软件推荐

很多的年轻人在平时都会选择一些好用的软件来使用,其实现在的软件也是比较多的,找到一款好的社交软件才能够带来更好的体验。那么最受年轻人欢迎的社交软件有哪些呢?接下来就给大家介绍几款比较受欢迎的社交软件吧。 1、微信 其实现在大…查看详情

智能装修管理软件有哪些?让工程细节一览无余

相信人们在装修工程实施过程中,都希望能够对装修进程、装修成本、装修安全性、装修质量等进行实时跟进与把控,而这些往往需要借助专业的装修管理软件来辅助监控。今日为大家介绍几款比较靠谱的装修管理软件,把握每一处装修工程细节。 1、…查看详情

crm哪个好用?介绍一些现在较多企业在使用的crm

crm客户管理系统可以直接帮助企业减少销售的成本,提高市场竞争力,提高企业业绩,如何你现在正处于选择crm系统的过程中,不是很了解市场上的crm哪个好用,那下面小万就为你推荐一些。图片来源于网络 Crm哪个好用?好用的crm不是功能越多越好…查看详情

新闻app软件哪些好用 新闻app软件排行榜

  相信大家平时手里面都是有几款新闻类APP软件的,大家没事的时候刷刷新闻也是消磨时间的一大好处,下面小编就给大家来详细介绍一下新闻app软件哪些好用 新闻app软件排行榜这一块的内容,希望能帮助到大家、  新闻app软件哪些好用  1…查看详情

商标网注册平台都有哪些?不错的商标网注册平台推荐

一家公司想要吸引更多的客户在网站上让更多的客户找到,那么就应该要选择注册好自己的商标,一家企业的商标也代表了企业的形象,所以说对企业来讲是非常重要的,在进行商标设计的时候也是需要找到商标网的,因为不同的商标网设计也会带来很好的推广。在做商标…查看详情

免费好用的建站系统有哪些?

ocms建站系统是什么?公司旗下产品OCMS建站系统,是一个(CMS发布系统)为企业用户提供多元、高效、易用的互联网工具,同时配以成熟的运营优化服务体系,帮助企业有效地提升搜索引擎排名,同时提升企业用户消费者体验与互联网营销核心竞争力。制作…查看详情

网站建设的目标是什么?获取更多客户,赚取更多利益

随着网络的发展,人们的生活越来越便捷,足不出户就可以购买到大洋彼岸的产品,因此人们越来越依赖网络了,因此很多企业开始注重网站建设了,借此机会发展自身,那么网站建设的目标是什么呢?图片来源于网络 网站建设的目标是什么? 第一,提升企业形象互联…查看详情

b2b2c电商平台系统在交易流程中的相应配置

电子商务的关键要素是人、商品和场地,在目前比较流行的电子商务模式中,都是三要素的组合,无论是B2N、B2C、B2B2C都只是在模式调整中存在拓展差异。b2b2c电商平台系统中存在的现象就是端和C端混合且身份可转换,涵盖面比较广,相应的系统支…查看详情

云计算是什么意思 什么是云计算

最近几年云计算算是很流行的,但是很多的人对云计算都不是很熟悉,下面万商云集小编给大家来详细介绍一下云计算是什么意思 什么是云计算这方面的内容,希望能帮助到大家了解云计算这一块的详细内容。  什么是云计算?  话说英特尔创始人戈登·摩尔曾说过…查看详情

最新文章