大数据看共享汽车——EVCard篇

去年2月份我做过共享单车的数据分析,也分析出一些有意思的点。从2017年10月1日开始,历时3个多月,我收集了EVCard和GoFun共享汽车的公开数据。下面整理成一个动态的报告,一起看一下共享汽车的现状。

注:该数据分析及报告仅代表个人意见,仅供参考,数据来自于API请求的结果,只包含公开的信息,不涉及用户信息。引用、使用该报告引起的任何后果(包括但不限于版权、侵犯法律法规)等,由使用方承担。

基本信息

EVCARD品牌是上海国际汽车城新能源汽车运营服务有限公司开展的电动汽车分时租赁项目。 EVCARD电动汽车分时租赁是借助物联网技术实现的一种新型汽车分时租赁服务模式,实现了用户任意时间自行预订,任意网点自助取还的用车需求。 上海国际汽车城 新能源汽车运营服务有限公司是上海市第一家面向新能源汽车开展租赁和共享的专业公司,主要开展面向集团用户(B2B、B2B2C模式)以及私人用户(B2C)的新能源汽车长短租服务

我们先来看一些关于车的基本的信息。

从上面图可以知道,EVCard的车品牌比较多,其中还是北汽、奇瑞、江淮的低端车型比较多,中端的较大的车型荣威E50也占据了11.03%的分量。高端的宝马i3也有,但极少。虽然EVCard官网上面虽然列出了车型,但可能更新较慢和数据中的车型不一致。

业务概况

根据采集的数据,截止2017年11月底,EVCard目前在全国总共有12152辆车。下图是车辆增长的情况。整体趋势来讲呈平稳上升趋势,说明目前发展状况稳定。

我们再来看看车辆的数量分布。可以看出来在上海以及附近的省份有很多的车辆,和GoFun正好是相反。

由于EVCard必须在指定地点借还,停车场的数量多少就直接影响到用户体验。随着车的增长,停车场的数量也应该有相应的增长才对,从图里面也看出停车场的增长较为平稳。截止2017年11月底,全国总共有5540个停车场,远超GoFun的2887个停车场。

在停车场各省的分布情况中,几乎是和车辆的分布接近。

我们再来看一下多少汽车共用一个停车场的情况。从图上看出,平均来看大致一个停车场目前有2辆车的规模。如果一个停车场容纳的车越多,那么用户能够拿到车的几率越大,从这方面看也是一个好事。如果停车场的数量较少,网点不密集,就会影响用户的到达性。从这张图可以看到出有几个省的比例到了4到5,分析看来是由于这些省份的停车场数量偏少。你可以在”停车场分布”图中,具体看看停车点的分布。

停车场分布

下图是停车场的分布图,图上标记了全国的停车场的位置,可以自由浏览。上海作为EVCard的大本营,有非常丰富的网点,可想上海的用户出行是非常的方便的。

image.png

车辆流转情况

下图是三个月内车的使用次数的分布。横坐标是使用的次数,纵坐标是次数对应的车的数量。0到70次占据了相当多的数量,然而130到170次之间也有一个小的起伏。平均下来有每天0.5到2次的使用频率还是不错了。

但使用次数只是运营情况的一种体现。如果每次使用时间比较短,停车时间比较长,对EVCard也不是一个好事。下图展示了停车时长的分布。横坐标代表停车的时长(小时)最长统计到70小时,纵坐标代表有多少车次。从图上看由于使用的频率比较高,停留时间集中在较短的一端比较多。

下图展示了使用时长的分布。横坐标代表停车的时长(小时)最长统计到70小时,纵坐标代表有多少车次。对比停车时长的分布,使用时长的分布比较明显的集中在0到6小时之间,这也是共享出行的特点。由于EVCard有包天的租车服务,所以长期的出行的费用也是可以接受,长达70小时以上的使用时间也有1300多车次。

车的轨迹

下面这个动画展示了一辆车的直线运动的轨迹。由于我们仅能得到出发、到达地无法获得中间的轨迹,所以只能这样按照直线标注。图上展示最近几个点,以及位置迁移情况。

电池电量

下面这张图展示某一辆车的电池变化情况,其中深色区域代表该车在停车场内没有被使用。

总结

根据以上的分析,EVCard目前比较集中上海附近的省份,尤其是在上海集中优势的力量建立非常密集的网点,对于用户的使用无疑是一个好事。长期来看,停车场和车在稳步的发展,从小型车到大型车的车型的多样化,也为用户的不同出行带来了方便。。

附件

互动网站:http://www.april1985.com/sharecar_report/evcard/report/index.html
源代码:http://www.april1985.com/sharecar_report/

大数据看共享汽车——GoFun篇

去年2月份我做过共享单车的数据分析,也分析出一些有意思的点。从2017年10月1日开始,历时3个多月,我收集了GoFun和EVCard共享汽车的公开数据。下面整理成一个互动的报告(文后有链接及代码),一起看一下共享汽车的现状。

声明:该数据分析及报告仅代表个人意见,仅供参考,数据来自于API请求的结果,只包含公开的信息,不涉及用户信息。
引用、使用该报告引起的任何后果(包括但不限于版权、侵犯法律法规)等,由使用方承担。
未经许可禁止转载

基本信息

GoFun出行是首汽集团针对移动出行推出的一款新能源共享汽车产品,秉承首汽集团作为全国最大出行服务运营企业的多年经验和优势资源,响应政府号召,把握“新能源+车联网”的全趋势,致力于整合用户碎片化的用车需求,提供便捷、绿色、快速、经济的出行服务。 GoFun出行是共享行业新兴的一种租车模式,车辆无人值守,用车全程App操作,以“分钟+公里”计算并提供汽车的即取即用、分时租赁服务,消费者可按个人用车需求预订车辆。GoFun出行已相继完成全国20余个城市的布局,其中不乏北京、上海、武汉、成都、南京等一、二线城市,更有西安、青岛、昆明、桂林、三亚等重要旅游地。

我们先来看一些关于车的基本的信息。

从上面几幅图可以知道,GoFun绝大多数车型都是奇瑞的车。两座和四座的车是主流,车身小巧一方面比较节能,另一方面比较容易操作。


为什么是奇瑞的车占据绝大部分份额呢?从网络搜索到两条新闻可以知道奇瑞是GoFun的合作伙伴,这也不足为奇了:

#业务概况

根据采集的数据,截止2018年1月26日,GoFun目前在全国总共有10327辆车。下图是车辆增长的情况。注意,车辆数量有时候会变少,这是因为数据采集时只能采集到没在使用的汽车,所以会少一些。整体趋势来讲呈平稳上升趋势,说明目前发展状况稳定。

我们再来看看车辆的数量分布。可以看出来在四川、广东、陕西、福建等省有很多的车辆,属于比较正常的情况。比较奇怪的是上海的车辆数量很少,我猜测在上海早已有竞争对手占据了市场,还不如避而求其次。

由于GoFun必须在指定地点借还,停车场的数量多少就直接影响到用户体验。随着车的增长,停车场的数量也应该有相应的增长才对,从图里面也看出停车场的增长较为平稳。截止2018年1月26日,全国总共有2887个停车场。

在停车场各省的分布情况中,几乎是和车辆的分布接近。

我们再来看一下多少汽车共用一个停车场的情况。从图上看出,平均来看大致一个停车场目前有3辆车的规模。如果一个停车场容纳的车越多,那么用户能够拿到车的几率越大,从这方面看也是一个好事。如果停车场的数量较少,网点不密集,就会影响用户的到达性。从这张图可以看到出湖北省的比例最高,从之前的车辆数量排名看湖北省排名第5,但停车场数量排名第10,停车场数量偏少。你可以在”停车场分布”图中,具体看看武汉市的网站分布。

停车场分布

下图是停车场的分布图,图上标记了全国的停车场的位置,可以自由浏览。以成都市为例,作为西部重点城市,共享汽车的发展和共享单车一样的迅猛。目前GoFun的覆盖面还是比较广,主要集中在人口密集的三环境内、南边的高新区。在西边的郫都区和东边的工业区龙泉也有所分布。但从图中可以看出显然北边和东北方向都没有太多的分布,这也和城市的发展密切相关。在西边的旅游城市都江堰,GoFun也有大量的网点,这也给出行的人带来了丰富的选择。

车辆流转情况

下图是三个月内车的使用次数的分布。横坐标是使用的次数,纵坐标是次数对应的车的数量。近似一个正态分布,大约70%的车都在24到72的区间。平均起来每天0.3次到1次左右。

但使用次数只是运营情况的一种体现。如果每次使用时间比较短,停车时间比较长,对GoFun也不是一个好事。下图展示了停车时长的分布。横坐标代表停车的时长(小时)最长统计到70小时,纵坐标代表有多少车次。从图上峰值是在0到2小时之间。也有连续70小时,也有1000多车次有过这样长的停车时间。

下图展示了使用时长的分布。横坐标代表停车的时长(小时)最长统计到70小时,纵坐标代表有多少车次。对比停车时长的分布,使用时长的分布比较明显的集中在0到6小时之间,这也是共享出行的特点。由于GoFun有包天的租车服务,所以长期的出行的费用也是可以接受,长达70小时以上的使用时间也有1700多车次。

车的轨迹

下面这个动画展示了一辆车的直线运动的轨迹。由于我们仅能得到出发、到达地无法获得中间的轨迹,所以只能这样按照直线标注。图上展示最近几个点,以及位置迁移情况。

#电池电量

下面这张图展示某一辆车的电池变化情况,其中深色区域代表该车在停车场内没有被使用。

#总结

根据以上的分析,GoFun目前的发展势头还是稳步增长。在路上我们也越来越多的看到共享汽车的身影。以成都为例,当停车场数量、车的数量越来越多以后,出行的局限性会变的更少,相信会俘获更多的用户。

#附件
互动报告:http://www.april1985.com/sharecar_report/report/index.html
报告源代码:https://github.com/derekhe/sharecar_report

我为什么要开发这款小程序?

2012年由于家庭的原因,我经常乘飞机往返于成都和广州。每次买机票前我都要观察一段机票的价格,然后再进行购买,但具体什么时候买很多时候都是靠拍脑袋。在买多几次机票后,我发现机票的价格变化还是有一定的规律可行。后来有一本叫做《大数据时代》的书提到了国外的一个Farecast产品,能够预测7天内的票价变化,给出买还是不买的建议。但很遗憾的是多年来国内一直没有相关的产品,这便触发了我做一款类似产品的想法。

这款产品叫做“爱飞狗旅行”(简称爱飞狗),这个名字来源于英文“aiflygo”。其中的AI也有人工智能的意思。产品的核心价值在于尽最大可能回答“什么时候买机票便宜”。买机票分为两个阶段,第一个阶段是选去哪里、什么时候去, 携程、去哪儿等旅游网站已经解决了这个问题。第二阶段是什么时候买票,各大网站也提供了低价提醒等功能,帮用户预定到更便宜的票。但这些产品的并没有告诉用户最低价位是什么,从而用户很难判断是否应该能够购买,除非多观察几天,但很有可能会错过最佳购票时间。

为了弥补最后的一环,这款产品首先要解决的问题的是当选定到达地点、出发日期和航班的前提下,什么时候买票最便宜。为免用户出现不会使用的情况,产品设计上我并没有标新立异,而是使用了传统的选择机票的流程。在用户选定了起降地点、时间,根据实时价格选定航班之后,传统的购票流程会显示订票的页面,而“爱飞狗”将会展示关于机票的一些购票提示。

首先展示的是运用人工智结合大数据预测出的购买建议。购票建议通过历史数据和近期价格波动综合考虑出一个结果,给予用户最快的提示。

然后是去年同期的最低价格。根据数据分析和航司的专业人士的告知,航空公司的价格定价会根据很大程度上根据去年价格,参考今年的运力波动进行定价。所以历史最低价位具有非常大的参考价值。同时,“爱飞狗”也给出最低票价出现的时间,方便用户决定今年什么时候买。在春节期间更是可以自动切换对齐到农历日期,这样更方便传统节日购票。

最后,“爱飞狗”会展示出该航班近期的购票价格的波动。注意这个价格并不是很多OTA上面展示的未来的价格,而是某一天起飞航班的历史购票价格。例如12月28日起飞的ZH9441航班,将会展示起飞前45天到今天的购票价格。

综合上述信息,用户可以根据波动情况决定是否购买。

在小程序还在开发的时候,我通过数据分析购买到了去广州的最便宜的票,一家人节约了400多元。小程序上线后不久,有朋友通过“爱飞狗”公众号告诉我他一家人出游选好了购票时间节约了600多元,也是对小程序的极大的肯定。

在未来,爱飞狗会继续优化用户体验和提高AI预测的准确性。由于产品目前还是个人开发,产品的更多的是靠口碑进行传播,由于个人力量所限,希望有志同道合的朋友能够一起将该产品做到更好,使得更多人受益。

2018春节机票怎么买?看这几张图就够了

2018年春节还有不到两个月了,各大航空公司已经准备春节的调价。根据《机票大数据分析,揭示购票的秘密》一文,一般来讲提前两个月预订机票价格相对较高,两个月之内航空公司会多次调价。在春节这个特殊的时期,定价很大程度上来自于供需关系。那么如果我确定好出发时间和地点,机票价格大约是怎样的一个趋势?我什么时候该买机票呢?能买到最低的价位是什么?

其实,每年的春节的价格都相差无几,参考2017年春节的机票价格,可以很大程度上预见2018年春节的机票价格及走势。我们选择了几个起飞日期来作为参考。

2018年2月10日,星期六,放假

对应于2017年1月21日,星期六,均是节前的最后一个假日,很多人会选择在这时拼假回家。请看下面这个图:图片展示了中国机场吞吐量前29的城市的机票折扣,横向选择出发城市,竖向选择到达城市,交叉的点就是能买到的最低折扣价格,颜色越深表明价格越高。

2017-01-21起飞的机票最低价格

从图上可以看出从北上广深到内地城市的机票普遍价格较高,这是由于北上广深打工的人很多,所以返乡价格会更贵。如果你恰好在这些区域,那么就几乎只能买到全价票或者很少的折扣,早点购买是明智的选择,因为怕机票售罄。

但从内地(例如成都)出发飞往北上广深的机票反而很便宜,所以可以等待机票价格下降到一定程度再购买,具体可以查询微信小程序“爱飞狗旅行”的历史价格,根据提示,可以知道大约起飞前4周能够买到最便宜的机票。

爱飞狗旅行查询成都至广州

最后,目的地为三亚、海口的机票价格也保持在一个较高的价位,某些城市(例如北京、兰州)等还可以有机会买到7折左右的票,但根据价格历史查询,发现最低价可能很难购买,所以请提前关注价格波动购买。

2018年2月14日,除夕前一天

对应2017年1月26日。大多数人也会选择除夕前请一个假回家。

这天起飞的航班的价格与1月25日起飞的航班的价格对比,可以发现票价有所上调,飞往三亚、海口的机票已经几乎都是全价。然后北上广深飞往内地的机票价格也几乎是全价票了。

2017-01-26

2018年2月15日,除夕当天

对应于2017年1月27日。由于工作的关系,很多人只能在除夕当天回家。

虽然这一天回家有一些不尽人意,但这一天的机票对比除夕前一天价格有大幅度的回落,即便是之前很火的北上广深往内地的机票价格也回落到5折左右。但旅游城市三亚、海口的价格依然坚挺。

2017-01-27

  • 2018年2月21日,春节假期最后一天
    对应于2017年2月2日。返回家乡,准备第二天工作了。
    这张图片和除夕前的图片看起来很类似,只是出发城市和到达城市相反而已。这个时间由于是返程,所以航空公司也肯定会狠赚一把。
    2017-02-02

总结

通过这几幅图可以清楚地看出春节机票的购票规律,如果你需要查询其他几天出行的票价图,请关注微信公众号“爱飞狗”回复“春节”即可。通过这些图确定是否还有更低的价格,对于无折扣的热门航班,较早购买不会亏,而且可以避免机票售罄。对于机票价格较为便宜的航班,提前太长时间购买可能并不划算,可以参考“爱飞狗旅行”的机票价格历史,选择一个合适的购票时间窗口,买到最便宜的机票。

小程序传送门:
gh_d92817984f7d_1280.jpg

机票大数据分析,揭示购票的秘密

对于旅游或者探亲来说,买机票的一个最基本的问题是什么时候买能买到最便宜的机票?提前一个月还是一周?知乎上各种旅游攻略上各种“业内人士”也说提前一个月买可能买到最便宜的机票,有些又说提前2个星期买能买到最便宜的机票,事实真的如此么?为了解密机票的定价策略,本文作者做了一个长达一年多的数据收集,通过分析350亿机票价格数据,告诉你机票的各种秘密。

到底要提前多久能买到最便宜的机票?

要回答这个问题非常困难 ,因为机票的定价是一个非常复杂的动态的博弈的过程,而且定价由各种因素组合而成。我们买机票也不是一个高频的事件,所以当你需要买机票的时候,很可能观察一两天然后就购买。由于信息不对称,我们根本不知道当前是否最佳购买购票时机,买了以后说不定就惋惜又降价两三百。对于家庭出游来讲,赤裸裸的就少了好几百块钱。但在大数据面前,一切的秘密也不是秘密,将机票价格可视化出来你就会发现一些购票的秘密。

研究的数据

北京到广州的航班:

  • 国航:最早起飞的CA1321,中午起飞的CA1315,晚上最后一班的CA1319
  • 南航:最早起飞的CZ3166,中午起飞的CZ3112,晚上最后起飞的CZ3000

价格:观察起飞前45天的价格,并且每天都记录一次
时间区间:2016年8月15日 - 2017年11月1日

下图是CA1321一年的机票价格变化。每一行代表特定出发日期的价格变化,例如第一行代表2016年8月15日起飞的航班的机票价格的变化。一行里,左边离出发日期越近,右边离出发日期越远。第一个方块代表距离出发日期0天(当天)的机票价格,第二格代表距离出发日期1天的机票价格,以此类推,最后一个表示44天前的价格。颜色越深代表价格越高,颜色越浅价格。

此图很长……请耐心,看不清请看原图……
CA1321.png

再来看第二张图,这张图是从上一张图做差分得到,目的是显示出涨价、降价的区块。红色的代表涨价,颜色越深涨价越多;灰色表示无价格变动;蓝色代表降价,颜色越深降价越多。

CA1321.png

好了,从这两张图能看出点什么呢?请注意,以下分析仅仅针对该航班。

距离起飞前第9天开始,几乎所有的日期都开始涨价

最明显的是,距离起飞前第9天开始,几乎所有的日期都开始涨价。请注意图二的坐标为8的那一列。然后到距离起飞前第3天才是,又要涨价一次。所以,如果距离起飞已经只有10多天了,请赶紧购买,涨价是大概率的事情。

同一个月内的价格调整在同一天完成

让我们把图缩小一点看看。在图上,我手工画了一些斜线,你可以看到价格再那里发生了变化。但每个斜线都是45度,意味着这是在同一天发生的价格调整。举个例子,4月份的价格调整,可以通过斜线看出。所以4月2号的机票,提前25天到10天左右买是可以买到较为便宜的,而4月3号的提前26天到10天左右,以此类推,4月16号的以前差不多一个月到10天都可以。

CA1321.jpg

CA1321_4月

而六月份的就不太一样,需要叠加节假日的因素,6月5、6、7日为周日、周一、周二,价格相对较高,所以调价的是涨价。购买这几天的机票就要提前更早买比较合适。而随后的8,9,10为周三、周四、周五,价格相对较低,所以是降价。航空公司估计是这样来平衡收益。
CA1321_6月

起飞时间是周几对价格影响

在上一节已经涉及到了周几起飞的价格影响。我再来画几条线,一看你就明白。价格的涨跌一目了然。对这个航班而言,周日到周二是票价相对较高的区间,周三到周六是较低的区间。

CA1321

早班中班晚班的对比

对早中晚几个航班,可以明显的看出:

  • 在价格方面:早班的航班价格较贵(整体颜色深),中班适当,晚班的较便宜(整体颜色浅)。
  • 调价:参考之前的斜线,不同时段航班的调价也几乎都是同一时间发生。

国航.jpg

发现淡季和旺季

根据颜色的深浅及颜色的变化即可判断出淡季旺季,基本规律大致相同,大假附近几乎会上涨,寒假、暑假、过年期间价格也较高。

CA1321_季节.jpg

南航航班和国航对比

不同航空公司的定价不相同,但类似的调价措施似乎有一定的参考。南航的缩小图见下,可以看出一些斜线的区域,显然是遵循了一样的调价规律。

南航.jpg

工具

决定什么时候出发,相关的工具必不可少。各大OTA网站:携程、去哪儿、飞猪、同程,各大官网,这些就不用多说吧。

决定什么时候买,通常我们会查看票价历史来做决定。目前还没有工具能够查询到历史的票价。针对这个问题我们开发了一个小程序帮忙查询到历史票价,微信小程序搜索“爱飞狗旅行”即可使用。

查看价格波动情况和购票建议。近期的价格波动情况可以很清楚的看到,当票价已经上涨了并且临近起飞日期了,请赶紧购票。
爱飞狗旅行

价格预测及最低价格,此航班提示明年春节购票最好提前7到9周。公历和农历对齐可以很方便的对齐去年的节假日。
爱飞狗旅行

最后可以在上述OTA网站订阅一个低价预约,出现预约后就可以购票了。

总结

其实航空公司的票价策略还是有规律可寻,当有一定数据量并且可视化出来以后就更容易发现规律。利用适当的工具能够帮我们选择。春节即将到来,请尽早决定并持续关注价格历史,祝您买到一张便宜的回家的机票。