开放式收费停车场用户行为模型的研究
吴涛 申腾飞 庄明轩 闫新男 段莉华
摘要:开放式收费停车场是解决城市道路管理和路边规范停车的新型手段,停车场的管理运营公司常常面临停车计时困难和收费率低等问题。为了降低成本和增加营收,运营公司需要对停车用户分析行为进行建模和分析。本文通过分析开放式收费停车场的停车数量随时间的变化,发现用户的停车行为与用户的通勤时间、日常作息时间和假期之间存在相关性。结合用户行为的周期性特征,本文提出运营公司可以周期性地管理和维护停车场。基于RFM模型和K-means算法,本文实现对开放式收费停车客户的准确分类,并挖掘用户的潜在价值以最大限度地提高收入。
关键词:开放式收费停车场;RFM模型;K-Means聚类
中图分类号:TP37? ? ? 文献标识码:A
文章编号:1009-3044(2021)17-0001-03
开放科学(资源服务)标识码(OSID):
1 引言
随着我国经济水平提高,科技力量不断增强,计算机性能、网络技术不断成熟提高,用户行为分析[1]技术愈发成熟,传统的商业模式正在被一个新的营销模式—“数据化营销”所替代,尤其是用户行为分析技术在如今的商业领域的优势十分明显。信息化时代来临使得数据焦点从企业产品转向用户群体,用户行为分析成为公司部门的核心问题。企业借助大数据技术对用户行为检测获取数据,分析比较不同的客户群体,通过建立合理的客户价值评估模型[2],对客户进行分群,分析比较不同客户群的客户价值,并制定相应的营销策略[3],对不同的客户群提供个性化的客户服务提高企业受益,减轻企业负担。用户行为数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用,企业从中提取辅助商业决策的关键性数据能更加准确区分客户群体,将资源更准确地投入用户手中。
2 数据来源和预处理
2.1数据来源
本文数据取自某三线城市的开放式收费停车场平台2020年的用户数据,数据中存在部分缺失数据、无效数据、重复数据、为了减少数据冗余提高数据准确性,剔除无效数据和非法数据,在数据分析之前先对数据进行简单的清洗和预处理。
2.2数据预处理
1)属性规约:基于客户价值的RFM的模型[4],我們选出停车记录表中的"car_num" ,"car_no","duration","amout","start_time","end_time","fees_paid","recover_amount"这八个字段。
2)删除数据集中的重复数据。
3)异常数据的处理:通过计算和观察发现数据集中存在部分异常数据,比如客户停车时间和结束停车的时间一致,对于这种类似的数据意义不大因此本文采取删除该类型的数据。
4)数据转换:最近的消费间隔 =统计截止时间– 每辆车最近一次的消费时间消费金额 =已付金额("fees_paid")+补缴("recover_amount")消费频率 =每辆车出现次数的分类汇总。
3 停车用户行为特征分析
3.1停车数量时间特性分析
选取某三线城市2020年的开放式收费停车场数据。对2020年平均每天的停车数据分析,统计得到以一小时为间隔的停车数量,24小时的停车流量变化情况如图1所示。
从图中可以看出,停车场停车数量最少的时刻集中在24:00-05:00,这是因为大部分人都在休息,停车车辆大多是该停车场场附近居民的车辆,停车数量总体较少;在06:30-12:00时段停车数量开始呈现持续上升的趋势,由于该停车场位于都市的商业圈附近,这段时间正是人们选择去商场购物的时候,所以这段时间内的停车的数量逐渐增加,说明这群人大部分是来商场工作或者消费的。在12:00-14:00和19:00-20:00这两个时间段出现了当天的两个停车高峰,而这两个时间段正好是一天当中的午餐时间和晚餐时间,人们来商场购物,或者在商场附近就餐;在15:00-17:00这段时间内,人们正处于购物或完成购物准备离开的状态,停车车辆明显减少,所以呈现波谷形状;从20:00-24:00这段时间,停车场停车数量呈现下降趋势,22:00-24:00停车数量急剧减少,说明该时间段人们完成了购物离开了商场准备回家休息。
选取某三线城市2020年的开放式收费停车场数据,对2020年平均一周的数据进行数据分析,分析工作日和周末之间的停车数量差异,统计以天为间隔的停车数量,如图2所示。
从图中可以看出从星期一到星期五的三个指标趋势大致相同,由于人们的生活方式和通勤时间相对固定,该时段内消费人群规模较小,所以在工作日这段时间停车数量较为稳定,而在周末这两天,停车车辆明显要高于工作日,这说明到了周末人们开始选择放松,出门逛街或者游玩。
选取某三线城市2020年的开放式收费停车场数据,对2020年特殊月份的开放式收费停车场数据进行用户行为分析,从而找出停车数量在节假日对开放式收费停车场的影响。统计得到以二十四小时为间隔的停车数量,一个月各个时段的停车数量变化情况如图3所示。
从图中可以看出十月份的停车数量在十一期间呈现一个高峰,这是因为十一国庆节人们放假休息,所以去往商场进行消费娱乐活动的人数较多。到了7日,由于后一天是工作日,人们开始减少出行,停车数量相对前几日开始显著下降。从10月8日到10月31日可以看到停车数量趋于平稳,且带有较为明显的周期波动,说明人们已经结束了假期回归有规律的生活和工作节奏。
选取某三线城市2020年的开放式收费停车场数据,对2020年平均月份开放式收费停车场停车数据进行用户分析,统计得到以24小时为间隔的停车数量,如图4所示。
从图中可以看出停车数量整体呈现有规律的波动,以五天为间隔在星期六达到高峰,星期天的停车数量要略低于星期六的停车数量。由于居民出行具有基本的生活规律,例如工作人员有固定的上下班时间和休息时间大多数会选择去商场或者出去旅游,从而使停车场的停车数量在时间上呈现一定的规律。
4 用户聚类
4.1聚类指标选取
经过数据预处理和分析[5],统计得出了客戶的最近一次消费 (Recency)、消费频率 (Frequency)、消费金额 (Monetary)三个要素。
通过图5和数据的观察,发现M和F的值差异较大,但是那些异常值代表着一些重要的客户,不能消除。于是我们采取对模型打分的方法来消除巨大差异,我们根据实际情况和人为判断,采取等频的原则进行打分,如图6所示。
4.2聚类结果
聚类效果如表格1所示。
通过上述计算后,得到用户的分类结果。重要保持用户有21636名,占所有用户的23.23%,这类用户在平台消费时间间隔相距较小,消费频率次数高、消费的金额大,这类用户能给企业带来可观的利润收益,重要发展用户17353名占所有用户的18.63%,这类用户在平台消费时间相距较小,消费的频率次数、消费的金额也低,推测极有可能是新注册的用户,是企业重点关注的对象,重要挽留用户17049名,占所有用户的18.31%,这类用户消费频率次数和消费金额高,但消费间隔时间较长,企业可以采取优惠方式和短信提醒,挽回用户,一般用户共有17276名,占所有用户的18.55%,这类用户消费时间间隔短,消费频率高,但消费金额少,该类用户可能觉得企业的定价颇高,企业应对这类用户群体进行调研,发现其中的问题并解决将其转为重点用户以及低价值用户19818名,占所有用户的21.29%此类用户在平台消费间隔时间长,消费频率次数低、消费金额也少,这类用户给企业创造的营收微薄,企业不必投入过多的资源在此类用户身上。分类结果如图1所示。
4.3聚类特征分析
聚类结果如图7所示。
A类用户:这类用户的消费金额和消费能力大[6],而且来停车频率高。这类用户是高价值客户,是最理想的客户类型,但是,近期停车时间间隔大,需要用活动或者优惠吸引他们回来。
B类用户:该类用户近期间隔小,频率低,消费也低,可以推断为新客户,具有很大潜力,停车场可以与他们多交流和给出额外的优惠,来培养这类用户的忠诚度。
C类用户:此类客户停车频率高,消费金额较少,而且近期停车事件间隔长,可以看出忠诚度在慢慢降低,开放式收费停车场管理平台在运营过程中要细心发现这类用户的特殊情况,分析竞争平台的营销方式,采用有效的营销方式回击。
D类用户:此类客户的消费和停车次数较低,而且近一段时间间隔较大,创造价值有限。
E类用户:此类客户的频率一般但消费较高,并且近期事件间隔比较小,可以推断他们是属于近期频繁来停车,属于增长性,他们是停车场未来的主力客户。开放式收费停车场在运营过程中可以相应加大对这类用户群体的投入,比如以通知、短信、邮件的方式询问用户是否满意开放式收费停车场管理平台提供的服务等,并给予相关的优惠补贴,提高用户黏合度。
5 方法评估
本模型采用近期的历史数据进行建模[7],随着时间的推移,分析数据的观测窗口也在变换,因此对于新增的客户信息,以及未来业务的实际情况,该模型建议一个月运行一次,对新增的客户信息通过聚类中心进行判断,同时对本次新增客户的特征进行分析,如果新增的数据情况与判断的结果差异过大,需要引起相关部门的重视,查看变化的原因以及确认模型的稳定性,如果模型的稳定性变化较大,需要对模型进行调整和重新训练。
6 总结
某三线城市处于推进智慧停车场发展的起步时期,在交通信息化的大背景下,如何利用信息化手段提高开放式收费停车场的利用率,减少开放式收费停车场的管理成本成为企业关注的地方。开放式收费停车场的投入使用和发展极大地提高了客户停车体验,解决了客户寻找停车位难、停车距离远、停车不灵活等问题,在此基础上,利用数据分析技术挖掘停车客户的内在的规律和特征,进行有效的车位资源管理和分配,帮助用户获得更好的停车体验成为开放式收费停车场发展方向。
本文首先介绍了某三线城市2020年的开放式收费停车场的原始数据,为了提高数据分析的效率和准确性,对数据进行了预处理和数据清洗。通过时间维度,对特征数据分析,挖掘其中的规律。采用RFM模型[8]和K-means算法对开放式收费停车场用户进行分类,通过客户的近期的消费记录R(Recency)、购买行为购买频率F(Frequency)、购买金额M(monetary)三个指标来挖掘客户的潜在价值。
对比本文的实验结果和实证结果,可以得到以下两点结论:第一,针对开放式收费停车场停车用户的停车特征,能够得出停车用户行为和时间维度存在关联性[9],与用户的作息时间、通勤时间和节假日时间有关系。第二,通过K-means算法和RFM模型将用户精确分类,分类结果和实证结果较为吻合,为开放式收费停车场提供决策依据。
当然,本文的研究存在一定的局限性:第一,用户行为分析指标需要更加多元,影响用户行为的因素很多需要的用户数据[10]更加精确。第二,由于每一个算法都有自身的局限性,为了更好契合开放式收费停车场用户群体,实现更加有效的用户细分,未来可以选择将密度聚类等方法纳入开放式收费停车场用户分类研究当中。
参考文献:
[1] 沈佳朋.数据挖掘技术在城市路侧停车管理中的应用研究[D].杭州:浙江大学,2020.
[2] 陆建.城市交通系统可持续发展规划理论与方法[D].南京:东南大学,2003.
[3] 孙展.基于时空量化分析的停车泊位共享配置方法研究[D].北京:北京建筑大学,2018.
[4] 杨琳,寇勇刚,白钊,等.基于改进RFM模型对民航客户的细分研究[J].数学的实践与认识,2021,51(1):33-39.
[5] 靖立峥,吴增源.基于改进K-means算法的电子商务客户细分研究[J].中国计量大学学报,2020,31(4):482-489.
[6] 徐晓敏,谷晓燕.全生命周期客户价值数据分析挖掘方法[J].北京信息科技大学学报(自然科学版),2020,35(2):6-9,20.
[7] 陈东洋,陈德旺,江世雄,等.基于时段客流特征聚类的地铁运营时段划分[J].计算机系统应用,2021,30(3):256-261.
[8] 翁小雄,谢志鹏.基于RFMS的高速公路客户商业价值挖掘[J].重庆交通大学学报(自然科学版),2021,40(4):62-69.
[9] 武志鹏.路边停车需求预测与管理对策研究[D].西安:西安电子科技大学,2019.
[10] 肖雪.路外停车需求长短时预测方法研究[D].长春:吉林大学,2020.
【通联编辑:唐一东】