网站首页  词典首页

请输入您要查询的论文:

 

标题 基于大数据分析的消费额度估计模型
范文 时元宁 (青海大学, 青海 西宁 810016)
关键词: Hadoop平台; 大数据; 时间序列; 消费额度; ARIMA模型; 对数转换
中图分类号: TN919?34; F713 ? ? ? ? ? ? ? ? ? 文献标识码: A ? ? ? ? ? ? ? ? ? ?文章编号: 1004?373X(2018)24?0146?03
Consumer credit estimation model based on big data analysis
SHI Yuanning
(Qinghai University, Xining 810016, China)
Abstract: The consumer credit estimation model based on the seasonal autoregressive integrated moving average (SARIMA) estimates consumer credits without combining with the big data method, and uses unscientific data, resulting in inaccuracy of the obtained consumer credit estimation results. Therefore, a consumer credit estimation model based on big data analysis and autoregressive integrated moving average (ARIMA) is designed. Preliminary analysis for big data of the past consumer credits is obtained by using the Hadoop platform, so as to construct the time series of the past total consumptions. The first?order difference, seasonal difference, and logarithmic transformation method are used to obtain a stationary time series. The ARIMA model is used to analyze the time series, so as to construct the ARIMA consumer credit estimation model based on big data analysis. The mean absolute percentage error (MAPE) measurement model is used to verify the estimation capability of the designed model, so as to ensure that the model can accurately estimate consumer credits. The experimental results show that the designed model has a consumer credit estimation accuracy as high as 99.7%, which can be used for accurate estimation of consumer credits.
Keywords: Hadoop platform; big data; time series; consumer credit; ARIMA model; logarithmic transformation0 ?引 ?言
國家对经济进行宏观调控过程中,需要未来经济发展的预测值作为调控的依据。文献[1]描述的基于消费弹性系数法消费额度估计模型在估计消费额度过程中,仅可以研究两个变量之间的关系,难以顾及其他变量的干扰,导致估计值不准确;文献[2]采用的SARIMA(Seasonal Autoregressive Integrated Moving Average)消费额度估计模型对于消费额度的估计,未对构建模型的估计能力进行检验,获取的估计结果精确度较低;文献[3]中基于ARIMA模型的消费额度估计方法,未结合大数据的优势进行消费额度预测,采用的分析数据缺乏一定的科学依据,获取的估计结果存在局限性。针对上述传统消费额度估计模型的缺点,本文构建基于大数据分析的ARIMA的消费额度估计模型[4]。在大数据分析的基础上,结合ARIMA模型进行消费额度估计,并对构建的消费额度估计模型的估计能力进行检验,确保在估计模型能力极佳的情况下,对未来的消费额度进行估计[5]。1 ?基于大数据分析的ARIMA消费额度估计模型的构建
1.1 ?采用ARIMA模型获取消费额度的时间序列估计结果
ARIMA模型全称为自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,ARIMA),用于时间序列的估计与分析,ARIMA模型中,自回归用AR表示,求和用I表示,移动平均用MA表示。ARIMA模型应用范围广,能够获取科学、可靠的时间序列估计结果[6]。从季节性角度出发,构建时间序列模型简记为:
[ARIMA(n,b,m)×(N,B,M)s] (1)
式中:自回归项用n表示;移动平均项数用m表示;经过b次差分时间序列趋于稳定;季节模型的自回归阶数用N描述;季节模型的移动平均阶数用M描述;季节差分的阶数用B描述。
1.2 ?时间序列平稳性检验与处理
结合以往消费额度大数据的初步分析结果,在SAS软件上描绘消费额度大数据时间序列图,对时间序列进行平稳化处理。
首先,采用一阶差分的方法检测时间序列中的初始序列递增信息,去除时间序列中的趋势性[8];然后,在此基础上进行季节性差分;最后,采用对数转换的方法进行再次处理,彻底清除时间序列中的季节性与趋势性。
1.3 ?确定ARIMA消费额度估计模型
首先,根据平稳性时间序列的自相关图和偏自相关图。在[ARIMA(n,b,m)×(N,B,M)s]基础上,结合以往消费额度大数据,将实际值代入式(1)中,结合实际的消费额度大数据,构建具体的ARIMA消费额度估计模型。并对该模型进行拟合,不同的数据代入模型中会形成不同的拟合结果。接着采用参数显著性检验方法与残差白噪音检验方法对ARIMA模型的参数实施检验[9]。当ARIMA模型的参数检验结果符合标准时,可接受该模型进行时间序列的估计与分析。
1.4 ?模型的估计能力检验
为获取精确的消费额度估计结果,首先对ARIMA消费额度估计模型进行估计能力验证,合格后再进行消费额度估计。采用相对百分误差绝对值的平均值MAPE(Mean Absolute Percentage Error)衡量模型的预测能力[10],MAPE的的计算公式为:
[MAPE=1pi=1pyi-yiyi×100%] (2)
式中:模型的预测值用[yi]描述;实际值用[yi]描述;预测期数用[p]描述。当MAPE值在0~10%之间时,模型的估计能力最优;当MAPE值在10%~20%之间时,模型的估计能力较优;当MAPE值在20%~50%之间时,模型的估计能力合格;当MAPE值大于50%时,模型的估计能力存在误差。根据这一标准,对ARIMA消费额度估计模型进行估计能力检验,当所构建的ARIMA消费额度估计模型的MAPE值在10%~20%之间时,可采用此模型进行消费额度估计。2 ?实验分析
2.1 ?有效性分析
为验证本文模型的有效性,采用本文模型进行消费额度估计。根据国家统计局统计结果可知,2006—2016年各年的消费总额数据如图1所示,实验在分析该组数据的基础上,对2017年12个月份的消费总额进行估计。
本文模型对2017年12个月份的消费总额估计的过程中,一阶差分后的时序图如图2所示。分析该图可得采用本文模型获取的时间序列变化平稳,未出现明显的波动趋势,说明本文模型能够获取平稳性时间序列。
表1为采用本文模型得到的2017年12个月份消费额度估计结果。分析该表中的数据能够得出,采用本文模型能够根据以往的消费总额数据获取未来的消费额度估计结果,验证了本文模型的有效性。
2.2 ?估计准确度分析
为突出本文模型在估计消费额度方面的准确度优势,进行仿真实验。实验在Windows 8操作系统,4 GB内存的硬件配置下进行,利用Matlab软件实现仿真实验。对本文模型、基于消费弹性系数法消费额度估计模型和SARIMA消費额度估计模型的估计准确度进行对比,具体的实验方法为:根据2008—2015年的消费总额,对2016年1—5月份的消费额度进行估计,实验分10次展开,取10次准确度的平均值,将其制成柱状图,如图3所示。
分析图3能够明显看出三种模型进行消费额度估计的准确度情况。SARIMA消费额度估计模型对2016年1—5月份的消费额度估计准确度均值分别为:98.1%,95.9%,96.1%,97.7%,95.7%,该模型在1月份、4月份出现准确度峰值,分别为98.1%,97.7%,另外三个月份的准确率在96%左右,总体看来,该模型的准确度较低,且波动性大、稳定性较差。基于消费弹性系数法消费额度估计模型对2016年1—5月份的消费额度估计准确度均值分别为:98.2%,97.8%,98.4%,98.3%,98.3%,该模型的准确度基本稳定在98%上下,准确度较高,稳定性较强。本文模型对2016年1—5月份的消费额度估计准确度均值分别为:99.8%,99.9%,99.7%,99.6%,99.6%,准确度均值高达99.7%。通过数据能看出,本文模型的准确度远远高于另外两种模型,且稳定性较强。实验结果表明,本文模型进行消费额度估计的准确度高达99.7%,具有准确度高的优势。3 ?结 ?论
本文构建基于大数据分析的ARIMA的消费额度估计模型,采用大数据分析方法对以往消费总额数据进行初步分析,在此基础上构建平稳性时间序列,采用ARIMA模型对时间序列进行分析,并对构建的ARIMA消费额度估计模型的估计能力进行检验,确保估计能力符合标准,实现对未来消费额度的准确估计。经过实验验证,本文模型的估计误差仅约为0.05%,远远低于其他估计模型;本文模型的估计准确度高达99.7%,相对其他估计模型具有准确度高的优势。所设计的模型能够准确估计未来消费额度,为国家经济宏观调控提供了有效依据。
参考文献
[1] 刘卫东,仲伟周,石清.2020年中国能源消费总量预测:基于定基能源消费弹性系数法[J].资源科学,2016,38(4):658?664.
LIU Weidong, ZHONG Weizhou, SHI Qing. Forecast of China′s total energy consumption in 2020 based on method of fixed base energy consumption elasticity coefficient [J]. Resources science, 2016, 38(4): 658?664.
[2] 张丽,牛惠芳.基于SARIMA模型的居民消费价格指数预测分析[J].数理统计与管理,2013,32(1):1?6.
ZHANG Li, NIU Huifang. The predictive analysis of consumer price index based on SARIMA model [J]. Application of statistics and management, 2013, 32(1): 1?6.
[3] 桂梅,刘莲花.基于ARIMA模型对海南省社会消費品零售总额的预测[J].数学的实践与认识,2017,47(3):25?30.
GUI Mei, LIU Lianhua. Prediction of the total retail sales of consumer goods based on the ARIMA model [J]. Mathematics in practice and theory, 2017, 47(3): 25?30.
[4] 李敏波,王海鹏,陈松奎,等.工业大数据分析技术与轮胎销售数据预测[J].计算机工程与应用,2017,53(11):100?109.
LI Minbo, WANG Haipeng, CHEN Songkui, et al. Data analysis of industrial big data and sales forecast of tyre industry [J]. Computer engineering and applications, 2017, 53(11): 100?109.
[5] 王娜.基于大数据的碳价预测[J].统计研究,2016, 33(11):56?62.
WANG Na. Forecasting of carbon price based on big data [J]. Statistical research, 2016, 33(11): 56?62.
[6] 艾兵,董明刚.基于误差校正的能源消费总量预测方法[J].桂林理工大学学报,2016,36(2):388?394.
AI Bing, DONG Minggang. Prediction method of total energy consumption based on error adjustment [J]. Journal of Guilin University of Technology, 2016, 36(2): 388?394.
[7] 龙映宏,李布明.关于旅游消费者购买指数预测建模仿真研究[J].计算机仿真,2015,32(12):455?458.
LONG Yinghong, LI Buming. Modeling and simulation of purchase index prediction for tourism consumers [J]. Computer simulation, 2015, 32(12): 455?458.
[8] ZHAO Y, LUO X, DENG L. A CBR?based and MAHP?based customer value prediction model for new product development [J]. The scientific world journal, 2014, 2014: 1?18.
[9] 蒋辉,张波.支持向量回归特征提取的ARMA准则:中国社会消费品零售总额预测的实证研究[J].统计与信息论坛,2012,27(7):3?7.
JIANG Hui, ZHANG Bo. ARMA criterion of feature extraction in support vector regression: empirical research of our national social total retail sales of consumer goods prediction [J]. Statistics & information forum, 2012, 27(7): 3?7.
[10] ONOYAMA H, RYU C, SUGURI M, et al. Nitrogen prediction model of rice plant at panicle initiation stage using ground?based hyperspectral imaging: growing degree?days integrated model [J]. Precision agriculture, 2015, 16(5): 558?570.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/16 17:20:15