极限学习机修正误差的体育成绩预测模型

吴平
摘 要: 体育成绩的影响因素众多,具有时变性和随机性变化特点,为了提高体育成绩的预测精度,提出极限学习机修正误差的体育成绩预测模型。首先采用灰色模型对体育成绩进行预测,然后用极限学习机对灰色模型的预测误差进行修正,最后采用具体体育成绩数据对模型性能进行测试,测试结果表明,该模型能够提高体育成绩的预测精度,可提供有價值的参考意见。
关键词: 极限学习机; 体育成绩; 灰色模型; 预测精度
中图分类号: TN98?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)03?0117?04
Sports performance prediction model using extreme learning machine for error correction
WU Ping
(School of Sports and Health, Guizhou Medical University, Guiyang 550025, China)
Abstract: The sports performance has numerous influence factors and characteristics of the time variation and random variation. In order to improve the prediction accuracy of the sports performance, the sports performance prediction model using extreme learning machine for error correction is proposed. The grey model is used to predict the sports performance. The extreme learning machine is adopted to correct the prediction error of the grey model. The specific sports performance data is employed to test the model performance. The test results show that the model proposed in this paper can improve the prediction accuracy of the sports performance, and provide a valuable reference opinion.
Keywords: extreme learning machine; sports performance; grey model; prediction accuracy
0 引 言
随着我国体育事业的不断发展,国家对竞技体育教育的重视程度达到了一个新的高度,对体育成绩的科学预测可以了解学生和运动员的身体机能状态,为下一步的科学训练和身体机能准确量化评估提供依据。对体育成绩预测模型的相关研究,将在体育教育、人类科学以及医学健康评价等方面具有重要的应用价值。
本文提出基于极限学习机修正误差的体育成绩预测模型,首先采用灰色模型对体育成绩进行预测,然后用极限学习机对灰色模型的预测误差进行修正,最后采用具体体育成绩对模型性能进行测试,分析得出本文预测模型的精度优于传统模型。
1 体育成绩的时间序列分析
1.1 体育成绩数据序列重构
体育成绩是一组非线性时间序列,可以采用非线性时间序列分析方法进行体育成绩的特征分析和预测。通过对体育成绩的前期统计和采样,构建体育成绩单变量时间序列,设为[xn,]通常观测得到的体育成绩时间序列都是标量时间序列,采用相空间重构分析方法进行体育成绩的高维矢量展开[1],体育成绩相空间重构的方法描述为:选择最小嵌入维数[m]、最佳时延[τ,]构建一个微分方程表达体育成绩的信息流模型为:
[xn=x(t0+nΔt)=h[z(t0+nΔt)]+ωn] (1)
式中:[h(?)]为体育成绩时间序列的多元数量值函数;[ωn]为体育成绩时间序列的观测或测量误差。
通过体育成绩的信息流模型构建,建立了体育成绩信息流模型与非线性特征提取之间的映射关系,以此为基础进行特征提取和预测模型设计。
1.2 体育成绩的预测模型流程设计
在重构的相空间中,进行体育成绩的非线性时间序列分析,提取体育成绩时间序列有效的主成分特征,通过灰色模型进行体育成绩的预测,本文设计的体育成绩预测的总体流程如图1所示。
根据图1所示的体育成绩预测流程进行体育成绩的非线性时间序列分析和特征提取,假设体育成绩是由线性相关的非线性时间序列产生,用以下ARMA模型表示:
[xn=a0+i=1MARaixn-i+j=0MMAbjηn-j] (2)
式中:[a0]为初始体育成绩的采样幅值;[xn-i]为具有相同的均值、方差的体育成绩标量时间序列;[bj]为体育成绩的振荡幅值。
对体育成绩数据信息序列进行Fourier变换,得到[x(k)],在灰色模型训练下得到体育成绩的退化趋势为:
[A(t)=mt+amBH(t)] (3)
式中:[a]为域间方差系数;[BH(t)]表示相关函数。
在数据特征的灰度信息交换时频域内,体育成绩序列具有较强的非线性特征,本文采用非线性时间序列分析的方法进行体育成绩序列、标量时间序列的预测和分析,需要构建体育成绩时间序列信号模型,在多个已知干扰中,为了使得体育成绩离散数据离散解析化,采用替代数据法[2]进行体育成绩的振荡幅值随机化处理,体育成绩预测灰度模型中的解析模型如下:
[z(t)=x(t)+iy(t)=a(t)eiθ(t)+n(t)] (4)
式中:[x(t)]为体育成绩时间序列的实部;[y(t)]为体育成绩时间序列的虚部;[a(t)]为相位随机化幅值;[n(t)]为干扰向量。
通过对体育成绩的非线性时间序列分析,进行体育成绩时间序列的主成分特征提取[3],主成分特征提取步骤描述为:
(1)对体育成绩时间序列进行Fourier变换,得到[x(k)];
(2) 测量体育成绩的[d]维紧流形矢量场,通过替代数据法对体育成绩进行振幅随机化处理,得到[x(k)];
(3) 采用自相关函数特征匹配方法检验体育成绩的非线性成分,生成替代数据,对体育成绩序列的替代数据[x(k)]求Fourier逆变换,得到[x(n)];
(4) 生成的体育成绩替代数据保留了原始体育成绩数据的线性自相关函数,提取体育成绩数据信息流的主成分特征如下:
[Cor3=xn-xxn-d-xxn-D-xxn-x3] (5)
式中:[xn]表示体育成绩的非线性时间序列;[d]表示对学生进行体育成绩采样的时间间隔,[D=2d;][x]表示均值;[x(n)]表示对[x(n)]取均值:
[x(n)=1Nn=1Nx(n)] (6)
2 体育成本的建模与预测
2.1 灰色模型训练预测的实现
通过对体育成绩的非线性时间序列分析,提取到体育成绩的先验知识和主成分特征,体育成绩的矢量特征时间序列在高维相空间中的轨迹为[{x(t0+iΔt)},i=0,] [1,2,…,N-1],采用灰色模型对体育成绩进行预测,其基本思想是测量体育成绩的时间序列时变性和随机性特征[x]与[xn+τ]的线性相关性,灰色模型训练函数[C(τ)]定义为:
[C(τ)=limT→∞1T-T2T2x(t)x(t+τ)dτ] (7)
式中:[τ]是体育成绩在重构相空间中的时间延迟,表征[t]和[t+τ]时刻体育成绩变化的关联度。根据关联度进行体育成绩的趋势预测,固定体育成绩的采样时间间隔[j,]构建灰色模型训练函数关于时间[τ](取[τ=1,2,…])的曲线,如图2所示,根据时间延迟曲线的交点求得最佳的采样时间间隔,确定体育成绩预测的合理性。
在求得最佳的采样时间间隔[τ]的基础上,求灰色模型训练的最小嵌入维数[m],采用平均互信息法求得体育成绩序列的灰色模型训练嵌入维,体育成绩时间序列在矢量空间的互信息为:
[I(τ)=-ijpij(τ)lnpij(τ)pipj] (8)
重构的体育成绩时间序列相空间中的任意一点表示为[Xn,]其在体育成绩高维灰色模型中的最近邻点表示为[Xη(n),]建立[m]维灰色模型的训练函数为:
[X(n)={x(n),x(n+τ),…,x(n+(m-1)τ)}] (9)
式中:[n=1,2,…,N],在灰色模型中计算体育成绩历史数据的协方差矩阵[C]为:
[C=1NX-XlX-XlT] (10)
其中:[l=1,1,…11×N,xi=1Nk=1Nxik,X=X1,X2,…,Xm。]
构建体育成绩预测的特征方程:
[(λl-S)U=0] (11)
求解[S]特征值[λ,]由此实现对基于灰色模型的体育成绩预测。
2.2 极限学习机修正预测误差
对于输入极限学习机[4]的[K]个体育成绩样本数据集[xi,yi,][i=1,2,…,k,]其中[k]表示体育成绩时间序列的采样个数,对采集数据进行归一化处理,把体育成绩测试的历史数据[xiNi=1]通过极限学习机加载到高维相空间[S]中,在高维相空间上构造体育成绩非线性时间序列的自回归过程,表达式为:
[f(x)=ωT(?)X+b] (12)
式中:[ω]为误差矢量矩阵;[b]为偏差向量。
选择体育成績历史数据作为预测模型进行特征降维处理,采用自适应加权,给出极限学习机修正误差系数[ξ],得到通过极限学习机对体育成绩预测误差修正的判别函数为:
[Lξ=f(x)-y-ξ,f(x)-y≥ξ0,f(x)-y<ξ] (13)
根据累计方差的贡献程度进行误差修正和特征降维,降低模型的复杂度,得到体育成绩预测的误差最小模型为:
[minω,h,ζl,ζ*l=12ωTω+ci=1l(ζl+ζ*l)] (14)
式中:[ζl]和[ζ*l]表示冗余度和主成分特征;[c]表示极限学习机误差修正的代价系数,[c]值越大,表示预测精度越好。
最后得到体育成绩预测的输出时间序列估计函数为:
[f(x)=i=1l(ai+a*i)k(x-xi)+b] (15)
通过极限学习机实现对体育成绩预测误差的修正,此时预测误差的收敛为:
[dm(0)=Xm-Xk] (16)
根据Lyapunove收敛性原理,得到预测误差将会收敛到0,从而得到体育成绩增长指数时间序列预测值为:
[x(tn+1)=Xm+1(m)] (17)
分析得出,采用本文方法通过灰色模型对体育成绩进行预测,然后用极限学习机对灰色模型的预测误差进行修正,能实现对体育成绩的零误差预测,精度较好。
3 实验与结果分析
体育成绩的测试样本集来自于某高校的大一和大二全体学生的3 km长跑、100 m短跑、立定跳远、5×10折返跑、俯卧撑、游泳等6个项目,采样时间为2015年6月—2016年6月,得到6个项目的先验数据信息的采样时间序列如图3所示。
以上述采样的体育成绩作为测试集,构建时间序列模型,采用灰色模型对体育成绩进行预测,采用极限学习机对灰色模型的预测误差进行修正,以其中的一组样本为例,得到的预测输出如图4所示。
从图4可见,采用本文模型进行体育成绩预测能有效跟踪体育成绩的特征状态,对体育成绩状态变化的动态跟踪性能较好,表现了较好的预测能力。为了对比模型性能,采用本文模型和传统模型进行体育成绩预测,得到的精度对比结果如图5所示。对图5分析可知,采用本文模型进行体育成绩预测的精度较高,性能较好。
4 结 语
本文研究了体育成绩的准确预测模型,进行体育成绩预测的数据信息流模型构建和体育成绩的非线性時间序列分析,提取体育成绩时间序列有效的主成分特征,通过灰色模型学习进行体育成绩的预测,采用极限学习机对灰色模型的预测误差进行修正,使得预测误差快速收敛到零,实验测试结果表明,采用本文模型进行体育成绩预测的精度较高,误差低于传统方法,具有较好的应用价值。
参考文献
[1] 马友忠,孟小峰.云数据管理索引技术研究[J].软件学报,2015,26(1):145?166.
[2] 杨雷,李贵鹏,张萍.改进的Wolf一步预测的网络异常流量检测[J].科技通报,2014,30(2):47?49.
[3] 任志刚,赵松云,黄姗姗,等.求解多维背包问题的蚁群?拉格朗日松弛混合优化算法[J].控制与决策,2016,31(7):1178?1184.
[4] 刘俊,刘瑜,何友,等.杂波环境下基于全邻模糊聚类的联合概率数据互联算法[J].电子与信息学报,2016,38(6):1438?1445.
[5] CHOI J, YU K, KIM Y. A new adaptive component?substitution?based satellite image fusion by using partial replacement [J]. IEEE transactions on geoscience and remote sensing, 2011, 49(1): 295?309.
[6] CHANG Y C, LIN Z S, CHEN J L. Cluster based self organization management protocols for wireless sensor networks [J]. IEEE transactions on consumer electronics, 2006, 52(1): 75?80.
[7] KOLHE J P, SHAHEED M, CHANDAR T S, et al. Robust control of robot manipulators based on uncertainty and disturbance estimation [J]. International journal of robust and nonlinear control, 2013, 23(1): 104?122.
[8] LIU Yuntong. K?pruning algorithm for semantic relevancy calculating model of natural language [J]. Journal of theoretical and applied information technology, 2013, 48(3): 1517?1521.
[9] ZHANG Q, ZHU Q Y, ZHANI M F, et al. Dynamic service placement in geographically distributed clouds [C]// Procee?dings of 2012 IEEE International Conference on Distributed Computing Systems. Washington, D. C.: IEEE, 2012: 526?539.
[10] 陆兴华,陈平华.基于定量递归联合熵特征重构的缓冲区流量预测算法[J].计算机科学,2015,42(4):68?71.