数据挖掘的排球训练方案评价模型
黄云
摘 要: 未能深度挖掘出评价指标之间的关联性是造成排球训练方案评价效果不好的主要原因,为此,设计了基于数据挖掘的排球训练方案评价模型。介绍了数据挖掘进行排球训练效率值提取的步骤,通过效率值分析排球训练动作对训练成果的影响,选出模型评价指标。利用数据挖掘对模型评价指标进行量化和关联,确定指标权值,为训练方案打分。使用VFP 6.0软件对模型进行开发,设计模型功能。最后通过实验证明所设计的模型具有评价效果好的优势。
关键词: 数据挖掘; 训练方案; 评价模型; 关联规则
中图分类号: TN98?34; G842 文献标识码: A 文章编号: 1004?373X(2017)15?0101?04
Abstract: The relevance among the evaluation indexes can′t be mined deeply is the main reason causing the poor evaluation effect of the volleyball training program, therefore the data mining based evaluation model of volleyball training program scheme was designed. The step using data mining to extract the volleyball training efficiency value is introduced. The influence of volleyball training action on training effect is analyzed according to the efficiency value to choose the model evaluation index. The data mining is used to quantize and associate with the model evaluation index, determine the index weight, and grade the training program. The VFP 6.0 software is adopted to develop the model, and design the model function. The experimental results verify that the model has the good evaluation effect.
Keywords: data mining; training program; evaluation model; association rule
0 引 言
体育竞技极具观赏性,是当代人休闲娱乐的项目之一。在排球比赛中,运动员的竞技能力包括攻防方式、传球技能和团队合作能力等,在很大程度上会受到训练方案的影响,训练方案对排球运动的发展具有导向功能,是排球比赛取得实质性胜利的关键点[1]。排球训练方案对球队和运动员的适宜程度一般无法通过肉眼观察出来,需要采用特定方法对其进行评价。
定性评价和定量评价是最传统的排球训练方案评价方法,定性评价通过收集教练和专家的排球比赛经验对运动员训练方案进行评价,定量评价从多种具有代表性的排球比赛中挖掘运动员行为数据评价训练方案[2]。两种设计方法的处理方向均正确,但人为的主观分析过多,难免出现误差,不符合当代社会的科学技术发展观念。文献[3]采用人工神经网络设计排球训练方案评价模型,运用计算机仿真手段结合定性评价和定量评价的优势,通过人工神经网络迭代提取训练方案与实际比赛进程的不相关性得到了杰出的评价效果,其最大缺陷是模型反应出的数据量不多,未能找寻到训练项目与比赛成绩之间的关联性,评价效果仍存在可提升余地。通过以上分析,采用数据挖掘技术[4]设计排球训练方案评价模型,明确指出各项模型指标的关联性,为排球教练提供决策平台。
1 数据挖掘的排球训练方案评价指标
数据挖掘起源于计算机科学中的人工智能,其基本处理步骤包括指标设定以及指标数据的管理、挖掘、提取与解析,通过挖掘数据集中指标数据之间的关联性来归纳指标特征与结构,再对特征与结构进行量化,对比得出指标的优劣性,进而分析、提取并显示数据关系。
基于数据挖掘的排球训练方案评价模型使用数据挖掘从大量的、不确定的排球训练方案数据中查找可以促进排球训练得分的特征进行评价。在进行评价之前,使用马尔科夫链[5]在模型中建立排球训练方案数据库,从中选择评价指标作为评价排球训练方案的切入点。排球训练方案数据库的数据出处是近8年的各种大型排球比赛视频以及临场训练方案。排球训练的效率值与胜率成正比,通过数据挖掘从数据库中提取效率值的步骤如图1所示。
提取排球训练方案效率值时,将比赛与临场训练方案看成一个拥有多种数据特征的数据集,将数据集转化为战术数据表征的过程,满足马尔科夫链,排球训练方案的效率值由數据集中各数据特征的转化效率计算而得[6]。表示数据特征转化成数据特征的转化效率,是起点数据特征转化成终点特征的转化效率,有:
排球训练效率值的计算步骤为:首先式(1)的计算结果为一个矩阵,为矩阵中所有数据项加一个增量,然后利用式(1)计算得出一个增量矩阵。排球训练效率值是两个矩阵之差,其值越小对应的数据特征对排球比赛胜率的影响就越小。排球训练得分和失分影响图如图2所示。
排球训练中运动员的每一个动作都会造成得分与失分,并且都有一个稳定的得失步骤。在图2中,任意一个影响都会导致步骤的停止,停止即表示得分或失分。马尔科夫链指出,某一时间段的状态会对之后的状态给出指引,之前的状态对之后状态产生的影响可忽略不计[7]。将运动员训练动作设为时间段状态,通过分析各状态的效率值可得,对排球训练结果有重要影响的排球训练方案评价模型评价指标包括发球、快攻、强攻、一传和二传,如表1所示。
2 数据挖掘的排球训练方案评价模型
2.1 评价指标权值的确定
使用数据挖掘对排球训练方案评价指标进行量化的目的是为了寻找评价指标之间的差别和关联,并进行差异补偿[8],即构造评价指标权值,以反应出排球训练方案中的战术水平,加强训练方案的可用度。为了将理论与实际进行结合,挖掘定量方法中的排球训练方案实际情况对模型评价指标进行量化,量化结果记录在表2中,可见模型评价指标的量化结果为得分率、失分率和组合率,结构清晰,理解起来非常方便,能够正确显示出排球训练方案与比赛结果之间的关联性,以及各评价指标之间的差别。
关联规则是数据挖掘的关键技术点,只有准确提取到数据之间的关联性才能得到有用的深层信息。对表2中的量化结果进行关联,设量化结果为模型评价指标用集合表示,指标的可信度与支持度用和表示,估计指标的关联结果用表示,关联度集合为对于量化结果中的任意量化值而言,如果同时满足且那么数据挖掘的关联规则[9]为表示存在关联,有:
由排球教练设置训练方案评价指标临界值当,表示关联结果可信,输出可信的关联结果进行归一化,得出模型评价指标权值。如果关联结果为线性,采用式(3)进行归一化处理;若为指数,用式(4)进行归一化处理。
式中MAX和MIN分别代表的最大值和最小值。
表2中数据关联度的归一化结果见表3。
基于数据挖掘的排球训练方案评价模型对各项指标的综合评价打分公式表示为:
式中代表权重。
2.2 模型的开发
对基于数据挖掘的排球训练方案评价模型的开发使用VFP 6.0(Visual FoxPro 6.0)软件,这是一款进行中、小型数据库管理与开发的工具,是目前的主流开发工具,具有开发周期短、程序代码编写简单、运营方便、调用速度快的特点,并且对计算机硬件的要求不高,可与日常办公软件进行数据交互,用户也可根据自身需要修改初始程序代码。VFP 6.0软件的程序代码接口性能完善,能够引进不同类型和功能的编辑器(必须是32位的)对主控文件和数据库进行建立,支持C/S结构数据库的开发,并提供程序更新入口。图3描述的是VFP 6.0软件开发出的模型功能结构图。
由图3可得,基于数据挖掘的排球训练方案评价模型拥有数据录入、数据处理、数据查询、报表输出和系统维护五个功能模块,囊括了所有的数据挖掘处理流程和排球训练方案打分流程的录入、显示以及维护等功能。
3 实验与结果讨论
在以往的排球训练方案评价模型开发成果中,定性评价、定量评价和人工神经网络评价比较常用,三种模型均有着不同的优势和缺点。本文将基于数据挖掘的排球训练方案评价模型与上述三项开发成果进行对比,测试本文模型的评价效果。实验现场如图4所示,是一个常规仿真实验室。
理论偏移由排球训练方案评价模型中的估计差值计算产生,是一种随机变量。由于排球训练方案的易变性,理论偏移必然使评价模型产生计算误差[10],计算误差来源于模型指标及其权值与实际训练情况的偏移,决定了模型的评价效果。模型评价效果的表达式为:
实验开始之前对我国4个省级排球队的日常训练方案进行收集,共计88个训练样本,样本中包括训练过程中所进行的排球比赛进攻方案和比赛分数,将以上两项组成实际偏移,对训练样本进行评价。表4~表7分别记录了定性评价、定量评价、人工神经网络评价和基于数据挖掘的排球训练方案评价模型的评价效果,其中,比赛分数的评价效果来源于各模型对评价指标的组合率。
分析表4~表7可得,四种设计成果中,定量评价的评价效果最差,其次是定性评价,造成评价效果差的可能原因如下:
(1) 排球进攻方案的数据采集样本数量过少,引起各种进攻类型之间特性的混淆,评价过程中无法正确区分进攻类型;
(2) 未将比赛分数与进攻方案结合起来进行评价,样本数据关联性挖掘不足;
(3) 排球训练方案中的不可控因素过多,评价之前未能对这些因素进行准确过滤。
人工神经网络评价和基于数据挖掘的排球訓练方案评价模型的评价效果都很好。人工神经网络评价对进攻方案的评价效果要高于其对比赛分数的评价效果,间接体现了数据关联性挖掘不足的缺点,因而评价效果不如本文设计的基于数据挖掘的排球训练方案评价模型。
4 结 论
为了提高排球训练方案的实用性,设计基于数据挖掘的排球训练方案评价模型,改善传统评价方式的评价效果。通过实验测试本文模型的可行性,测试方法是将定性评价、定量评价和人工神经网络评价与本文模型进行对比,以理论偏移与实际偏移的差异量表示评价效果,实验结果表明,本文模型的评价效果最好。
参考文献
[1] 唐磊.学校排球队员的训练与教学之我见[J].科技资讯,2014,12(11):166?167.
[2] 刘江,李毅钧.排球多元组合训练的生理生化监控及实施研究:以四川省男子排球队为例[J].广州体育学院学报,2016,36(1):102?105.
[3] 林锋.高校排球运动员体能评价体系的构建[J].福建教育学院学报,2014,15(4):59?61.
[4] 周程.人工智能推理引擎在微博数据挖掘中的应用[J].现代电子技术,2016,39(15):99?102.
[5] 赵伟强,黄新波,赵隆,等.输电线路绝缘子表面盐密在线监测系统[J].西安工程大学学报,2016,30(1):86?92.
[6] 郐淑娥.基于数据挖掘技术的超市顾客忠诚度评价模型的构建[J].中国管理信息化,2015,18(19):63?65.
[7] 邓芳.大型物联网电子设备的海量数据高效挖掘方法研究[J].现代电子技术,2016,39(4):159?162.
[8] 王学峰,齐晓爽.CUVA排球运动员训练期自我效能状况的实验研究[J].安徽体育科技,2016,37(1):50?53.
[9] 李菲.基于数据挖掘的商务智能系统的设计与实现[J].现代电子技术,2016,39(11):152?155.
[10] 季惠芬.“排球”微课程的模型设计建构与实施策略[J].体育教学,2016,36(4):28?30.
摘 要: 未能深度挖掘出评价指标之间的关联性是造成排球训练方案评价效果不好的主要原因,为此,设计了基于数据挖掘的排球训练方案评价模型。介绍了数据挖掘进行排球训练效率值提取的步骤,通过效率值分析排球训练动作对训练成果的影响,选出模型评价指标。利用数据挖掘对模型评价指标进行量化和关联,确定指标权值,为训练方案打分。使用VFP 6.0软件对模型进行开发,设计模型功能。最后通过实验证明所设计的模型具有评价效果好的优势。
关键词: 数据挖掘; 训练方案; 评价模型; 关联规则
中图分类号: TN98?34; G842 文献标识码: A 文章编号: 1004?373X(2017)15?0101?04
Abstract: The relevance among the evaluation indexes can′t be mined deeply is the main reason causing the poor evaluation effect of the volleyball training program, therefore the data mining based evaluation model of volleyball training program scheme was designed. The step using data mining to extract the volleyball training efficiency value is introduced. The influence of volleyball training action on training effect is analyzed according to the efficiency value to choose the model evaluation index. The data mining is used to quantize and associate with the model evaluation index, determine the index weight, and grade the training program. The VFP 6.0 software is adopted to develop the model, and design the model function. The experimental results verify that the model has the good evaluation effect.
Keywords: data mining; training program; evaluation model; association rule
0 引 言
体育竞技极具观赏性,是当代人休闲娱乐的项目之一。在排球比赛中,运动员的竞技能力包括攻防方式、传球技能和团队合作能力等,在很大程度上会受到训练方案的影响,训练方案对排球运动的发展具有导向功能,是排球比赛取得实质性胜利的关键点[1]。排球训练方案对球队和运动员的适宜程度一般无法通过肉眼观察出来,需要采用特定方法对其进行评价。
定性评价和定量评价是最传统的排球训练方案评价方法,定性评价通过收集教练和专家的排球比赛经验对运动员训练方案进行评价,定量评价从多种具有代表性的排球比赛中挖掘运动员行为数据评价训练方案[2]。两种设计方法的处理方向均正确,但人为的主观分析过多,难免出现误差,不符合当代社会的科学技术发展观念。文献[3]采用人工神经网络设计排球训练方案评价模型,运用计算机仿真手段结合定性评价和定量评价的优势,通过人工神经网络迭代提取训练方案与实际比赛进程的不相关性得到了杰出的评价效果,其最大缺陷是模型反应出的数据量不多,未能找寻到训练项目与比赛成绩之间的关联性,评价效果仍存在可提升余地。通过以上分析,采用数据挖掘技术[4]设计排球训练方案评价模型,明确指出各项模型指标的关联性,为排球教练提供决策平台。
1 数据挖掘的排球训练方案评价指标
数据挖掘起源于计算机科学中的人工智能,其基本处理步骤包括指标设定以及指标数据的管理、挖掘、提取与解析,通过挖掘数据集中指标数据之间的关联性来归纳指标特征与结构,再对特征与结构进行量化,对比得出指标的优劣性,进而分析、提取并显示数据关系。
基于数据挖掘的排球训练方案评价模型使用数据挖掘从大量的、不确定的排球训练方案数据中查找可以促进排球训练得分的特征进行评价。在进行评价之前,使用马尔科夫链[5]在模型中建立排球训练方案数据库,从中选择评价指标作为评价排球训练方案的切入点。排球训练方案数据库的数据出处是近8年的各种大型排球比赛视频以及临场训练方案。排球训练的效率值与胜率成正比,通过数据挖掘从数据库中提取效率值的步骤如图1所示。
提取排球训练方案效率值时,将比赛与临场训练方案看成一个拥有多种数据特征的数据集,将数据集转化为战术数据表征的过程,满足马尔科夫链,排球训练方案的效率值由數据集中各数据特征的转化效率计算而得[6]。表示数据特征转化成数据特征的转化效率,是起点数据特征转化成终点特征的转化效率,有:
排球训练效率值的计算步骤为:首先式(1)的计算结果为一个矩阵,为矩阵中所有数据项加一个增量,然后利用式(1)计算得出一个增量矩阵。排球训练效率值是两个矩阵之差,其值越小对应的数据特征对排球比赛胜率的影响就越小。排球训练得分和失分影响图如图2所示。
排球训练中运动员的每一个动作都会造成得分与失分,并且都有一个稳定的得失步骤。在图2中,任意一个影响都会导致步骤的停止,停止即表示得分或失分。马尔科夫链指出,某一时间段的状态会对之后的状态给出指引,之前的状态对之后状态产生的影响可忽略不计[7]。将运动员训练动作设为时间段状态,通过分析各状态的效率值可得,对排球训练结果有重要影响的排球训练方案评价模型评价指标包括发球、快攻、强攻、一传和二传,如表1所示。
2 数据挖掘的排球训练方案评价模型
2.1 评价指标权值的确定
使用数据挖掘对排球训练方案评价指标进行量化的目的是为了寻找评价指标之间的差别和关联,并进行差异补偿[8],即构造评价指标权值,以反应出排球训练方案中的战术水平,加强训练方案的可用度。为了将理论与实际进行结合,挖掘定量方法中的排球训练方案实际情况对模型评价指标进行量化,量化结果记录在表2中,可见模型评价指标的量化结果为得分率、失分率和组合率,结构清晰,理解起来非常方便,能够正确显示出排球训练方案与比赛结果之间的关联性,以及各评价指标之间的差别。
关联规则是数据挖掘的关键技术点,只有准确提取到数据之间的关联性才能得到有用的深层信息。对表2中的量化结果进行关联,设量化结果为模型评价指标用集合表示,指标的可信度与支持度用和表示,估计指标的关联结果用表示,关联度集合为对于量化结果中的任意量化值而言,如果同时满足且那么数据挖掘的关联规则[9]为表示存在关联,有:
由排球教练设置训练方案评价指标临界值当,表示关联结果可信,输出可信的关联结果进行归一化,得出模型评价指标权值。如果关联结果为线性,采用式(3)进行归一化处理;若为指数,用式(4)进行归一化处理。
式中MAX和MIN分别代表的最大值和最小值。
表2中数据关联度的归一化结果见表3。
基于数据挖掘的排球训练方案评价模型对各项指标的综合评价打分公式表示为:
式中代表权重。
2.2 模型的开发
对基于数据挖掘的排球训练方案评价模型的开发使用VFP 6.0(Visual FoxPro 6.0)软件,这是一款进行中、小型数据库管理与开发的工具,是目前的主流开发工具,具有开发周期短、程序代码编写简单、运营方便、调用速度快的特点,并且对计算机硬件的要求不高,可与日常办公软件进行数据交互,用户也可根据自身需要修改初始程序代码。VFP 6.0软件的程序代码接口性能完善,能够引进不同类型和功能的编辑器(必须是32位的)对主控文件和数据库进行建立,支持C/S结构数据库的开发,并提供程序更新入口。图3描述的是VFP 6.0软件开发出的模型功能结构图。
由图3可得,基于数据挖掘的排球训练方案评价模型拥有数据录入、数据处理、数据查询、报表输出和系统维护五个功能模块,囊括了所有的数据挖掘处理流程和排球训练方案打分流程的录入、显示以及维护等功能。
3 实验与结果讨论
在以往的排球训练方案评价模型开发成果中,定性评价、定量评价和人工神经网络评价比较常用,三种模型均有着不同的优势和缺点。本文将基于数据挖掘的排球训练方案评价模型与上述三项开发成果进行对比,测试本文模型的评价效果。实验现场如图4所示,是一个常规仿真实验室。
理论偏移由排球训练方案评价模型中的估计差值计算产生,是一种随机变量。由于排球训练方案的易变性,理论偏移必然使评价模型产生计算误差[10],计算误差来源于模型指标及其权值与实际训练情况的偏移,决定了模型的评价效果。模型评价效果的表达式为:
实验开始之前对我国4个省级排球队的日常训练方案进行收集,共计88个训练样本,样本中包括训练过程中所进行的排球比赛进攻方案和比赛分数,将以上两项组成实际偏移,对训练样本进行评价。表4~表7分别记录了定性评价、定量评价、人工神经网络评价和基于数据挖掘的排球训练方案评价模型的评价效果,其中,比赛分数的评价效果来源于各模型对评价指标的组合率。
分析表4~表7可得,四种设计成果中,定量评价的评价效果最差,其次是定性评价,造成评价效果差的可能原因如下:
(1) 排球进攻方案的数据采集样本数量过少,引起各种进攻类型之间特性的混淆,评价过程中无法正确区分进攻类型;
(2) 未将比赛分数与进攻方案结合起来进行评价,样本数据关联性挖掘不足;
(3) 排球训练方案中的不可控因素过多,评价之前未能对这些因素进行准确过滤。
人工神经网络评价和基于数据挖掘的排球訓练方案评价模型的评价效果都很好。人工神经网络评价对进攻方案的评价效果要高于其对比赛分数的评价效果,间接体现了数据关联性挖掘不足的缺点,因而评价效果不如本文设计的基于数据挖掘的排球训练方案评价模型。
4 结 论
为了提高排球训练方案的实用性,设计基于数据挖掘的排球训练方案评价模型,改善传统评价方式的评价效果。通过实验测试本文模型的可行性,测试方法是将定性评价、定量评价和人工神经网络评价与本文模型进行对比,以理论偏移与实际偏移的差异量表示评价效果,实验结果表明,本文模型的评价效果最好。
参考文献
[1] 唐磊.学校排球队员的训练与教学之我见[J].科技资讯,2014,12(11):166?167.
[2] 刘江,李毅钧.排球多元组合训练的生理生化监控及实施研究:以四川省男子排球队为例[J].广州体育学院学报,2016,36(1):102?105.
[3] 林锋.高校排球运动员体能评价体系的构建[J].福建教育学院学报,2014,15(4):59?61.
[4] 周程.人工智能推理引擎在微博数据挖掘中的应用[J].现代电子技术,2016,39(15):99?102.
[5] 赵伟强,黄新波,赵隆,等.输电线路绝缘子表面盐密在线监测系统[J].西安工程大学学报,2016,30(1):86?92.
[6] 郐淑娥.基于数据挖掘技术的超市顾客忠诚度评价模型的构建[J].中国管理信息化,2015,18(19):63?65.
[7] 邓芳.大型物联网电子设备的海量数据高效挖掘方法研究[J].现代电子技术,2016,39(4):159?162.
[8] 王学峰,齐晓爽.CUVA排球运动员训练期自我效能状况的实验研究[J].安徽体育科技,2016,37(1):50?53.
[9] 李菲.基于数据挖掘的商务智能系统的设计与实现[J].现代电子技术,2016,39(11):152?155.
[10] 季惠芬.“排球”微课程的模型设计建构与实施策略[J].体育教学,2016,36(4):28?30.