基于机器学习的大学生自杀风险预测与分析

丁楠
摘 要: 针对当前大学生自杀风险预测方法的预测误差大,精度低等问题,提出基于机器学习的大学生自杀风险预测与分析方法。首先采集大学生自杀风险的影响因素,并结合样本熵对大学生自杀风险的影响因素子序列进行复杂度分析,根据熵值进行归类叠加处理;然后利用交叉验证理论和重构相空间理论建立大学生自杀因素间的相关系数矩阵;最后结合支持向量机理论确定大学生自杀风险预测的决策函数,以此为依据组建大学生自杀风险预测模型。结果表明,该方法的大学生自杀风险分析预测精度高,实用性较强,可以为积极开展自杀预防与危机干预提供重要的理论依据。
关键词: 机器学习; 大学生自杀风险; 预测方法; 结果分析
中图分类号: TN911.1?34; B849 文献标识码: A 文章编号: 1004?373X(2017)21?0091?03
Prediction and analysis of college student suicide risk based on machine learning
DING Nan
(Luoyang Institute of Science and Technology, Luoyang 471023, China)
Abstract: The available prediction methods of college student suicide risk has large prediction error and low prediction accuracy, therefore, a college student suicide risk prediction and analysis method based on machine learning is put forward. The factors influencing the college student suicide risk are acquired. The sample entropy is combined to analyze the subsequence of the factors influencing the college student suicide risk to perform the complexity analysis, according to which, the factors are classified and superimposed. The cross?validation theory and phase?space reconstruction theory are used to establish the correlation coefficient matrix for the suicide factors of college student, and combined with the support vector machine theory to determine the decision function of college student suicide risk prediction. According to the decision function, the prediction model of college student suicide risk is established. The experimental results show that the proposed method has high analysis and prediction accuracy for college student suicide risk, strong practicability, and can provide the important theory basis for the active development of the suicide prevention and crisis intervention.
Keywords: machine learning; college student suicide risk; prediction method; result analysis
0 引 言
近年来,随着高等院校的招生就业以及对教育、教学管理体制不断的深化和改革,导致大学生在接受良好的教育资源的同时,也承受着越来越大的学业、经济、人际、情感的压力以及困扰,使得大学生逐渐产生了不同程度的心理危机,造成大学生自杀事件频现[1?2]。由于大学生自杀事件对社会、学校、家庭产生的负面效应较大,也因此成为了影响校园安全和稳定的重要影响因素之一[3]。因此,如何有效进行大学生的自杀风险预测已成为现阶段亟需解决的问题,为积极开展自杀预防与危机干预提供重要的理论依据[4?5]。
现阶段大学生自杀风险预测与分析研究的方法较为单一,多数采用问卷调查等方式,此类方法要求参与调查的大学生数量必须较大,才能保证调查的大学生自杀风险预测结果的精确性,在实际应用过程中存在随机性强、调查耗时长、预测性差、实用性低等问题[6?9]。
针对上述问题,提出基于机器学习的大学生自杀风险预测分析方法。实验结果表明,该方法的大学生自杀风险分析效果较好,具有预测精度高、建模时间短、实用性好等优点。
1 机器学习的大学生自杀风险预测与分析
在进行大学生自杀风险预测与分析过程中,先获取大学生自杀风险与大学生自杀因素的关系,对影响大学生自杀风险的因素进行归一化处理;其次利用样本熵对不同尺度的大学生自杀风险因素子序列进行复杂度分析,根据大学生自杀风险因素子序列的不同熵值进行归类叠加,产生新的大学生自殺风险因素子序列。结合交叉验证理论和重构相空间理论确定支持向量机的各种参数和输入维数,由此组建大学生自杀风险预测模型。
1.1 大学生自杀风险因素的归一化处理
假设[d]代表大学生自杀风险的显著预测变量的维数变量,[d=1,2,…,m,][m]为大学生自杀风险显著预测变量的总维数的个数,对大学生自杀风险的显著预测变量序列进行归一化处理,利用式(1)进行表示:
[xdk=xdk-minxdklk=1maxxdklk=1-minxdklk=1] (1)
式中:[xdk]表示大学生自杀风险的显著预测变量序列;[l]代表大学生在面对明显逆境和创伤时,心理适应的动态过程;[k]代表大学生在不同心理适应动态变化下的心理症状。
假设[x(i)]代表大学生自杀风险显著预测变量的子序列,[x(1),x(2),…,x(N),][N]代表大学生自杀风险显著预测变量的总数,从多个视角分析大学生高危心理因素对自杀风险的影响程度,按顺序构成大学生自杀风险显著预测变量的[m]维矢量:
[X(i)=x(i),x(i+1),…,x(i+m-1)] (2)
式中:[i=1,2,…,N-m+1;][X(i)]代表不同[i]值的大學生高危心理因素对自杀风险的影响程度。
计算[X(i)]与不同大学生高危心理因素[X(j)(j=1,2,…,][N-m+1,]且[j≠i])之间的相关性距离:
[dmX(i),X(j)=maxx(i+k)-x(j+k)] (3)
给定不同大学生高危心理因素之间的相似容限[r]([r]>0),计算满足[dmX(i),X(j)≥r]约束条件的数目,再结合式(4)计算出不同大学生高危心理因素之间的相似容限与大学生高危心理因素相关性距离总数[N-m]的比值[Bmi(r)],即:
[Bmi(r)=1N-mnumdmX(i),X(j)≥r] (4)
式中:[i=1,2,…,N-m+1,][j≠i;][Bmi(r)]代表大学生高危心理因素影响下的偏执行为;[num]表示[dmX(i),X(j)][≥][r]的数目,利用式(5)计算出大学生高危心理因素影响下的自杀态度与自杀倾向之间的关系:
[Bm(r)=1N-m+1i=1N-m+1Bmi(r)βu] (5)
式中:[βu]代表大学生对自杀行为保持的阶段性意识倾向。当大学生自杀风险的显著预测变量维数[m]增加为[m+1,]重复对式(2)~式(4)的计算,可以重新计算出大学生高危心理因素影响下的自杀态度与自杀倾向之间的关系:
[Bm+1(r)=1N-mi=1N-mBm+1i(r)φu] (6)
式中[φu]代表大学生潜在自杀可能性发生率。
利用样本熵定理对式(5)和式(6)进行归类叠加可得到大学生高危心理因素影响下的自杀行为冲动性表现:
[SampEn(N,m,r)=-μulnBm+1(r)Bm(r)] (7)
式中:[μu]代表大学生采取过激行为造成的心理压力的负性事件。大学生高危心理因素影响下的自杀行为冲动性表现与大学生自杀风险的显著预测变量[m]以及不同大学生高危心理因素之间的相似容限[r]有关。
1.2 组建大学生自杀风险预测模型
结合机器学习理论得到大学生采取过激行为造成的心理压力的负性事件导致的自杀意念,利用式(8)进行计算:
[minJ(ω,ξ)=12ωTω-C2i=1lξ2is.t. yi=ωT?(xi)+b+ξi] (8)
式中:[xi]和[yi]分别代表自杀风险影响因素和自杀意念强度特征值;[ωT]代表大学生面对负性事件的应对方式;[ω]代表该应对产生自杀意念的发生率;[J]代表应急生活事件对自杀意念的影响作用;[?(xi)]代表产生自杀心理危机的持续时间;[ξi]代表暴力行为函数;[b]代表学业压力系数;[C]代表生活态度阶段性变化属性值。
结合拉格朗日理论对上述约束问题进行优化,得到不同高危心理因素影响下的大学生自杀意念发生率的多项式函数为:
[L(ω,b,ξ,α)=J(ω,ξ)-i=1lαiωT?(xi)+b+ξi-yi] (9)
式中[αi]为拉格朗日乘子。
对[ω,][ξi,][b,][αi]进行交叉验证和相空间重构,可得到大学生自杀风险因素间相关系数矩阵:[0ITyΩ+C-1E×bα=0I] (10)
式中:[E]是[l×l]维的单位矩阵;[I]代表主要影响大学生自杀意念的强度值;[α=α1,α2,…,αiT]代表大学生不同负性事件应对方式的不定风险系数;[y=y1,y2,…,yiT]代表大学生面对负性事件影响时产生自杀意念表现的应对方式;[Ωij=?(xi)??(xj)=K(xi,xj)]为满足重构相空间理论的核函数。重构相空间理论的核函数可作为支持向量机的高斯核函数,利用高斯核函数作为大学生自杀风险支持向量机预测模型的核函数。通过求解式(10)可得到大学生自杀风险预测的决策函数:
[fx=i=1lαi×exp-xi-xj22σ2+b] (11)
式中:[fx]为大学生自杀的意念强度值;[xi]为输入任意一个大学生自杀风险影响因素;[σ]为高斯核函数的宽度参数,以此为依据组建大学生自杀风险预测模型。
2 仿真实验分析
实验数据来源于北京市某综合大学文理科院8个系的全体学生,共2 215人,统一到学校的机房进行施测,施测时间为5天,在对可靠的样本数据回收后,以式(8)的计算结果为依据,考察本文预测模型分析大学生自杀意念、自杀计划以及自杀行为是否在生活应急事件、偏执以及暴力等自杀风险影响因素上的显著差异,这里指的生活应急事件主要是家庭、学校以及工作等情境中发生的应急事件。结合Matlab软件进行独立样本检验,统计结果见表1。通过表1可以说明,偏执、暴力、生活应急事件三个因素对大学生自杀意念具有极其显著的差异([t <]0.001),自杀计划在生活应急事件因素上存在显著差异([t]0.05)。
为了证明偏执、暴力、生活应急事件对大学生自杀意念的产生是否存在影响以及影响程度大小,以偏执、暴力、生活应急事件为变量,自杀意念为因素进行方差分析,利用式(12)给出方差分析计算过程:
[F=m?P2+σ2σ2=m?P2σ2+1] (12)
式中:[F]代表在相应显著水平下的临界值;[P]代表在相应[F]值下的概率值。
机器学习预测模型的统计结果见表2,通过表2可以说明偏执、暴力以及生活应急事件三个因素对大学生自杀意念的产生都具有极其显著的影响,且生活应急事件对大学生自杀意念产生的影响最大。
以表2给出的统计结果为理论依据,将实际大学生自杀风险因素趋势曲线与机器学习预测模型统计的大学生自杀风险因素趋势曲线进行对比,其结果如图1所示。
分析图1可知,利用机器学习预测模型统计的大学生自杀风险因素趋势曲线与实际大学生自杀风险因素趋势曲线相吻合。这主要是因为利用机器学习预测模型进行大学生自杀风险预测过程中,先获取大学生自杀风险的显著预测变量,并对大学生自杀风险的显著预测变量序列进行归一化处理,计算出各显著预测变量与大学生高危心理因素之间的相关性距离,得到大学生高危心理因素影响下的自杀态度与自杀倾向之间的关系,在此基础上结合样本熵理论对大学生潜在自杀可能性发生率进行分析、叠加重构,得到大学生高危心理因素影响下的自杀行为冲动性表现函数。在此基础上,利用交叉验证理论和重构相空间理论得到大学生自杀因素间的相关系数矩阵,结合支持向量机理论确定大学生自杀风险预测的决策函数,以此为依据组建大学生自杀风险预测模型。
3 结 语
针对当前方法进行大学生自杀风险预测过程中难以准确地预测出大学生自杀风险的主要诱发因素,存在分析误差大、预测精度低的问题,提出基于机器学习的大学生自杀风险预测与分析方法。实验仿真证明,该方法的大学生自杀风险分析预测精度高,实用性较强,可以为积极开展自杀预防与危機干预提供重要的理论依据。
参考文献
[1] 张道强,接标.基于机器学习的脑网络分析方法及应用[J].数据采集与处理,2015,30(1):68?76.
[2] 余璐,程咏梅,刘夏雷,等.基于机器学习的SMN可靠性分析及量测误差建模[J].西北工业大学学报,2016,34(2):333?337.
[3] 王景中,李萌.基于LBP和PCA机器学习的手势识别算法[J].计算机测量与控制,2015,23(4):1320?1322.
[4] 王颖,李金,王磊,等.基于机器学习的microRNA预测方法研究进展[J].计算机科学,2015,42(2):7?13.
[5] 陈渝龙.重采样与机器学习结合的防火墙链接动态分配[J].科技通报,2015,31(10):64?66.
[6] 罗晓.试论大学生自杀的风险因素[J].四川民族学院学报,2016,25(2):75?79.
[7] 王舟,谢斌,卞茜,等.哥伦比亚自杀筛选问卷对高中生自杀风险评估的信效度[J].中华精神科杂志,2015,48(2):104?108.
[8] 王延寿,谢婉丽,葛瑞华,等.TSP超前预报法在秦安高风险隧道中的应用[J].科学技术与工程,2014,14(34):97?103.
[9] 陶涛,史玉坤,袁锦,等.大学生自杀意念与死亡态度的相关分析[J].中国健康心理学杂志,2016,24(7):1073?1076.
[10] 何维民,邹云峰,王丽渊.基于客户视角的电力营销服务风险研究[J].现代电子技术,2016,39(15):123?126.