基于大数据的高校心理危机预警的智能服务研究

2024.07.28

摘要：本文通过大数据文本处理技术，采用知识图谱技术实时监控所覆盖学生群体网络自媒体（如微博）等文本信息，实时形成三级危机预警报告，辅助人工评估进行危机预防及干预，并通过大数据辅助建构“实时评估—智能风控—危机干预”心理危机预警的智能服务体系，为高校心理健康工作提供智能保障。

关键词：大数据;智能服务;心理危机预警;心理健康

中图分类号：G642 ?文献标识码：B ?论文编号：1674-2117（2021）07-0105-04

十九大报告指出，推动互联网、大数据、人工智能与实体经济深度融合。[1]说明大数据时代的数据储备、技术理念，正以前所未有的方式预测事物发展趋势，改变大学生的知识体系、生活方式及心理健康水平。大学生作为接触最活跃思想、最先进技术、最密集知识的排头兵群体，其心理健康标准体系在大数据时代产生了革命性的变化，导致认知、情感与行为方式的改变，给高校危机干预提供了海量化、实时化、个性化、可量化数据资源。[2]在互联网高速发展的今天，网络社交媒体成为大学生倾诉想法、宣泄情绪的重要平台，这些信息中包含了很多心理危机信息，为危机干预提供了丰富而宝贵的数据。[3]

高校心理危机干预的研究现状

目前，抑郁症、焦虑症等心理问题已经成为高校大学生心理危机干预中的高发问题，然而目前高校心理危机干预面临很多因互联网技术的发展而带来的挑战[4]：第一，微信、微博、QQ等社交媒体蕴含着大学生心理危机评估诊断重要线索，但无法实时提取分析;第二，传统心理危机评估多依靠经验或直觉，反馈模糊延迟，难以量化评估与风险控制[5];第三，危机干预机制延迟僵化，效率低下，事故频发[6];第四，危机干预的跟踪评估机制缺乏可持续性。

知识图谱技术

本研究利用互联网大数据提供海量数据，挖掘微博大数据文本信息，采用知识图谱技术，对特定群体的学生“实时监控”其微博、知乎等特定网站，从学生信息中筛选高风险的自杀人群，并实时监控心理危机的风险程度，根据监控报告结合人工评估结果，采取心理危机干预行动。[7]对清洗出来的准确可靠的信息进行结构化描述、关联、组织，将其转化为知识图谱的知识。[8]2018年1月至2019年1月，本研究已经对770余人进行心理危机预警及干预行动，对58人获得有效干预，及时发现自杀情绪，阻止自杀行为。

危机预警分级标准

为了更加精准地筛选、甄别危机个体，本研究提出危机预警分级系统。根据自杀方式的确定性、时间紧迫性等因素确定危机风险级别，级别越高代表危机越大、自杀风险越大。[9]具体的危机预警分级如下页表所示。

本研究通过Python爬虫八爪鱼等工具抓取大数据，获得心理危机监测智能系统所需的信息知识支撑，构建常见高危心理病症的知识图谱，提供心理危机相关的各种基本信息，如抑郁症表征、焦虑症表征，用于筛选、抓取社交媒体（如微博等）信息进行分析与判断。本研究对心理危机进行心理画像描述，如抑郁症的知识图谱对自杀方式、自杀计划、自杀行动、自杀时间、自杀地点、自杀体验、负性情绪、痛苦表达等描述，由不同心理危机的知识图谱组合构成。本研究的文本处理知识图谱由自杀图谱、时间图谱、空间图谱、意愿图谱等作为主要构成集合。

（1）自杀图谱。本研究利用大数据文本处理技术监控高、中、底三级自杀危机学生群体。根据自杀方式（采用何种行为方式实施自杀计划，如跳楼、投河、服药、上吊等）、自杀计划（根据自杀计划的详细具体程度判定，计划越详细、实施的可能性越大）、自杀行动（根据采取自杀行动，如相约自杀、遗言自杀等）描述进行记分评估。

（2）时间图谱。时间图谱是对危机事件中嵌入时间的描述，包括绝对时间（如日历、节假日等）和相对时间（如过去、现在、将来等）的描述。

（3）空间图谱。空间图谱或称为地点图谱，是对危机事件中嵌入空间地理位置的描述，包括定位地点（自媒体软件定位）和描述地点（空间地理位置的文本描述）。

（4）意愿图谱。意愿图谱是对危机事件的主体的主观愿望或相近情緒的描述，主要用于判定分析危机主体是否有自杀意愿及自杀意愿强烈程度（分为不想自杀、比较想自杀、非常想自杀三级）。

根据以上危机预警分级标准，进行语义数据处理，对抓取的数据进行数据挖掘、分析，生成对应的危机预警报告，针对高危、中危、低危三级不同危机程度，采取相应的危机干预行动方案。

危机预防智能系统

本研究根据心理危机预警分级标准，建立语义大数据处理流程，能够每天固定时间段从系统抓取数据，进行数据清洗、数据分析、结果报告、危机判断、生成报告等步骤，并根据危机报告结合人工评估复核，最后制订危机干预方案，进行危机干预行动。

本研究对心理危机预警的文本处理过程如下页图所示，大数据分析通过以下几个步骤完成。

（1）数据抓取：利用八爪鱼工具在微博抓取当天数据，生成HTML格式数据。数据抓取模块需要根据各个知识图谱设定操作化指标判断需要抓取的数据，且避免重复抓取造成数据冗余。

（2）数据清洗：把抓取的数据对其每一条信息提取关键词信息，关键词需要10个属性——时间、发文地址、微博账号、微博名称、文案内容、情绪关键词、回复对象微博名称、回复对象微博地址、回复内容、回复情绪关键词，将关键词信息生成一个文件，将其他无关信息删除。

（3）数据分析：将数据清洗后汇总文件进行分析处理。采用自然语言处理工具进行分词与句法分析。采用知识图谱进行推理分析，分级提取信息：0～3级为低危，3～6级为中危，7～10级为高危。这一过程需要使用知识图谱及其风险判断的规则算法。这些规则采用了基于逻辑程序语言Prolog中的定义子句文法（Definite Clause Grammars，DCG）知识转换规则。对于DCG规则加上面向知识图谱推理能力的扩展描述，从知识图谱中获得领域知识的理解来解读每一条信息，以判断此信息的风险级别，如定义8级危机风险为：自杀计划已定，自杀日期基本确定。描述这种逻辑程序规则的算法为：

Statement（crisis risk（7），[plan，time）），-->

Uninterested Text（_M1），rdfs Subclass of （Time， future， timeOntology），

Uninterested Text（_M2），rdfs Subclass of （Plan， crisisplan， crisisOntology），

Uninterested Text（_M3）.

Statement（crisis risk（7），[plan，time）），-->

Uninterested Text（_M1），

rdfs Subclass of （Plan， crsisPlan， crsisOntology），

Uninterested Text（_M2），

rdfs Subclass of （Time future，timeOntology），

Uninterested Text（_M3）.

这一算法逻辑为：如果一条信息谈到自杀计划和自杀时间，且没有关于这个自杀计划的否定表达，这条信息将被判断为危机风险7级，即高危风险。

（4）危机判断：上述算法规则中，“rdfs Subclass of”用于判断是否包含自杀图谱中描述的某种自杀计划及时间图谱中关于将来的时间描述。“uninterestedText”进一步判断这个语句不包含否定愿望图谱。根据算法筛选评估信息危机评分：7～10分为高危信息，4～6分为中危信息，0～3分为低危信息。

（5）生成报告：根据算法评估结果，生成大数据危机预警报告。高危信息为立刻上报人工复核处理，中危信息为每天固定时间上报，待人工复核，低危信息为过滤信息，不做处理。

（6）人工复核：高校心理健康中心组织心理学专家团队进行人工复核，专家根据平台预警信息追溯信息来源，对文本进行专业评估，如复核结果为高危自杀信息，会立刻通知学校危机干预工作团队，如复核结果为中危自杀信息，会定期通知学校危机干预工作团队。

（7）危机方案制订：学校危机干预工作团队根据大数据报告和人工复核结果，迅速做出反应，制订对应的危机干预方案。

（8）危机干预行动：学校由学生处、保卫处、校医院等多个危机干预核心部门协同展开危机干预行动，及时联系校外医院、公安等部门联动，力求在最短时间内化解危机。

结果分析

本研究通过对选定的某高校大学生学生微博数据进行实时监控，从2018年1月至2019年1月，每日发布危机报告。为了评估该系统的危机干预大数据分析的信度与效度，随机抽取了30天的监控数据进行人工数据分析检验。数据共有42702条危机信息，平均每天1423.4条有效信息，其中发现了58条高危信息（7级以上），125条中危信息（4～6级），587条低危信息（3级以下）。通过对中危、高危信息进行大数据结果和人工复核结果的风险级别和正确率进行分析发现，本研究心理危机预警的大数据评估结果高危信息检出正确率为84.98%，中危信息检出正确率为78.74%，低危信息检出正确率为72.36%，总体平均正确率为78.69%。本研究从42702条信息中抓取770条危机信息，抓取1.80%危机数据，剔除98.20%无效信息，大大减轻了人工复核的工作量，从而提高人工復核的工作效率和复核准确率。

尽管本研究的风险信息报告的平均正确率为78.69%，但是大数据报告生成后，仍然立刻对危机信息进行人工复核，即让心理学专业人员进行文本评估后，再制订危机干预方案，从而保证了危机干预行动没有出现误判或失误。

本研究对心理危机预警的危机评估和危机干预中体现了大数据分析的优势，尤其是知识图谱的技术特点。虽然本系统不能做到100%的危机检出率，但本研究将从这些遗漏信息中再次分析，以改进现有的危机判断规则，提高大数据技术支撑的决策准确率。

结论

本研究采用文本处理技术建立高校心理智能干预平台，对特定群体的大学生社交媒体信息进行实时监控，发现心理危机信息并生成危机报告进行预警，进而为高校心理中心提供危机干预方案和行动的数据支撑。通过一年的数据监测，监测结果充分证明了大数据技术在心理危机预警与危机干预领域中的巨大应用价值和发展空间。大数据技术作为心理危机干预的支撑，拓展了大数据的技术价值，提高了危机检出率，减少了自杀发生率，突出了大数据技术的社会价值。今后的研究将进一步改进危机判断规则与算法，以提高大数据技术的正确检出率。

参考文献：

[1]习近平.决胜全面建成小康社会夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告[N].人民日报，2017-10-28（01）.

[2]高雯，董成文，窦广波，等.心理危机干预的任务模型[J].中国心理卫生杂志， 2017，31（01）：89-93.

[3]高劲松，黄梅，付家炜.基于年度高频关键词的研究热点提取与可视化研究[J].现代情报，2020，40（12）：130-139.

[4]李飞，葛鲁嘉.大数据之于心理健康教育：功能边界与实施取向[J].思想理论教育，2016（07）：87-91.

[5]张丽，周建松，李凌江.精神创伤急性期危机干预方法评价[J].中国心理卫生杂志， ?2016，30（08）：561-567.

[6]陈真真，杨雪梅.中小学生心理援助热线来电者的特征及咨询内容[J].中国心理卫生杂志，2016，30（12）：933-935.

[7]马海群，张涛，李钟隽.新时代文献信息的价值重构：人工智能技术和智慧服务[J/OL].情报理论与实践，2020.

[8]陈婉珍，何雪松.大数据驱动的社会工作：前景与挑战[J].社会科学，2017（07）：74-81.

[9]张倩，郑涌.创伤后成长：5·12地震创伤的新视角[J].心理科学进展，2009，17（03）：623-630.

作者简介：王会丽（1985—），河北雄安人，重庆大学副教授，研究方向为心理健康教育。

本文为2019年度教育部人文社会科学研究项目“基于大数据的高校心理危机‘实时评估—智能风控—危机干预—发展可塑智能机制”2018年重庆市教委人文社会科学研究项目（18SKSZ001）“大数据时代增强青年文化自信的引领力与凝聚力研究”的阶段性成果，2018年重庆市“十三五”教育科学规划重点项目（2018-GX-083）“基于大数据的高校心理健康服务智能化服务体系研究”、重庆大学“心理育人”名师工作室（2020SZK-19）等阶段性成果。