网站首页  词典首页

请输入您要查询的论文:

 

标题 一种心血管疾病数据分析方法及系统实现
范文

    陈逸杰 唐加山

    

    

    

    摘要:随着人们日常生活水平的提高,全国心血管疾病患病人数已接近21%,心血管疾病对生命的威胁愈加严重,已成为我国居民的主要死亡原因之一。因此,对心血管疾病数据进行统计分析,提前预警显得尤为重要。为了得到更贴合实际的各指标正常区间,在收集指标时新增“用户自我感觉”指标作为用户身体状况自评数据,并结合各指标已有数据划分健康人群,得到新的正常区间,体检人员一旦有相关指标出现异常便计入高发人群数。以冠心病为例作出高发人群数趋势图,并设计体检信息管理系统,可对上传的体检数据及用户身体状况自评数据进行大数据分析得到疾病预警结论,井告知体检人员身体健康状况。

    关键词:心血管疾病;用户身体状况自评;数据分析;健康预警DOI:10.11907/rjdk.191209开放科学(资源服务)标识码(OSID):

    中图分类号.TP319文献标识码:A 文章编号:1672-7800(2019)010-0117-04

    1研究背景及现状

    1.1研究背景

    随着科学技术与社会经济的发展以及人类文明的进步,人们对自身健康情况越来越关注。同时,伴随着人们日常生活水平的提高,心血管疾病对人类的危害也愈加严重。本文研究主要来源于实际需要,同时也是南京邮电大学盐城大数据研究院关于老年人口健康大数据预演课题的一部分。

    1.2研究意义

    本文旨在对心血管疾病大数据进行统计分析,设计并构建一个应用管理系统,对于医学异常数据能够实时给出应急处理指令,以实现健康预警智能化,并对疾病高发人群数趋势进行分析,提出健康建议,从而提高人民健康水平与幸福感。

    当前,心血管疾病被公认为全球致死率最高的疾病之一。国家心血管病中心于2017年发布的《中国心血管病报告2016》显示,中国心血管病患病率正持续上升。心血管疾病现患病人数2.9亿,其中冠心病1100万,肺原性心脏病500万,心力衰竭450万,风湿性心脏病250万,先天性心脏病200万,高血压2.7亿。该报告还指出,心血管疾病是导致我国居民死亡的首要原因,每年约有350万人死于各类心血管疾病。对心血管疾病患者(尤其是心肌梗死患者)而言,时间就是生命,患者就诊时间越早,治疗效果越好。

    然而,虽然中国的基础数据量十分庞大,中国心血管疾病医生的临床诊疗水平也在迅速提高,但就临床科研成果与临床数据应用而言,与世界先进水平还有一定差距。迄今为止,尚没有足够证据表明利用大数据分析技术能够改善心血管诊疗效果。心血管诊疗相关大数据应用主要集中在风险预测模型、精准医学与临床决策支持、诊疗差异性分析及公共卫生等领域。

    1.3研究现状

    在我国目前的就医模式下,患者就诊数据包括患者基本信息、就诊信息、检验及影像检查报告、医学影像图像文件、住院病历等临床数据。以上海市为例,医联数据中心总数据规模已超过1507B。据初步统计,平均每日门诊就诊人次为180927,其中心血管患者占5.06%;平均每日新人院患者为4586,其中心血管患者占1.96%。但目前不管是区域卫生信息平台还是医院平台,都未曾对这些临床大数据进行有效挖掘与分析利用,因此医疗卫生领域的信息化建设迫在眉睫。

    刘利明在Spark平台上运用数据挖掘技术对医疗数据进行预处理,并使用3种不同模型建立风险预警模型,虽然预测效果更好,但耗时较长;张福荣通过调查研究筛选出导致疾病的危险因素,从而制定预警方案;吴丹对健康信息学在急性心血管疾病早期预警方向上的3项重大机遇和挑战进行总结,包括无扰式传感器开发、成像理论方法与多模信息融合技术;孙哗根据脉搏分析检测理论设计了心血管疾病预警系统,结合前端嵌入式系统与后端服务器提出相应解决方案。

    在国外,Luyster提出通过检查失眠与睡眠呼吸暂停两种非传统的心血管风险因素,研究多种心血管危险因素组合对人群的影响,发现存在多种非传统心血管风险因素的人群发病率明显高于单独失眠组与无失眠及睡眠呼吸暂停症状的人群;Berry建立风险评分模型,并对年轻男性冠心病发病及死亡率作出预测。

    依据国家大数据战略总体发展目标,国务院关于《促进大数据发展行动纲要》精神及国家生物数据汇集管理与共享利用的重大需求,组织开展生物大数据开发与应用关键技术研究工作,建设国家生物大数据平台。心血管疾病大数据处理分析与应用研究委托首都医科大学附属北京安贞医院等多家单位完成,计划建立国家心血管疾病大数据平台,并开发心血管疾病预警、预后相关模型及临床决策支持系统,为提高心血管疾病诊治水平提供大数据支撑。

    本文基于对体检数据的分析,增加新的指标,使用更贴合实际的指标区间对多种导致疾病的危险因素进行判断,以确定该疾病高发人群,而不是直接判断患病人群,从而对高发人群进行预警。

    2数据分析

    2.1数据指标

    本文一共收集了214種不同指标,分别隶属于体格检查、器械检查及实验室检查3大类。其中,体格检查有8类,器械检查有9类,实验室检查有16类,共计33个小类。每个小类下皆由多个指标组成,并按照小类进行编号,如表1所示。

    2.2正常区间与异常数据

    在设计本功能时,预先在体检时增加一个“用户自我感觉”指标作为用户自身状况自评数据。用户对体检当天身体状况进行自评,1-5分别为不舒适到舒适,然后将得分为l和2的判定为不健康人群,得分为3、4、5的判定为健康人群,如表2所示。

    以健康人群数据为基础,对各个指标建立95%置信区间,得到的区间即为对应指标的正常区间。指标值在区间内即为正常,否则记为异常,并作出对应柱状图。

    2.3心血管疾病高发人群趋势分析

    以冠心病为例,冠心病危险因素包括可改变的危险因素与不可改变的危险因素,了解并对危险因素进行干预有助于冠心病预防。可改变的危险因素有:高血压、血脂异常(总胆固醇过高或低密度脂蛋白胆固醇过高、甘油三酯过高、高密度脂蛋白胆固醇过低)、超重/肥胖、高血糖/糖尿病,以及不良生活方式包括吸烟、不合理膳食(高脂肪、高胆固醇、高热量等)、缺少体力活动、过量饮酒等及社会心理因素;不可改变的危险因素有:性别、年龄、家族史。此外,该疾病也可能与感染有关,如巨细胞病毒、肺炎衣原体、幽门螺杆菌等。冠心病发作通常与季节变化、情绪波动、体力活动过量、饱食、大量吸烟及饮酒等有一定关联。

    本文收集的与冠心病密切相关的指标包括:血压(收缩压、舒张压)、体重指数、总胆固醇、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇、甘油三酯及空腹血糖。对体检结果中与冠心病关系紧密的8项指标中的异常数据进行标记,只要有一项指标出现异常即记为冠心病高发人群,作出高发人群趋势图如图2所示。

    在图2中,横轴为月份,纵轴为指标异常人群数,3条线分别代表3年的数据。从图中可以发现,3年数据总体在一条线上,仅略有起伏,这是由于3年数据都是基于同一分布仿真生成的。若输入实际数据,则会出现不同情况,可针对实际数据的趋势图变化进行分析。

    就冠心病而言,由于冠心病对人们健康的威胁居高不下,因此从高发人群趋势图中发现特征,对体检用户进行健康预警则显得十分必要,以提醒人们从上述提到的可改变的危险因素着手,改善生活质量,拒绝不良生活方式。

    3系统实现

    3.1体检数据展示

    在系统设计中,加入了大量可视化展示,如图3所示。以脉搏数据为例,选取其中ID为1-102的数据进行放大操作,同时以横虚线标注出数据均值,以气球形式标注出该数据中的最大及最小值。

    3.2正常区间及异常数据

    经过上文的算法处理,体检数据正常区间柱状图如图4所示,舒张压的最小值与最大值分别为59和88.4,通过柱状图可以清晰地观察到正常区间的上下限。

    异常数据统计柱状图如图5所示,其中右侧代表总数据量,左侧代表异常值数量。

    3.3高发人群趋势分析及健康预警

    高发人群趋势分析已在2.3节中展示,在发现体检人员体检结果异常后,需要对该人员进行健康预警,并为其发送邮件,如图6所示。

    首先点击页面上的一键发送警告邮件,在这里由于是对该功能进行测试,因此发送一封给测试邮箱。若发送成功,页面会弹出对话框提示。最后测试邮箱成功收到预警邮件,告知体检用户体检结果出现异常,请及时到医院作进一步检查。

    4结语

    隨着人们日常生活水平的提高,心血管疾病对生命的威胁愈加严重。为了更好地关注人们身体健康状况,本文通过预先增加“用户自我感觉”指标划分健康人群并建立置信区间,获得更加贴合实际情况的指标正常区间,一旦出现异常即计人高发人群数,并作出每一年不同月份下的冠心病高发人群数趋势图,以便提出针对性建议。同时设计一个体检信息管理系统,通过邮件方式对体检结果出现异常的人员进行预警,以通知其提早作进一步检查,避免病情加重。本文采用的思想在其它疾病预警上也同样适用,并可结合除体检数据外的其它传统或非传统影响因素共同分析是否需要对人们进行预警。

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/2/11 0:45:58