网站首页  词典首页

请输入您要查询的论文:

 

标题 多层感知器模型在中医人格、体质预测糖尿病性冠心病患病风险中的应用研究
范文 吕航+杜渐+刘媛+王昊
摘要:目的 探讨多层感知器(MLP)模型在中医人格、体质预测糖尿病性冠心病患病风险中的预测效能,为该病客观化预测提供新方法。方法 采用单因素Logistic回归进行变量筛选,筛选有统计学意义的中医人格、体质类型指标,作为MLP及多因素Logistic回归的分析变量,以构建中医人格、体质对糖尿病性冠心病患病风险的预测模型。采用受试者工作特征曲线(ROC曲线)比较2种模型的预测效能。结果 MLP预测模型的灵敏度OR95%CI=0.915(0.862,0.968)、特异度OR95%CI=0.846(0.793,0.912)、AUC OR95%CI=0.913(0.806,0.987),均优于Logistic回归预测模型[灵敏度OR95%CI=0.834(0.695,0.953)、特异度OR95%CI=0.762(0.623,0.901)、AUC OR95%CI=0.869(0.730,0.941)]。结论 在中医人格、体质对糖尿病性冠心病患病风险的客观化预测中,MLP模型较Logistic回归模型具有更好的预测效能。
关键词:糖尿病性冠心病;中医人格;中医体质;多层感知器模型;人工神经网络;预测模型
DOI:10.3969/j.issn.1005-5304.2017.12.022
中图分类号:R2-05;R259.871 文献标识码:A 文章编号:1005-5304(2017)12-0088-04
Study on Application of Multilayer Perceptron Model in Prediction of the Risk of Diabetes Mellitus Complicated with Coronary Heart Disease by TCM Personality and Constitutions LV Hang1, DU Jian2, LIU Yuan3, WANG Hao2 (1. Nanjing University of Chinese Medicine, Nanjing 210023, China; 2. China Academy of Chinese Medical Sciences, Beijing 100700, China; 3. Jiangsu Provice Hospital on Integration of Chinese and Western Medicine, Nanjing 210028, China)
Abstract: Objective To explore the prediction efficiency of multilayer perception (MLP) model in prediction of diabetes mellitus (DM) complicated with coronary heart disease (CHD) by TCM personality and constitutions; To provide a new method for objective prediction. Methods This research utilized single factor logistic regression to filter out variables, which were significant factors of TCM personality and constitutions as analytic variables for MLP and multivariate logistic regression to establish TCM prediction model of personality and constitutions for DM complicated with CHD. The prediction efficiency of the above models were tested by receiver operating characteristic curve (ROC curve). Results The sensitivity, specificity and AUC of MLP were 0.915 (0.862, 0.968), 0.846 (0.793, 0.912) and 0.913 (0.806, 0.987) respectively, which was better than the logistic regression, while these indexes of logistic regression were 0.834 (0.695, 0.953), 0.762 (0.623, 0.901), and 0.869 (0.730, 0.941) respectively. Conclusion The MLP model is better than logistic regression model in prediction of DM complicated with CHD by TCM personality and constitutions.
Key words: diabetes mellitus complicated with coronary heart disease; TCM personality; TCM constitutions; multilayer perception model; artificial neural network; prediction model
基金項目:国家自然科学基金青年基金(81403501);北京市自然科学基金面上项目(7172249);北京市自然科学基金预探索项目(7163236);北京中医药科技发展资金项目(JJ2015-50);中国中医科学院中医药“一带一路”合作专项(ZZ-10-018-04)
通讯作者:王昊,E-mail:wanghao.gomes@163.com
《灵枢·通天》及《灵枢·阴阳二十五人》以阴阳五行学说为基础,将中医人格的内涵界定为包括个体内外倾向、情绪体验急缓、认知速度快慢、意志强弱等心理特征及行动急缓、动作隐显、表现形式等行为表现。中医人格、体质为个体心身特征的具体表现,其与疾病的发生、发展及转归密切相关[1],故可通过辨识人格、体质类型预测疾病的患病风险。但两者间常表现为复杂的非线性映射关系,且多具有错杂性。因此,要实现中医人格、体质对疾病的预测,应用的建模方法应能实现对多变量间错杂相互作用的非线性分析。糖尿病合并冠心病是具有高危害性的心身疾病,情志及体质等因素均为其病因[2],因而探讨中医人格、体质对该病的预测作用具有重要意义。
多层感知器(MLP)属多层前馈式人工神经网络,具有高度的非线性全局作用、良好的容错性及强大的网络自身学习能力,已被证实在糖尿病等慢病病因预测中相较传统线性模型具有方法学优势[3-4],但MLP模型是否同样适用于中医人格、体质对慢病风险的预测分析却鲜有报道。本研究探讨MLP模型在中医人格、体质预测糖尿病性冠心病风险评估中的预测效能,并与Logistic回归模型的预测结果比较,为中医人格、体质对慢病的客观化预测提供新方法。
1 资料与方法
1.1 数据来源
选取2016年2月-2017年2月江苏省中西医结合医院内分泌代谢病院区收治的2型糖尿病患者135例。其中男61例,女74例,平均年龄(54.7±12.1)岁,平均病程(7.3±5.4)年,合并冠心病109例,单纯2型糖尿病26例。
1.2 纳入与排除标准
纳入标准:2型糖尿病诊断标准参照《糖尿病中医防治指南》[5];冠心病诊断标准参照《实用内科学》[2];五态人格测验中掩饰(L)量表评分≥5;签署知情同意书。排除标准:临床资料不全;患有严重精神及神经疾病或认知功能障碍患者;合并其他并发症患者;糖尿病急性并发症者;其他非糖尿病相关性心脏病患者;伴发其他疾病者。
1.3 数据采集
临床资料通过回顾性电子病历获取,全部患者均已进行详细病史采集、常规血生化检查、心脏超声检查、冠状动脉造影(CAG)等。CAG采用Judkins法,经2位心血管介入专业医师共同诊断。
1.4 数据规范
中医人格、体质类型辨识按薛崇成、杨秋莉编制的自陈量表进行。其中“五态人格测验”将人格分为太阳、少阳、阴阳和平、少阴、太阴[6];“五五体质检测”将体质分为平人质、阳热质、阴寒质、阳虚质、阴虚质、偏湿质、多痰质、偏风质、偏燥质、气虚质、血虚质、气滞质和血瘀质13种类别[1]。
1.5 数据分析
1.5.1 单因素Logistic回归模型筛选变量 将五态人格变量及五五体质变量按江苏地区常模进行转換和赋值,见表1。通过单因素Logistic回归,筛选出有统计学意义的人格、体质类型指标作为MLP及多因素Logistic回归的分析变量。
1.5.2 多层感知器神经网络模型 ①数据预处理。采用随机数字生成器设置随机数种子,并对数据进行归一化处理,使处理后的输入、输出变量均为在(-1,1)区间的实数。将单因素Logistic回归筛选出的分析变量作为输入层向量,实现对冗余数据的清洗。②训练集及检验集的设置。使用分区变量将135例样本分配至训练集(106例)及检验集(29例),前者用于建立预测模型,后者用于模型的检验及评估。
采用SPSS19.0实现MLP模型的网络构建及检验。建立包含输入层、隐藏层及输出层3层网络结构的MLP模型。其中隐藏层及输出层的激活函数分别为双曲正切及Softmax。
对建立的MLP模型的验证采用五折交叉验证法,即对检验集样本进行交叉验证,并选取均方误差最小的模型为最优预测模型。
1.5.3 多因素Logistic回归模型 以单因素Logistic回归筛选出的对冠心病可能具有易感性的中医人格、体质变量作为输入自变量,采用向前Wald法进行逐步回归分析,建立糖尿病性冠心病患病风险的多因素非条件Logistic回归预测模型。
1.5.4 模型比较 通过检验集样本进行预测效果评估并绘制ROC曲线,比较MLP模型及Logistic回归模型的预测效能。
2 结果
2.1 单因素Logistic回归分析
采用向前Wald法,从18项中医人格、体质因素中筛选出10项可能对糖尿病性冠心病具有易患性的因素,差异有统计学意义,见表2。
2.2 多层感知器预测模型
将单因素Logistic回归筛选出的少阴、阴寒质、阳虚质、偏湿质、多痰质、偏燥质、气虚质、血虚质、气滞质、血瘀质10个因素作为输入向量,以是否合并冠心病为输出层向量建立的MLP模型中,输入层包含10个输入神经元、隐藏层数为1,包含6个神经元、输出层包含1个神经元;模型采用由随机初始点出发的调整的共轭梯度算法进行训练,参数的初始值取[-0.5,0.5]区间均匀分布的随机数,培训错误的最小相对变化为0.000 1,培训错误率的最小相对变化为0.001;错误函数为交叉熵错误,中止使用的规则为已超过的最大时程数(100)。4个最重要的可用于预测糖尿病性冠心病患病风险的影响因素依次为阴寒质、偏燥质、血瘀质及少阴人格,见图1。
2.3 多因素Logistic 回归预测模型
将单因素Logistic回归筛选出的10个因素为自变量,以α=0.05为入选变量标准,α=0.1为剔除变量标准,采用向前Wald法进行逐步回归分析,最终筛选出4个影响因素建构了多因素非条件Logistic回归模型,见表3。
2.4 模型预测效能比较
将检验集样本分别代入MLP模型及多因素Logistic回归模型,绘制ROC曲线,比较2种模型的预测效能。MLP预测模型的灵敏度、特异度及AUC均优于Logistic回归预测模型。见表4、图2。
3 讨论
本研究表明,MLP网络模型在中医人格、体质对糖尿病性冠心病患病风险预测中有较好的预测效能,根据检验样本,建立模型预测的灵敏度、特异度、AUC均优于Logistic回归模型的相应指标。MLP模型适用于对多变量间错杂相互作用的非线性分析,并对数据分布形态没有严苛要求,较Logistic回归模型具有方法学优势,由此在疾病预测中表现出更好的预测效能,这与近年研究结论一致[7-8]。
MLP模型揭示出对糖尿病性冠心病具有易患性的4种最重要的中医人格、体质类型依次为阴寒质、偏燥质、血瘀质及少阴人格,与多因素Logistic回归分析结果相一致,并符合中医学对该病病因及病机的认识。中医学认为该病病因多与寒邪内侵、情志失节等因素有关,其病机可概括为“阳微阴弦”,即胸阳不振、寒凝血瘀、痹阻心脉;燥热偏盛体现了消渴症对病患体质的影响;少阴者多情志不畅,其典型人格特征为心有深思不外露、多疑郁怒。故少阴者易因肝气郁结、伤脾生痰、痹阻心脉而提升合并冠心病的风险。此外,MLP模型揭示出10种易患人格、体质类型,也体现了该病以气血阴阳亏虚为本,以气滞、痰浊、寒凝、血瘀为标的特点[5]。对比2种模型揭示出的易患人格、体质因素,可发现MLP模型提供的信息更丰富。
传统线性模型难于实现对多变量间复杂相互作用的非线性映射,因此相关研究偏于探讨中医人格、体质与疾病的相关性[9-10],而较少进行预测分析。MLP模型因具有较强的解决多变量间共线性效应及交互作用的能力,可以为中医人格、体质对疾病的客观化预测提供新的方法。目前,已有研究偏于探讨MLP模型在慢病病因学预测中的应用[11],但尚未涉及中医人格、体质对疾病的预测分析,本研究有助于拓展MLP模型的应用范围。
本研究所采用的方法存在一定局限性,如输入变量过多会导致网络训练时间延长,甚至出现“过拟合”现象,因此需要采用Logistic回归等其他模型对变量进行筛选;此外,模型的预测效能随网络参数、激活函数、初始值及隐层神经元节点数的不同设置而异,但上述设置的主观经验性较强,而缺少相应的理论依据。因此,为获得稳定的预测效能,应综合运用多种数据挖掘技术,并对MLP神经网络模型的参数设置、隐层神经元节点数的选择等问题开展后续研究。
参考文献:
[1] 王昊,王克勤,薛崇成,等.中医人格体质论的内涵探析[J].中医杂志, 2013,54(7):551-554.
[2] 陈灏珠,林果为.实用内科学[M].13版.北京:人民卫生出版社,2010:1043-1044.
[3] 曹文君,徐勇勇,谭志军,等.基于人工神经网络模型的多个慢性病主要危险因素筛查研究[J].中国全科医学,2015,18(25):3050-3053, 3058.
[4] 马梦羽,沈璐,文天才,等.数据挖掘技术在中医诊疗数据分析中的应用[J].中国中医药信息杂志,2016,23(7):132-136.
[5] 中华中医药学会.糖尿病中医防治指南[M].北京:中国中医药出版社, 2007:7,47.
[6] 薛崇成,杨秋莉.五态人格测验量表与艾森克人格问卷的对比探讨[J].中华中西医临床研究,2003,1(7):3-11.
[7] 郭奕瑞,李玉倩,王高帅,等.人工神经网络模型在2型糖尿病患病风险预测中的应用[J].郑州大学学报:医学版,2014,49(2):180-183.
[8] VOSS R, CULLEN P, SCHULTE H, et al. Prediction of risk of coronary events in middle-aged men in the Prospective Cardiovascular Münster Study (PROCAM) using neural networks [J]. Int J Epidemiol, 2002,31(6):1253-1262.
[9] 田錦鹰,魏东,马祖,等.糖尿病发病与中医体质的相关性研究[J].中国中医急症,2013,22(10):1693-1694.
[10] 郜红.从体质因素探讨糖尿病的中医防治[J].江苏中医药,2009, 41(8):63-64.
[11] 魏戎,谢雁鸣,田峰,等.病证结合构建慢病风险预测模型的思路与方法[J].中国中医基础医学杂志,2017,23(2):180-183.
(收稿日期:2017-06-25)
(修回日期:2017-07-24;编辑:向宇雁)
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/22 6:33:03