基于特征融合CNN模型的ECG信号识别方法研究

    周志波

    

    

    

    摘 要:针对ECG信号分类问题,提出一种融合卷积神经网络和信号时频统计特征的方法。该方法首先利用卷积神经网络提取ECG信号分布特征,再利用离散小波变换将ECG信号分解为高频系数与低频系数,计算所有高频系数及最后一个低频系数的统计特征值,最后将计算所得的时频统计特征融入卷积神经网络全连接层,并利用Softmax分类器进行分类。结果表明,该方法对三类心血管疾病的ECG信号分类识别率达93.4%,证明该方法可用于解决ECG信号分类问题。

    关键词:心电信号;卷积神经网络;时频统计特征;特征融合

    DOI:10. 11907/rjdk. 201231????????????????????????????????????????????????????????????????? 开放科学(资源服务)标识码(OSID):

    中图分类号:TP301 ? 文献标识码:A ??????????????? 文章编号:1672-7800(2020)011-0046-04

    Research on ECG Signal Recognition Method Based on Feature Fusion CNN Model

    ZHOU Zhi-bo

    (College of Computer Science and Engineering, Shandong University of Science and Technology,Qingdao 266590,China)

    Abstract: In order to solve the problem of ECG signal classification, a method of fusion of convolutional neural network and time-frequency statistical characteristics of signals is proposed. Firstly, a convolutional neural network is used to extract the distribution characteristics of ECG signals, and then discrete wavelet transform is used to decompose the ECG signals into high frequency coefficients and low frequency coefficients, and the statistical characteristic values are calculated of all high frequency coefficients and the last low frequency coefficient are calculated. Finally,the calculated time-frequency statistical features are fused into the fully connected layer of the convolutional neural network and classified by using a Softmax classifier. The experimental results show that the method has an ECG signal classification recognition rate of 93.4% for three types of cardiovascular diseases, which proves that the method can be used to solve the ECG signal classification problem.

    Key Words: ECG Signal; convolutional neural network; time-frequency statistical characteristics; feature fusion

    0 引言

    各種音频信号和生命体征信号等时变信号(Time Varying Signal,TVS)是一类重要的、具有非线性和非平稳特性的常见信号,涵盖了信息提取的主要难点和热点问题[1]。由于时变信号的复杂性和不确定性,时变信号分类研究面临诸多挑战,如噪声、时空对齐、量纲统一等问题。

    心电信号(Electrocardiogram,ECG)是一种典型时变信号,该信号反映了心肌细胞在电激动时产生的电传变换[2],它是诊断心血管疾病的有效手段之一。ECG信号分类问题是医学诊断与人工智能相结合的一个热点问题,许多研究人员做了大量相关工作,如心电图心律失常检测[3]、心肌梗死检测[4]等,这些以深度学习模型为基础的研究方法取得了丰硕成果。Brito等[5]利用一维卷积残差网络在MIT-BIH数据库上进行四分类实验,取得良好分类效果;Hasan等[6]利用经验模式分解对ECG信号分解去噪,并使用一维卷积网络对ECG信号特征进行提取和分类;李四海等[7]结合SVM分类器,对提取的心电信号QRS波特征值进行分类,并在MIT-BIH数据集上取得92.6%的平均分类准确率;Das等[8]使用S变换和小波变换提取ECG心拍波形特征,再利用多层感知机神经网络[9]对提取的信号特征进行分类;颜菲等[10]提出一种叠加去噪自动编码器与深度神经网络相结合的方法,并在3种不同的心电信号数据集上均取得很好效果;Alqudah等[11]提取ECG信号的高斯混合系数特征值和小波分解特征值,并将这两种特征用概率神经网络和随机森林两种分类器进行心律失常分类;Osowski等[12]将模糊混合神经网络模型用于心拍分类,其分类准确率达96%。

    同时,上述方法也存在一些不足:一是仅使用深度学习模型,没有充分利用ECG信号特征的多样性;二是对心拍进行分类研究,需要完成从ECG信号中分割出心拍的复杂工作。针对以上问题,本文提出一种特征融合卷积神经网络模型,仿真实验中该模型处理的数据对象是12导联多心拍的ECG信号,因此不需要分割出心拍,从而省去了传统方法获取心拍的繁琐工作。为了克服单一卷积网络对信号特征提取的局限性,本文方法在传统卷积神经网络中融合了ECG信号时频统计特征,实验结果表明,这种方法有效提高了传统卷积神经网络对ECG信号的分类能力。

    1 卷积神经网络与时频统计特征

    1.1 卷积神经网路

    卷积神经网络(Convolutional Neural Network,CNN)由Lecun等[13]提出,是深度学习领域经典模型之一。CNN基本结构包括卷积层、池化层及全连接层,其中卷积层用于数据特征提取,是卷积网络的核心层;池化层用于数据降维并保证特征平移不变性;全连接层可以整合卷积层或者池化层中具有类别区分性的局部信息[14]。卷积神经网络特征计算核心公式如式(1)所示。

    yl+1j=downσi∈Mjxli?wl+1ij+bl+1j ?????? (1)

    其中,yl+1j为网络l+1层第j个特征面,xli为网络l层第i个特征面,wl+1ij为网络l+1层第j个特征面与l层第i个特征面的连接权值,bl+1j为第l+1层第j个偏置量,σ为激活函数,down?为下采样函数,?为卷积运算。

    1.2 时频统计特征

    时变信号的时频特性随时间或空间变化而变化,处理这类信号,利用小波理论作为处理工具最为合适[15],小波理论中的离散小波变换(Discrete Wavelet Transform,DWT)[16]可用于获取时变信号的频率成分,即将原始信号分解为低频分量和高频分量。ECG信号是一种典型时变信号,因此DWT可用于ECG信号的时频统计特征提取。采用DWT分解信号的理论公式如式(2)所示。

    wxj,k=Rxtψj,ktdt ? (2)

    其中,xt是原始信号,Wxj,k是子带频率,ψj,kt=12jψt2j-k是小波基函数,j 是尺度系数,k是平移系数,R是实数集。

    Mallat算法是实现DWT的有效方法之一,其分解信号公式[17]表示为如式(3)、式(4)所示。

    xjk=nh0n-2kxj-1k ??? (3)

    djk=nh1n-2kxj-1n ?? (4)

    其中,xkj表示近似系数,即低频分量;dkj表示细节系数,即高频分量;h0k表示低通滤波器;h1k表示高通滤波器。

    本文采用DWT获取ECG信号时频统计特征,其步骤可总结如下:①使用DWT分解ECG信号为近似系数A1和细节系数D1;②在细节系数D1保持不变的情况下,分解近似系数A1为A2和D2,重复上述过程,最终获得ECG信号小波分解树D1,D2,D3,…,Dn,An;③应用数学统计方法,计算小波分解树中D1,D2,D3,…,Dn,An每个频率分量的统计特征值,包括均值、方差、峭度、峰值因子。

    2 特征融合卷积神经网络模型

    卷积神经网络能有效提取ECG信号的时域波形特征,但无法提取ECG信号的频域特征,因此在ECG信号分类问题上,既能利用卷积网络特征提取能力,又能结合信号频域特征。本文提出一种融合信号时频统计特征的卷积神经网络模型,该模型首先通过DWT分解ECG信号,获取其时频统计特征值,并利用卷积网络获取其波形特征,然后将两种方法获取的信号特征线性融合,最后采用Softmax分类器进行分类。本文特征融合卷积神经网络模型结构如图1所示。

    特征融合的卷积神经网络特征提取公式如式(5)—式(7)所示。

    a2=avgReluw2?x1+b2 ?? (5)

    z=avg?avgReluw3?a2+b3 ????? (6)

    y=z+ws ? (7)

    其中,x1为网络输入数据,w2为网络第2层卷积核,b2为网络第2层偏置量,Relu为激活函数,avg为平均池化函数,a2为网络第2层特征面,z为网络全连接层特征值,ws为信号时频统计特征值,y为融合特征值。

    特征融合需要考虑统一量纲问题,量纲问题指不同来源的特征值有着不同的量纲,使得它们的大小不在同一区间。为解决量纲统一问题,本文实验采用Z-score标准化。

    3 ECG信号分类实验

    3.1 数据集

    ECG信号分类实验数据集来源于中国心血管疾病数据库(Chinese Cardiovascular Disease Database,CCDD)[18],CCDD数据库包含大约18万条12导联ECG信号,覆盖了绝大部分的心血管类疾病。本文选取CCDD数据库中的3类ECG信号:正常心电图、心房顫动、房性早搏。数据预处理包括抽稀、去噪,由于原始信号维度过高,特征不易提取,因此需要将原始信号抽稀降维至2 250个点的长度,同时原始ECG信号包含高频噪声,因此在实验前采用巴特沃斯低通滤波器[19]对信号进行滤波处理。3种ECG信号的数据量以及训练与测试数据说明如表1所示。

    3.2 网络结构与参数设置

    本实验特征融合卷积神经网络设置为五层卷积池化块和两个全连接层,卷积核大小为1×5,卷积步长为1×1,激活函数为Relu,池化函数为平均池化函数,池化大小和步长均为1×4。离散小波变换使用‘db1小波将信号分解为3层小波分解树,对于小波分解树中所有高频系数和第三层低频系数,计算它们的4种时频统计特征,包括均值、方差、峭度、峰值因子,每条ECG信号样本可获取192个时频统计特征。ECG信号时频特征与卷积神经网络第一个全连接层的特征值相融合,模型采用Softmax分类器。

    在训练阶段,网络训练数据的Batch大小设置为300,迭代次数设置为50次,网络的第一个全连接层Dropout率设置为0.5,并使用学习率为1×10-2的Adam优化器,在Intel Corei7-3537U CPU上运行约为20个小时。

    3.3 实验结果与分析

    为验证融合时频统计特征的卷积神经网络(TFCNN)能够提高一般卷积神经网络(CNN)对ECG信号的分类能力,本文先采用CNN模型对CCDD数据集进行分类,再利用TFCNN模型加以分类,通过两个实验的分类结果验证TFCNN的有效性。模型分类能力用混淆矩阵和测试指标(召回率、精确度、F1分数)体现,其中混淆矩阵斜对角线数值为对应标签疾病的分类准确率,其它数值为对应标签疾病的错分率;测试指标的召回率(Recall)代表实际为正的样本中预测为正样本的概率,精确度(Precision)代表被预测为正的样本中实际为正样本的概率,F1分数(F1-score)是精确率和召回率的调和平均数,F1分数越高,说明分类模型越稳健。

    CNN模型混淆矩阵如表2所示,该模型对3种疾病的分类准确率分别为99%、92.4%和78.6%,标签0和标签1的疾病样本主要错分为标签2的疾病类型,标签2的疾病样本主要错分为标签0的疾病类型。

    CNN模型对3类疾病样本的平均召回率、精确度及F1分数分别为0.9、0.91和0.9,其中房性早搏疾病类型的召回率和F1分数指标测试结果较低,正常心电图样本的精确度指标测试结果较低,CNN模型各项指标测试结果如表3所示。

    TFCNN模型对3种疾病的分类准确率分别为99%、94.1%及86%,均高于CNN模型测试结果,并且在TFCNN模型混淆矩阵中,标签0和标签1的样本错分为标签2的错分率为1%和5.82%,标签2的样本错分为标签0的错分率为12%,其错分率均低于CNN模型。TFCNN模型混淆矩阵如表4所示。

    TFCNN模型的召回率、精确度及F1分数测试平均结果为0.93、0.93和0.93,均高于CNN模型3项指标测试平均结果。其中,房性早搏类型样本召回率和F1分数为0.86和0.88,相比于CNN模型有明显提高,正常心电图样本精确度也由0.85提高到0.91。TFCNN模型各项指标如表5所示。

    TFCNN模型与CNN模型的混淆矩阵和分类指标对比表明,TFCNN模型的分类准确率高于CNN模型,同时TFCNN模型也能保持更好的稳定性。为了进一步表明TFCNN模型的有效性,除上述两组实验,本文与赵勇等[20]的方法做了对比实验,文献[20]的方法是将提取的多种ECG信号特征用SVM加以分类。3组实验对比结果表明,TFCNN模型在识别率与稳定性上都有明显优势,3组实验结果如表6所示。

    4 结语

    针对ECG信号分类问题,本文提出了一种融合ECG信号时频统计特征的卷积神经网络模型。该模型优点在于既能提取ECG信号样本分布特征,又融合了ECG信号样本的时频统计特征。针对3类ECG信号样本的实验表明,该方法能够提高一般卷积神经网络对ECG信号的分类能力,但该方法对于样本数量少的ECG信号类型分类效果不佳。可采用数据增强或选择更具代表性的时频统计特征进行改进,这是下一步研究的重点。

    参考文献:

    [1] 高畅. 时变信号处理关键技术研究[D]. 黑龙江:哈尔滨工业大学,2016.

    [2] 赵静,韩海成. ECG信号自适应贝叶斯小波去噪算法研究[J]. 现代电子技术,2019,42(5):62-65.

    [3] SASHIKUMAR S P,SHAH A J,LI Q,et al. A deep learning approach to monitoring and detecting atrial fibrillation using wearable technology[C]. 2017 IEEE EMBS International Conference on Biomedical & Health Informatics(BHI),2017:141-144.

    [4] ZHOU L,YAN Y,QIN X B,et al. Deep learning-based classification of massive electrocardiography data[C]. 2016 IEEE Advanced Information Management,Communicates,Electronic And Automation Control Conference,2016:780-785.

    [5] BRITO C,MACHADO A,SOUSA A. Electrocardiogram beat-classification based on a ResNet network[J]. Studies In Health Technology And Informatics,2019,264:55-59.

    [6] HASAN N I,BHATTACHARJEE A. Deep learning approach to cardiovascular disease classification employing modified ECG signal from empirical mode decomposition[J]. Biomedical Signal Processing and Control,2019,52:128-140.

    [7] 李四海,滿自斌,张红. 基于小波变换和SVM的心电早搏信号识别[J]. 计算机应用与软件,2014,31(8):182-185.