基于深度卷积神经网络的宫颈细胞涂片的病变细胞分类

胡卉 蔡金清
摘 要:本文重点研究宫颈细胞图像分类识别问题,结合宫颈细胞病理学等方面知识,利用基于深度卷积神经网络ResNet50的迁移学习,对实验数据集进行模型训练和特征提取。实验结果表明,通过基于深度神经网络的迁移学习,可以获取较优的病变与正常细胞的分类结果。
关键词:卷积神经网络;迁移学习;宫颈癌
中图分类号:TP391.4 文献标识码:A
1 引言(Introduction)
在互联网发展迅速和计算机技术不断成熟进步的今天,计算机技术中的图像处理技术得到广泛的应用,并且取得了不凡的成就。随着在机器学习方面的进一步研究,其在生物医学工程领域的医学图像中的应用显得越来越重要。
宫颈癌症发病率的逐年增加,引起了人们利用计算机图像处理中的图像分类对宫颈癌症病理学进行研究的热潮。宫颈癌细胞相较于正常细胞有较为突出的特点,不管是形态上还是在色彩纹理上都有明显表现,利用这些特征,分类学习算法可以通过不断迭代修正分类器,最终实现细胞图像的分类[1]。
本文采用基于深度卷积网络ResNet50的迁移学习实现对宫颈癌细胞涂片照片的自动分类,利用训练好的神经网络所提取的图像特征对正常和有病变细胞的涂片自动分类。迁移学习可以实现在小规模数据集合上的模型训练,利用预训练深度神经网络提及的广义图像特征,并结合新的数据集进行特征的进一步抽象和组合,进而产生新的数据集特征,试验结果表明其具有较短的训练时间和较高的分类精度。
2 相关工作(Related work)
关涛等人增强宫颈癌细胞特征,去除杂质,提取细胞核的周长,并使用K-means算法对图像进行分类。Edwin等人提出了一种基于特定纹理的宫颈细胞分类系统,为宫颈细胞分类指定了七个宫颈细胞组织特征,包括细胞核和细胞质的相对大小,局部二值模式直方图,细胞质核的相对位移,直接边缘方向图、Tamura特征、灰度共生矩阵,以及细胞核和细胞质的密度比与动态范围。Thanatip等人提出了一种基于块的模糊C均值图像分割算法,对宫颈核进行分割,然后根据分割宫颈核利用最小平均相关能量(Minimum Average Correlation,MACE)滤波器来确定宫颈细胞的病变情况。卢磊提出了基于联合特征PCANet的宫颈细胞图像分类识别方法,事先用基于块的组的非局部自相似先验学习图像去燥对宫颈细胞图像去噪,将PCANet网络中间层提取的特征和最后输出层提取的特征联合,减少特征的流失,结合SVM分类器分类,最终对宫颈细胞的二类识别及三类识别准确率分别达到了95.71%和85.4%。
3 宫颈细胞病理学基础知识(Basic knowledge of
cervical cytopathology)
宫颈癌是最常见的女性妇科疾病恶性肿瘤之一,发病率居高不下,一直威胁着女性的健康,且80%的病例来自发展中国家。我国宫颈癌的发病率占全球的28%,位居第二。如果在病变初期,得到及时治疗,很大程度上可以治愈。发病年龄日趋年轻化和扩大化。宫颈癌具有较长病变期的特点,一般需要10—15年时间,筛查年龄相应提前5—10年,可更早发现宫颈癌前病变期。
如今的细胞学检测主要采用传统的巴氏涂片或者液基细胞涂片,分析细胞特征,判断细胞是否有病变趋势,一般通过肉眼观察来判断,检测费用昂贵,严重影响了宫颈癌的早期防治。近年来,国产的细胞病理制片技术已接近国际水平,然而阅片技术仍停留在需要病理医生阅片阶段,且细胞涂片数量巨大,细胞分布繁复,整个过程消耗巨大,准确率难以保证[2]。至今为止,美国FDA已经研制出四台具有代表性的宫颈细胞涂片自动化检测设备,但是这些设备检查费用较高,对于一年一次的普查来说是一般人无法承受的[3]。所以迫切需要开发出较为完善的宫颈细胞分类系统。在病理学上宫颈癌主要分为鳞癌、腺癌和鳞腺癌。
3.1 病变细胞分类及特点
病变细胞中LSIL(低风险鳞状细胞病变)细胞特征:核扩大,是正常细胞的三到五倍,染色质粗,核质比高,中央空泡出现。HSIL(高风险鳞状细胞病变)细胞特征:核质比非常高,核膜形状不规则,分布不均且深染(细胞核颜色深),染色质粗,分布不均匀,胞质疏松透明。癌症属性的鳞状细胞癌(SCC)细胞特征:细胞大小形状可变,细胞核大小形状可变,核质比可变,深染,染色质分布不均,可能出现嗜橘色细胞质,背景可出现肿瘤特性。腺癌(ADENOCAICINOMA)细胞特征:可看见核仁,出现乳头状腺体,除出现嗜橘色细胞质外,其他特征同鳞状细胞癌类似。正常宫颈细胞最显著的特征:核质比正常。
3.2 细胞识别的困难点
一张细胞图片上不仅仅有宫颈细胞,还有皮肤组织细胞等其他细胞的存在,且细胞之间相互重叠,显微镜里光线不足也可能造成视线模糊,无法清晰分别细胞类型和细胞特征。
4 深度卷积神经网络(Deep convolution neural
network)
卷积神经网络(Convolutional Neural Network,CNN)提供了一种端到端的深度学习模型,模型中的参数可以通过传统的梯度下降方法进行训练,经过训练的卷积神经网络能够学习到图像中的特征,并且完成对图像特征的提取和分类。而且不再需要复杂的图像预处理,数据量小也可以训练出图像特征。
典型的卷积神经基本网络结构主要由输入层、卷积层、下采样层(池化层)、全连接层和输出层组成[4]。其中卷积层占主要的部分,可以从输入图像中提取特征,包含了若干参数的用于自主学习的卷积核(滤波器),参数是卷積神经网络训练的核心内容。不同的滤波器可以检测出图像的不同特征,需要根据训练测试的对象特征修改参数,达到分类的最好效果。下采样层(Spatial Pooling),用于降低每个特征映射的维度,且保留重要信息,类型有最大值、平均值、和等。完全连接层直接使用激活函数根据训练数据集将输入的图像分为不同的类。
21世纪初,卷积神经网络的广泛研究阶段,由Krizhevsky[5]等提出的AlexNet在大型图像数据库ImageNet的图像分类竞赛中获得冠军,使卷积神经网络成为学术界关注的焦点。在AlexNet之后,新的卷积神经网络模型不断涌现,例如牛津大学的VGG(Visual Geometry Group)、谷歌的GoogLeNet[6]、微软的ResNet都刷新了ImageNet上AlexNet的记录。
5 利用迁移学习实现对宫颈病变细胞的识别
(Identification of cervical lesion cells through
transfer learning)
遷移学习的定义是:“运用已存有的知识对不同但相关领域问题进行求解的一种机器学习方法”,其目标是完成知识在相关领域之间的迁移。对于卷积神经网络而言,迁移学习就是要把在特定数据集上训练得到的“知识”成功运用到新的领域之中。卷积神经网络的迁移学习的一般流程是:(1)在特定应用之前,先利用相关领域大型数据集(如ImageNet)对网络中的随机初始化参数进行训练;(2)利用训练好的卷积神经网络,针对特定应用领域的数据(如PASCAL)进行特征提取;(3)利用提取后的特征,针对特定应用领域的数据训练卷积神经网络或者分类器[7]。迁移学习基本原理如图1所示[8]。
迁移学习使用预训练深度神经网络作为学习新任务的起点,并对网络进行微调通常比从头开始随机初始化权重来训练网络要快得多和简单。因此,可以使用较少数量的训练图像将学习功能快速转移到新任务。
5.1 卷积神经网络的迁移学习
本文使用预训练的resNet50深度神经网络实现迁移学习。深度残差网络(Deep Residual Network,ResNet)的提出是CNN图像史上的一件里程碑事件。ResNet网络参考了VGG19网络,在其基础上进行了修改,网络深度增加到152层,并通过短路机制加入了残差单元解决了深度网络退化问题。
残差F(x)=H(x)-x,所以原始的学习特征H(x)=F(x)+x,x为输入值。当残差为0时,此时堆积层仅仅做了恒等映射,至少网络性能不会下降,实际上残差不会为0,这也会使得堆积层在输入特征基础上学习到新的特征,从而拥有更好的性能。
MATLAB 2017b提供了ResNet50预训练模型的支持。该模型需要安装神经网络工具箱,并需要下载和安装ResNet-50支持包。
为了实现迁移学习,使用全连接层,SoftMax层和分类输出图层替换ResNet-50最后三个层,并转移到新的分类任务。根据新数据指定的新的全连接层的选项。将全连接层设置为与新数据中类的数量相同。替换前后的对比如图2和图3所示。
6 实验与分析(Experiment and analysis)
6.1 数据集介绍
本文采用的数据集来自皇家墨尔本理工大学(RMIT University)医学院的检验医学硕士王宗玥实验中拍摄的宫颈涂片照片。一共20张涂片拍摄出的96张图片,包含了54张正常(NAD)图片和42张病变涂片样本图片。
6.2 实验结果及分析
本文将进行宫颈细胞图像的二分类仿真实验,即对正常和病变宫颈细胞进行分类识别,试验在MATLAB2017b平台进行,利用MATLAB的机器学习工具箱和神经网络工具箱进行模型的训练。本文使用TITAN X GPU训练迁移学习的深度神经网络模型,TITAN X具有3072个核心。
我们对96张图片进行90次的迭代训练。为了防止过拟合,提高模型的泛化能力,在模型训练的过程中,将训练集进一步的划分为训练集和验证集,训练集和验证集上的结果精度,如图4所示。可以看到在验证集上,迁移学习生成的模型的精度可以达到82%。
同时,我们通过可视化的方式显示迁移学习生成的模型的预测结果。图5是原始的病理图片,图6显示了原始病理图片在经过迁移学习模型上的第一个激活层后的结果。一共有70个特征被提取,其每个方块对应一个卷积层的输出通道(也就是一个特征)。白色像素表示图像经过该特征后被激活的部分,也就是特征放大的部分。我们分别提取了39和40个通道(特征),以及通道作用后的结果。原始病理图片如图5所示,第1个激活层后的结果如图6所示。
从图7和图8中可以看到,这个两个学习到的特征分别对应图片中的液体部分和病体部分。特征部分的灰度值较非特征部分低,在图片中可以清晰的分辨出特征的分布。
同时,作为对比方案,从预训练的resnet50深度神经网络中提取学习到的图像特征,并使用这些特征在训练集训练支持向量机(SVM)分类模型。Resnet50最后几层结构如图9所示。
更高层提取的是更加抽象的特征,更低层提取的是更低级别的特征。本文提取全连接层的1000个特征。针对图6的病理图片,其对应的1000个特征显示,如图10所示。基于这1000个特征对SVM模型进行训练,并对训练的模型进行测试验证,研究结果的精度为62%。因此,从结果可以看出,利用迁移学习可以提取更加贴近训练集的特征,并且具有更好的泛化能力。
7 结论(Conclusion)
本文针对时下癌症诊断难的问题,对Resnet50深度神经网络实现迁移学习,提出了基于卷积神经网络和迁移学习的图像分类方法,即可以自动判别图像类别的算法。主要思想是,基于预训练深度神经网络模型产生基础特征,通过在小规模数据集合上的训练生成符合数据集合自身的更加抽象的特征,基于这些抽象特征实现对数据集的分类。主要采用基于深度卷积神经网络利用迁移学习实现对宫颈细胞图片的自动病理识别,选迁移学习,是因为其实现了在小规模数据集合上,并且在较短的时间内训练生成新的深度神经网络。实验结果表明,相对于使用SVM模型生成的深度神经网络对宫颈细胞图像分类,有较高的准确率。其基于预训练深度神经网络模型产生基础特征,通过在小规模数据集合上的训练生成符合数据集合自身的更加抽象的特征,基于这些抽象特征实现对数据集的分类。
此方法不仅降低了细胞判别的主观因素的干扰,同时也帮助提高了工作效率,提供给医者辅助决策,未来能够辅助医学界病理学的科研发展,降低医疗及人力方面的资源消耗。
参考文献(References)
[1] 張琳林,曹军梅.一种基于卷积神经网络的图像分类方法[J].福建电脑,2018,34(02):46-47.
[2] 张璐.医学图像智能分类技术研究与应用[D].电子科技大学,2017.
[3] 范金坪.宫颈细胞图像分割和识别方法研究[D].暨南大学,2010.
[4] 叶斌强,孙鹏飞.宫颈癌诊断及疗效评价的影像学研究进展[J].中国CT和MRI杂志,2014,12(02):109-112.
[5] Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[C].International Conference on Neural Information Processing Systems.Curran Associates Inc,2012:1097-1105.
[6] Szegedy C,Liu W,Jia Y,et al.Going deeper with convolutions[J].arXiv preprint arXiv:1409.4842,2014:1-9.
[7] 李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(09):2508-2515;2565.
[8] James Le.The 10 Deep Learning Methods AI Practitioners Need to Apply[EB/OL].https://www.linkedin.com/pulse/10-deep-learning-methods-ai-practitioners-need-apply-james-le?trk=portfolio_article-card_title,2017-11-17.
作者简介:
胡 卉(1994-),女,硕士生.研究领域:机器学习,图像处理.
蔡金清(1976-),男,博士,副教授.研究领域:机器学习,大数据,云计算.
相关文章!
  • 融合正向建模与反求计算的车用

    崔庆佳 周兵 吴晓建 李宁 曾凡沂<br />
    摘 要:针对减振器调试过程中工程师凭借经验调试耗时耗力等局限性,引入反求的思想,开展了

  • 浅谈高校多媒体教育技术的应用

    聂森摘要:在科学技术蓬勃发展的今天,我国教育领域改革之中也逐渐引用了先进技术,如多媒体技术、网络技术等,对于提高教育教学水平有很

  • 卫星天线过顶盲区时机分析

    晁宁+罗晓英+杨新龙<br />
    摘 要: 分析直角坐标框架结构平台和极坐标框架平台结构星载天线在各自盲区状态区域附近的发散问题。通过建