标题 | 深度卷积神经网络在计算机视觉领域的应用 |
范文 | 杨风光 深度卷积神经网络属于类脑计算领域的一类比较重要的研究,已经在一些领域取得了突出的研究成果且被广泛运用。其中在自然语言处理、信息搜索、声音识别、计算机视觉以及语义理解等方面。因为这些成就导致在工业和学术领域人们开始对神经网络进行研究,同时促进了人工智能的开发,只需在卷积神经网络传入数据,就可以根据数据表现出相应的症状。 1引言 很早之前,人类就幻想可以制造出机器人,拥有人类类似的大脑。为实现这一愿望,研究脑神经与心理的专家对人脑的构造进行了大量的研究,通过各种数据得到大量的相关结论,并运用到人工智能的开发领域中去。在这样的情况下,一些专家提出了关于人工神经网络的研究,其借鉴计算机模型来模拟人类大脑的神经结构,并将其进行总结归纳,构建神经网络系统,然后经过大量的研究发展,成为了类脑计算领域的重要研究成果。 在这个方面,专业人员提出大量模型,其中比较著名的有反传网络、自组织映射网络等,其在各种方式的识别中取得了一些成绩,并进行广泛的应用。 2卷积神经网络及其相关技术 2.1增加网络层数 卷积神经网络是一种多层神经网络,其形成是由于特征提取的卷积层与特征处理的采样层叠加形成的,在多年的研究中,使用到了很多研究技术,其中增加网络层数是一个比较重要的技术。其作用范围是在标签数据不变的基础上,提高深度神经网络的识别准确度。但是其在使用过程中存在一定的缺陷,首先对于比较大的网络结构。其参数的需求量比较大,过多的参数会使网络对训练数据集的过拟合。另一方面是对于计算资源的需求量比较大。这两方面缺陷的存在使技术的使用受到阻碍。 2.2增加训练数据集规模 过拟合出现的原因是训练的神经网络比较大,且没有足够的训练数据或者由于训练的模型比较复雜,数据干扰大,对其准确度的重视度降低,一旦出现过拟合的现象,会随着训练的进行,其模型变得更加复杂,虽然会使训练上的出错率降低,但是在验证集上的错误率升高。因此,为避免这一现象的出现,我们需要做的就是增加训练样本的数量。 2.3正则化 正规化是用来避免随着训练神经网络的增大而出现的拟合问题的办法。经过大量数据的分析可以看出,过拟合一般是出现在比较小的空间中,因为数据形成的函数值改变比较大,导致函数的参数值比较大,会使一些区间比较小的函数绝对值比较大。而正规化可以利用其阻止函数的浮动范围太大,来降低模型的复杂程度,进而降低过拟合的出现。 3卷积神经网络的应用 3.1目标检测 目标检测的作用是判断检测目标的类别,其监测的对象是定位的图像中特定物体所出现的区域,这一应用是计算机视觉领域的一项基本内容。其检测的目的更加注重图像的局部区域与特定物体的类别集合,是一个比图像识别更加复杂的识别问题。比较旧的目标检测算法主要的使用原理是利用设计人的先验知识,然后获取样本中的手工设计特点,使用比较少的参数,效率会提升。 3.2图像分类 图像分类是比较重要的应用,作用是利用计算机依据图片的内容进行分类,并进行语义类别的标记,对象是特定的一张照片。 3.3图像语义分割 在近几年,人们对人工智能比较重视,因此,对计算机视觉和机器学习等方向的研究比较多,随着其研究的加深,专业人员讲重点放在了图像本身,对其进行更加准确的分析和了解。而图像语义分割正是在这样的情况下提出来的,图像进行分割之后,对其分割后所有分割区域与像素的语义类别进行分类,且可以准确识别,旧的图像语义分割步骤有3种,其一图像的底层分割,将图片划分成多个小的区域;其二是获得小区域的底层特点,比如,形状特征、颜色等;其三是从底层的特点到高层的语义空间的映射,其目的是为了识别图像的具体区域与图像的每一个像素的语义种类。 3.4人脸识别 人脸识别对计算机视觉方面是一个比较大的难题,技术比较难实现,其目的分为人脸验证与人脸辨别。人脸验证的目的是为了辨别出任意2张人脸是否为一个人的,这是一个二分类的问题,随机猜测的正确概率为50 %。人脸辨别的目的是把一个未知的人脸照片分割成几个身份类型之一,是多分类题目,随机猜测的正确概率为N分之一,其正确率比人脸验证更低,因此其挑战更大。 4结束语 最近几年来,经过专业人士的不断研究,深度卷积神经网络在计算机视觉方面的研究成就比较多,将这些成果进行总结改造,运用在人工智能领域,使人工智能方面得到快速的发展,不断地满足人们对人工智能的需求。但是在目前的研究中,依然有很多的问题需要解决,有很大的发展空间。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。