标题 | 人工神经网络研究与分析 |
范文 | 祝凌云 摘 要 人工智能主要研究机器行为、机器学习、机器思维等。这些看起来很难做的事,在人工神经网络的发展下变成可能。本文首先论述人工神经网络的由来,研究生物神经元的特点,并引出人工神经元模型及激活函数;进一步分析了几种常见的人工神经网络,主要包括目前广为应用的反向传播网络、能够有效避免局部最优问题的径向基网络、以及能够有效实现记忆功能的自适应的谐振网络;最后总结了目前在计算机视觉和自然语言处理的实际应用。 关键词 人工智能;人工神经网络;基本原理;反向传播 中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2019)237-0120-03 近10年来取得重大技术突破的人工智能技术,已经以各种方式进入到社会的方方面面,并起着举足轻重的作用。目前世界各地关于该领域的研究都在如火如荼的开展,我国也在大力发展人工智能,并希望在2030年成为人工智能强国。许多中国公司已经相继发布了诸多高科技人工智能产品,如Tmall Genie X、iFlytek translator 2.0与智能音箱等。而人工智能的发展当然也离不开它的核心技术——人工神经网络[ 1 ]。 人工神经网络作为信息处理系统,具有非线性、自适应的特性。每个神经元都处在兴奋和抑制这两种状态,因此,建立非线性关系是必须的。进一步人工神经网络的自适应,需要不断在学习的过程优化和迭代。在面对不同对象与环境时,可将学习分为3类,分别为有监督学习、无监督学习和强化学习。目前人们对某种神经网络的训练,主要是调整神经元的阈值和权值,找到适当的值,可以提高神经网络的效率,增加其容错性。 1 基本原理 人类自古就对大脑的结构有着极大的兴趣。研究发现,人脑在传递信号的过程中,神经元与神经元之间的突触结构需要经过电信号-化学信号-电信号的转换,因此人脑信号的传递比计算机计算速度慢很多。但自1997年“人类脑计划”启动以来,人们逐渐认识到人脑在对外界做出反应时,反而比机器更快,究其根本是因为人脑在不断的学习与记忆使其无需繁琐的机器计算,而是对记忆的搜寻与经验的再现。因此,基于人脑信息处理机制的基本原理对设计人工神经元,构建神经元之间的联系组成人工神经网络有着重要意义。 1.1 生物神经元 虽然人类还没有掌握生物神经元的功能与结构,目前所说的人工神经元与生物神经元之间也可能有很大的区别,但生物神经元是人工神经元的原型。因此对生物神经元的学习很有必要。 研究发现生物神经元主要由两部分组成,一是细胞体,二是突起。细胞体,包括核糖体内质网,高尔基体等细胞器,可对信息即上一神经元传递而来的冲动进行处理,从而使细胞膜电位发生改变。当细胞膜电位超过某一阈值时,细胞就会兴奋,并由轴突传递给下一神经元,否则细胞抑制无兴奋传递。其中轴突是神经元的信息输出端,其末端也称为神经纤维,它可把兴奋传递给下一个神经元。 上述的轴突为突起的种类之一,另一种则为树突。树突是神经元较短的分支,数量较多,形如树枝,可用于接收上亿神经元的刺激。上亿神经元的轴突与下一神经元的树突通过突触相连形成生物神经网络。 1.2 人工神经元数学模型 为了解决现实生活中的非线性问题,实践过程中常引入激活函数[3]。在深度学习技术兴起以前,Sigmoid函数是最为广泛应用的,目前常用的则是ReLU函数。主要是因为ReLU函数计算简单,速度快。尤其是在深层神经网络在反向传播的过程求偏导数时,Sigmoid函数导数会从0.25减小,当模型层数较多的时候,就会出现梯度消失的现象,而ReLU的梯度恒为1,能有效避免梯度消失和梯度爆炸的问题。二者都是对神经元电信号的一种模拟。公式如下: 2 常见的几种模型 2.1 BP神经网络 BP即Back Propagation指的是反向传播。反向BP网络是目前使用最为广泛的网络,它是深度学习核心训练算法的基础。BP神经网络的训练就是先将信息前向传递,再反向传播调整阈值和权值的过程。它是一种有监督学习,未经训练的模型输出的结果与准确值会有偏差。通过损失函数和代价函数来量化和计算实际输出与标签之间的误差指,再基于链式法则采用梯度下降的算法,使得误差收敛到最优解即最小值。 BP网络的组成通常由输入层,隐含层和输出层3部分组成,各层神经元之间全部相连,同一层神经元则无连接,其中复杂的神经网络中可含有多个隐含层。 在信号向前传播时,信息经输入层传入网络中,其中每一个神经元包括两步操作:其一为数据的整合,主要是对每个信号的输入乘以权重并求和之后,再加上阈值;其二为数据的处理,即将上述的结果输入到激活函数中进行非线性映射。训练完成的网络中,隐含层常抽象出物体的特征。如当输入一个汉字的图像,隐含层可能表示的是这个字的某个组成部分,且中间的隐含层层数越多,它便可分层次的提取高级特征。最后利用误差函数计算神经网络输出与真实值的误差,误差函数值越小,表明结果越准确。利用梯度下降和反向传播的算法,可将损失反向传播,进而调整神经元间的权值,通过不断的迭代训练,达到优化输出的目的。 2.2 RBF神經网络 由于在实际训练过程中,BP神经网络存在局部最优的问题。1988年,人们提出了径向基函数(radial basis function neural network, RBF),它也是一种前馈式神经网络。通过利用径向基函数,该网络不仅解决了局部最优的问题,而且实现了最佳逼近,节省了大量的训练时间。 2.3 ART神经网络 自适应共振理论(adaptive resonance theory)的提出,是为了解决传统神经网络中知识遗忘的问题。ART神经网络的记忆内容可随学习的过程不断增加,避免了遗忘。 共振,也是模仿人类对图像的识别与记忆。其主要过程如下,首先环境输入模式,ART神经网络有一个判断的过程,以相似度的参考门限为准,与神经网络储存的模式进行比较。判断结果即有相似的模式和无相似的模式。若有相似的模式,就选择最相似的模式作为代表,并调整该模式的参数,类似于共振,以强化并完善该模式的内容。若无相似模式,只需新建此模式,并设置权值和阈值,让环境再次输入的相似模式能与之匹配。 3 应用 3.1 计算机视觉 计算机视觉,简单的说就是让计算机能够像人类一样,从图像中提取某些信息,让计算机能够看懂图像。人类的视觉是一种感知。人们可以从自我的感觉中做出判断,得出结论。计算机视觉技术基于现代心理物理学的研究成果,利用人工神经网络,对图像进行识别、检测与处理[4]。在这过程中,摄像机代替人眼获取图像,人工神经网络利用算法模拟人脑。 在某些方面,计算机视觉的表现突出,甚至能够超越人类。人工神经网络功不可没,它具有优秀的图像处理技术,如图像分割、图像平滑和边缘锐化等;能够根据灰度阈值将图像分割;能够将因为摄像机等设备自身原因造成的失真现象进行平滑处理;还能够给图像中的各个物体勾勒出其边缘的线条。 但是在实际场景中,计算机视觉与其他技术和硬件,还不能够完美的结合。例如,可移动机器人在未知环境中,还未实现全自动的行为能力。 3.2 自然语言处理。 自然语言指的就是人类使用的语言。计算机科学家希望能够让人们从复杂计算机语言中解脱出来,实现人与计算机的自然语言通信[5]。研究自然语言处理,不仅可以促进人与计算机的交流,提高人们的生活质量;而且也能让人类了解自己的语言特征。自然语言处理包括自然语言的理解和自然语言的生成。语言的理解就是对输入的文本进行对话处理、知识处理。语言的输入可以是语音和文字的形式,这也利用了语音识别和计算机视觉的技术。语言的生成便是将处理的结果以自然语言表达出来。 自然语言处理具有广泛的应用。例如iflytek translator 2.0、信息检索系统。但是目前它还不能处理大规模的文本。自然语言处理面对的最大困难就是语言的不确定性,容易引起歧义。对语言的组成部分字符、词组、句子,每一个都有多种含义。而一个含义又可用多种方式来表达。这不是仅仅研究语法或者开发程序可以解决的,人们在对话中往往是根据语境加以判断。要克服句意理解的障碍,就必须研究人脑对语言的识别与判断,使计算机能够筛选出语境中有用的隐含信息,推理句子的指代和省略。 4 结论 自20世纪80年代人工神经网络被提出以来,经过无数科学家的深耕细作,使其目前得到了突破性进展。本文主要介绍了人工神经网络的基本原理、常见模型和应用。人工神经网络是一种模仿人脑运作的网络,其中反向传播神经网络是目前运用最为广泛的一种,而自适应谐振网络和径向基网络二者相比于BP神经网络也各有所长。最后介绍了人工神经网络在计算机视觉和自然语言处理等领域的应用与挑战。相信随着人工神经网络的发展,它会给我们带来更多的惊喜。 参考文献 [1]王佳.计算机人工智能识别技术的应用瓶颈探赜[J].科技展望,2016,26(35):93-94. [2]朱大奇,史慧.人工神经网络原理及应用[M].合肥:安徽科技出版社,2006. [3]李航.统计学习方法[M].北京:清华大学出版社,2012:6-8. [4]李超波,李洪均,徐晨.深度學习在图像识别中的应用[J].南通大学学报,2018(1). [5]黄子良.深度学习应用前景分析[J].通信与信息技术,2017(3):54-56. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。