公务员期刊网 精选范文 神经网络的认识范文

神经网络的认识精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络的认识主题范文,仅供参考,欢迎阅读并收藏。

神经网络的认识

第1篇:神经网络的认识范文

关键词:BP神经网络;人脸识别;奇异值

中图分类号:TP391 文献标识码:A文章编号:1007-9599 (2011) 13-0000-01

Face Recognition Based on the BP Neural Network

Liu Weiwei

(Chinese People's Public Security University,Beijing100872,China)

Abstract:In order to achieve the purpose of face recognition by classifying the feature vector of face image,a new methods for face recognition on neural networks is presented in this paper.Singular values features of face image matrix are used as features,Back-Propagation(BP)networks are used as recognition.Through the experiments,it show that the method of face recognition is reliable and have a ability of high maneuverability.

Kewwords:BP neural network;Face recognition;Singular values

一、引言

人脸识别的发展应用广泛,利用人脸图像进行识别身份容易被接受,具有非打扰性、直接性、唯一性。人脸识别主要是对人脸特征向量分类识别。神经网络可以用做人脸特征的分类器。它是一种模拟人类大脑的思维方式和组织形式而建立的数学模型。具有强大的自适应、自学习、高度容错能力,因此成功运用在模式识别和预测等领域。BP网络是神经网络中最完美的,采用BP神经网络可以进行人脸特征向量识别分类。

二、BP神经网络

BP网络是一种单向传播的多层前馈神经网络,它包括一个输入层、若干隐含层和一个输出层,上下层之间实现全连接,而每层神经元之间没有连接。利用BP神经网络可以实现输入向量 到输出向量 的非线性映射。该网络的前层和后层都有连接权值 ,每一层有阈值 ,这些值在初始时刻是随机生成的。在具体的应用中,将特征值向量作为输入向量,特征值所对应的结果作为输出向量,BP网络载入这些数据训练和学习,从而对连接权值和阈值不断进行修正,使网络达到的最优状态,完成网络的学习和训练过程,为后续的数据分类做准备。因此可以将BP神经网络作为人脸特征向量的分类器,以达到人脸识别的目的。

三、基于BP神经网络的人脸识别

人脸识别是基于人脸的唯一性进行识别,这里采用奇异值分解的方法提取人脸特征向量。本实验的数据取自ORL人脸数据库,该库由40人、每人10幅、共400幅人脸图像组成。这些照片包含测试者的不同面部表情。本实验选择两个测试者进行识别,每个测试者的十幅图像作为一个类,每个类的前九幅图像的特征向量作为网络的学习训练样本,第十幅图像的特征向量作为测试数据。

(一)样本数据的获取

采用奇异值分解的方法提取人脸图像的特征向量,这些特征向量作为BP网络的学习和训练样本数据,对样本数据进行归一化后得到。例如 =(0.55650.53230.36750.40620.35990.38540.37030.3062)表示第一个测试者的第一副图像的特征向量,在BP网络中对应的输出向量为(1,0)。

(二)BP神经网络的建立

第一,确定隐含层的层数。对于一般的模式识别问题,三层网络可以有效的解决此问题。本试验采用三层网络,输入层的神经元个数为特征向量的维数n=8,隐含层的神经元个数为p=2n+1=17,输出层的神经元个数为输出向量的维数为m=2。隐含层神经元传递函数选用tansig,输出层神经元传递函数选用logsig。输出向量为(1,0)和(0,1)表示为第一个和第二个测试者。

第二,载入样本数据学习和训练。样本数据包括输入向量和输出向量,通过学习和训练不断的修正网络中的权值和阈值。训练曲线的收敛情况如图2.

在matlab环境下运行,采用测试样本进行测试,实验结果输出为(0.98490.0027);(0.00270.9547),试验结果接近(1,0)和(0,1),分别为一号和二号测试者,实验达到预期结果。

图1.训练曲线

四、结语

运用BP人工神经网络建立了人脸识别模型,解决了对人脸特征向量进行分类识别的问题,从而达到对人脸识别这一最终目的。识别结果表明,在小样本空间下,运用BP神经网络的人脸识别运算速度快、操作简单、识别率高,BP神经网络可以用于人脸识别系统中的识别部分,并且可以扩展到其他模式识别问题。

参考文献:

[1]郝文化.MATLAB图像图像应用教程[M].中国水利水电出版社,2004

[2]邵拥军等.基于BP神经网络的湘西金矿成矿预测[J].中南大学学报,2007

[3]高全学等.SVD用于人脸识别存在的问题及解决方法[J].中国图象图形学报,2006

[4]杨天军,张晓春等.基于BP神经网络的城市道路交通安全评价研究[J].中国矿业大学学报,2005

第2篇:神经网络的认识范文

关键词 人脸识别;期望最大;主成分分析;径向基神经网络;特征抽取

中图分类号TP39 文献标识码A 文章编号 1674-6708(2011)52-0202-02

0 引言

人脸识别是模式识别领域的一个前沿课题,有着广泛的应用价值。Turk & Pentland 提出了基于KL变换的人脸识别方法[1],Hong[2]提出了基于奇异值分解的识别方法。主成分(PCA)方法作为一种有效的人脸代数特征提取方法广泛应用于人脸识别领域,直接用PCA方法抽取原始图像的特征,虽然方法简单,但是耗时非常的大,本文采用了期望最大PCA[3-4](Expectation Maximization Principal Component Analysis, EMPCA)方法,此算法无需计算样本的协方差矩阵,因此有效的降低计算的复杂度。神经网络由于具有非线性特征和联想记忆功能,在各门学科领域都具有很重要的实用意义,其学习能力和容错能力对不确定性模式识别具有独到之处。本文探讨了用EMPCA方法提取图像的主成分特征和采用RBF神经网络[5-7]作为分类器的人脸识别方法。

1 主成分分析(PCA)

设是n维随机向量x经过居中处理后的T个采样点,即相当于将T个随机采样点在坐标轴上对齐同一个坐标原点,其中为样本均值。通过对采样点的线性正交变换,得到一个m维2阶不相关向量组 y,。

基于协方差变换的主成分分析[1](PCA)定义如下:得到采样点x经居中处理后的数据的协方差矩阵,根据矩阵计算理论[9],有如下等式成立:

(1)

其中分别为矩阵对应的特征值和特征向量。

取矩阵的前D个特征值为,并且这些特征值满足,它们对应的特征向量为,则满足等式

(2)

的向量称为采样点x的第k个主成分。对于人脸图像处理而言,每一幅人脸图像都可以投影到由前D个特征向量所张成的子空间中,因此每一幅人脸图像相当于对应子空间中的一个点,同样,子空间中的任一点也对应一幅图像,由于这些图像很像人脸,所以它们被称作“特征脸”。通过此投影法,可以有效的对原始图像降维,并尽量保留原始图像的主要信息。

2 Expectation-Maximization Principal Component Analysis (EMPCA)

在EMPCA[3-4]算法中,PCA方法可看作是一种有限情形下的线性高斯模型特殊类。这种线性高斯模型假设变量y是由k维变量x和附加的高斯噪声v构成。

因此,该模型可写成:

(3)

其中矩阵C为维矩阵,v为具有协方差矩阵R的p维噪声。

由于x,v是独立分布的,所以我们可以将变量y写成:

(4)

在上面的线性高斯模型的时候,有2个中心问题是我们要关注的。第一个问题是压缩:给定固定的模型参数,如何确定观察值y的隐状态x?

由于数据点是独立的,我们关注单个隐状态给相应单个观察量的后验概率。这个可以很容易的通过线性矩阵投影计算得到:

(5)

,(6)

从以上我们可以得到隐状态和,同时也可以得出如何用x重构y(7)

最终,任何数据点y的概率均可通过(4)得到。

第二个问题是参数设置这包括如何确定矩阵,使得由该模型构造的观察数据似然性最大。有很多EM算法[3]去做这个过程,但是不同的算法都有相似的结构:用公式(6)在e-step中估计未知状态,然后在m-step中选择,目的是使估计值x和观察值y之间的概率最大。

我们得到EMPCA 算法如下:

1)初始化和迭代次数N

2)经N次迭代取得C

(1)e-step:

(2)m-step:

其中Y为原始人脸数据。

1)得到C的规范化正交基作为新的C值,即新值满足

2)求的特征值和特征向量,假设分别为和V,最终的特征向量

3 RBF神经网络

径向基(Radial Basis Function,RBF)神经网络是前馈神经网络中的一类特殊的三层神经网络。RBF网络从输入空间到隐含空间的变换是非线性的,而从隐含层空间到输出空间的变换则是线性的。其隐含单元的特性函数采用非线性的径向基函数,以对输入层的激励产生局部化响应,即仅当输入数据落在一指定的小范围内时,隐层单元才会做有意义的非零响应。RBF神经网络的拓扑结构如图1所示。

图 1 RBF神经网络拓扑图

RBF网络对应于输入到输出的映射,RBF网络的输出为:

(10)

其中表示某点的位置,l为隐层单元数。为输出单元与隐层单元之间的连接权值,R是非线性径向对称基函数,常采用的为高斯型基函数:

(11)

其中为隐层第j个单元的输出,x是输入模式,为核函数中心,为函数的宽度参数,控制了函数的径向作用范围。

4 人脸识别实验与结果分析

本文采用ORL人脸数据库验证该算法,该数据库包括从1992年4月到1994年4月剑桥大学实验室拍摄的一系列人脸图像,具体为40个人,每个人有不同表情或不同视点的10幅图像所构成,倾斜角度不超过20度,这些人脸图像的分辨率为92×112,为灰度图像,数据库中的部分人脸图像如下图所示:

图2 ORL人脸数据库部分人脸数据

在我们的实验中,为了处理数据的方便,我们首先通过二维小波变换得到原来图像的低频信息,得到的部分图像如下(此时人脸图像维数为46×56):

图3 经小波处理之后的部分低频图像

对于得到的低频图像,分别采用PCA算法和EMPCA算法计算人脸图像的特征空间,在同等的实验条件下,采用PCA算法得到对应的特征向量空间需要404.55s,而采用EMPCA算法只需要28.13s,由此可见EMPCA的特征抽取速度是传统PCA方法的15倍。经过PCA和EMPCA算法得到的部分特征脸图像分别如下:

图4 不同算法分别得到的前八个特征向量所对应的特征脸

上:由PCA算法得到的部分对应特征脸

下:由EMPCA算法得到的部分对应特征脸

从得到的特征脸图像可以看出,通过EMPCA算法得到的特征脸图像基本上类似通过传统PCA方法得到的特征脸图像,也说明同样代表了原始图像的主要信息。

在得到特征向量之后,将原始人脸图像投影到特征空间,得到图像的投影数据,然后用RBF神经网络分类,此实验中,以每人前6幅图像作为训练样本,所有人脸图像作为测试样本。此外,笔者还做了该方法与经典特征脸,Fisherfaces方法的比较实验,以及在不同分类情况下的分类性能。识别率分别见表1,表2。

表1 特征脸,Fisherfaces和EMPCA方法采用RBF神经网络分类识别率对照表

表1表明了在同等的实验条件下,本文算法的识别性能优于经典的特征脸方法和Fisherfaces方法。

表2 不同分类方法识别率对照表

表2显示了同样在经过EMPCA方法抽取有效特征之后,采用不同的分类方法得到的识别率对照表,从该表中可以看出RBF神经网络的分类性能优于KNN的分类性能。

在以上的基础上,笔者还做了在不同模式类别数情况下的实验,实验结果分别如图5,图6所示。在不同的类别情况下,从图5可以看出在总体性能比较上,经过EMPCA算法得到的特征数据的分类性能优于传统的特征脸和Fisherfaces方法,图6比较了分别采用RBF和KNN分类方法对EMPCA算法得到的投影数据的识别率,从图中可以看出RBF神经网络的分类性能优于KNN分类器的分类性能。

图5 采用RBF神经网络分类 图6 采用RBF神经网络和KNN

性能比较图 分类性能比较图

5结论

基于EMPCA算法和RBF神经网络的人脸识别方法,有效的解决了传统PCA方法计算的复杂性问题,无需计算样本的协方差矩阵,避免了采用传统PCA方法所需要的复杂的计算代价和巨大的存储代价。在识别策略上,具有分类作为的神经网络模型比简单的KNN分类器具有更好的识别性能。

参考文献

[1]Turk M, Pentland A. Eigenfaces for recognition. Journal of Cognitive Neuroscience,1991,3(1):71-86.

[2]洪子泉,杨静宇.用于图像识别的图像代数特征抽取[J].自动化学报,1992,18(2):232-238.

[3]A.P.Dempster,N.M.Laird,and D.B.Rubin.Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society series B,39:1-38,1977.

第3篇:神经网络的认识范文

关键词:BP神经网络;人脸识别;MATLAB

中图分类号:TP391

随着科技的发展,对人脸识别技术的发展要求越来越迫切,如(1)在企业、住宅安全和管理方面,要求实现人脸识别门禁考勤系统,人脸识别防盗门等。(2)在公安、司法和刑侦方面,利用人脸识别,在全国范围内搜捕逃犯。(3)在银行的自动提款机中,如果应用人脸识别就会避免由于用户卡片和密码被盗。(4)在电子商务交易过程中,如果使用人脸识别实现当事人在网上的数字身份和真实身份统一,便增加了电子商务的可靠性。而人脸识别的软件系统开发,是联系理论和实践的最重要的环节,因此实现人脸识别系统的开发应用越来越重要。

1 BP网络的概述

1.1 BP神经网络的定义。前馈多层神经网络广泛的应用于模式识别与分类、控制、预测、图像处理等问题,是当今社会应用最广、发展最快的人工神经网络之一。由于此神经网络的网络权值阈值的确定常采用误差反向传播算法(Back Propagation,简称作BP算法),所以通常称这种前馈网络为BP网络。典型的BP网络是三层网络,包括输入层、隐含层和输出层。各层之间实行全连接,而其中隐含层可以是一层,也可以是多层(如图1)。

图1 单隐含层的BP网络结构

BP网络的学习由四个过程组成,即:(1)输入模式:输入层经隐含层向输出层的“模式顺传播”过程;(2)网络的理论输出与网络实际输出之差的误差信号:由输出层经隐含层向输入层逐层修正连接权的“误差逆传播”过程;(3)由“模式顺传播”与“误差逆传播”的反复交替进行的网络“记忆训练”过程;(4)网络趋向收敛即网络的全局误差趋向极小值的“学习收敛”过程。简言之,就是由“模式顺传播”“误差逆传播”“记忆训练”“学习收敛”的过程。传递函数一般为(0,1)S型函数 。BP网络隐层中的神经元均采用S型交换函数,输出层则采用纯线性变换函数。

1.2 BP网络的算法。BP算法可描述为大致五步:(1)初始化各权值为较小的随机值;(2)选取训练集;(3)根据输入计算理论输出;(4)调节输出层和隐含层的连接权值;(5)返回第二步反复训练网络直至误差理想为止。

其流程图如图2:

图2 神经网络算法流程图

2 BP神经网络实现人脸识别

2.1 设计思路。本设计采用50幅图像(10个人每人5幅)作为训练图像,应用主成分分析对训练图像进行二阶相关和降维,提取训练图像的独立基成分构造人脸子空间,并将训练集中的人脸图像向独立基上投影得到的系数输入改进的BP神经网络进行训练。然后将待识别的人脸图像向独立基上投影得到投影系数,再将其输入已训练过的BP神经网络进行识别。设计结构如图3。

图3 人脸识别系统结构

2.2 BP网络的创建和初始化。因网络的输入矢量与输出矢量相差较大,为了减少网络的训练误差,在建立网络之前要对输入矢量进行归一化。这里我们利用premnmx函数把输入初始化在[-1,1]之间。程序代码如下:

p=premnmx(p')';

t=[1000;1000;1000;1000;1000;0100;0100;0100;0100;0100;

0010;0010;0010;0010;0010;0001;0001;0001;0001;0001]'

2.3 训练神经网络。本设计的方法如下:

%设计神经网路

[prow pcol]=size(p);

num=prow*pcol;%提取p中元素个数作为神经网络的输入层神经元个数

net=newff(minmax(p),[num,10,4],{'tansig','tansig','purelin'},'traingda');%隐层神经元个数为10,输出层神经元个数为4,4表示识别出人

net.trainParam.show=200;%显示速率为200

net.trainParam.lr=0.01;%学习率为0.01

net.trainParam.epochs=5000;%迭代次数不超5000

net.trainParam.goal=0.001;%训练误差为0.001

[net,tr]=train(net,p,t);

网络的训练函数有很多种,如trainlm,其中traingd学习算法是一般的剃度下降法;traingdx学习算法是剃度下降动量法,学习速率是自适应的。Trainlm的学习算法为Levenberg-Marquadt反传算法,该训练函数的优点在于收敛速度很快。本设计选用的训练函数为traingdx,在网络达到起训练误差要求时会自动停止,节省训练时间。训练过程中为了得到较小的误差,可以增加训练次数。

2.4 系统的性能评估。为了测试设计的网络模式识别系统的可靠性,这里用50幅图像输入样本,来观察其输出结果。通过程序演示,基本可以识别出不同的人脸特征。如果要提高精度,可以延长网络的训练时间,或者是将网络隐含层的神经元数目增多。为了测试系统,可提取几取几幅人脸图片数据,然后把它们输入到网络中,观察其得到的输出,并进行误差分析。

3 结束语

本设计是利用BP算法,以MATLAB软件作为工具手段,建立人脸识别的BP神经网络,且利用50副人脸图像数据训练网络,使神经网络能辨别出人脸信息。结果说明,本设计在人脸识别方面有比较好的优势。

在本设计中,使用了不人脸图像数据作为输入来训练网络,提高了整个网络容错的能力,这样更适合在实际环境中使用。

参考文献:

[1]蔺广逢,繁引娣,张媛.主成分分析与BP神经网络的人脸识别方法研究[J].现代电子技术,2007(02).

[2]MartinT.Hag,Howard B.Demuth. Neural Network Design Original[M].PSW publishing company.

[3]张威.MATLAB基础与编程入门[M].西安:西安电子科技大学出版社,2004.

[4]丛爽.面向MATLAB工具箱的神经网络理论与应用[M].合肥:中国科学技术大学出版社,2003.

第4篇:神经网络的认识范文

【摘要】 目的:应用BP人工神经网络原理,设计一种类风湿关节炎疾病诊断的方法。方法:选用对类风湿关节炎敏感的8个指标,作为BP人工神经网络的输入数据,对样本进行训练和预测。结果:BP人工神经网络经通过对150例样本的运算,训练集的113例样本,训练正确率为97.4%;预测集的37例样本,预测正确率为91.9%。结论:BP人工神经网络能为类风湿关节炎作出较准确的诊断,能提高诊断的客观性。

【关键词】 人工神经网络; 类风湿关节炎; 预测

类风湿关节炎(Rheumatoid arthritis ,RA)是一种以关节滑膜发生慢性炎性病变的自身免疫性疾病,其病程多呈进行性进展,致残率高,治愈率低下[1],早期临床表现不典型,单项自身抗体检测的灵敏度和特异性均有不足,类风湿因子的检出率也偏低,容易造成误诊[2,3]。因此医务人员主要是通过敏感性互补的几个检验指标和临床表现对类风湿关节炎作出诊断[4],但在疾病的诊断中往往带有很多的主观因素。近年来发展起来的人工神经网络是种理论化的数学模型,是模仿人脑神经的网络结构及其功能而建立起来的一种信息处理系统,具有自行学习、联想记忆、错误容纳和强大的非线性处理能力[5]。因此人工神经网络常常被应用到临床医学疾病的诊断上。本研究结合类风湿关节炎诊断的8个主要指标,设计一种基于人工神经网络类风湿关节炎的诊断方法,通过对150例样本的网络运算,探讨了人工神经网络对类风湿关节炎诊断的可行性。

1 人工神经网络基本原理

人工神经网络可以通过对外界信息的学习,以特定的方式对这些信息进行处理和概括,从而具备了对这些信息的识别功能,并产生了一个相对应的结论。因此,再次给人工神经网络这样一个相似的条件时,神经网络就会根据已学到的知识,自行推理判断,得到一个我们需要的结果。

1.1 人工神经元

人工神经元是组成人工神经网络的基本处理单元,简称为神经元。如图1显示了一个具有r个输入分量的人工神经元模型[6]。

图1中p(r=1,2,…,r) 为该神经元的输入数据;Wr 为该神经元分别与各输入数据间的连接强度,称为连接权重,权重值的大小代表上一级神经元对下一级神经元的影响程度。b为该神经元的阈值,f(x)为作用于神经元的激励函数,通常采用的是S 型函数,其数学表达式见式(1)[7]:

f(x)=(1+e-Qx)-1(1)

a为神经元的输出数据。神经元将接收信息pi与连接权重wi 的点乘积求和构成其总输入, 在神经元阈值b的作用下经函数f(x)的作用,产生信号输出a。

图1 人工神经元模型

1.2 人工神经网络

人工神经网络是由多个不同的神经元连接而成,一般含有多个层次,每个层次又包含了多个神经元,上一层次的神经元只能对下一层的神经元产生作用,同层神经元间无相互作用[7]。根据神经元的不同连接方式,就形成了不同功能的连接网络模型。比如BP神经网络,Kohonen神经网络,Hopfield神经网络等等,多达数十种。在医学中应用比较广泛的是BP神经(Back Propagation),也就是误差逆向传递网络[8],本研究中采用的也是BP神经网络。BP神经网络一般由输入层,隐含层和输出层构成,其结构模型如图2所示。

神经网络输入层的神经元是接受外界信息的端口,不包括数据运算功能,他将外界的输入数据通过一个连接权重传递给下一隐含层的神经元。隐含层是神经网络的核心部分,数量上可以有一个或多个层次,随着层次的增多,网络结构变得更复杂,网络数据处理功能也增强。网络的最后一层是输出层,输出层接收到隐含层的各项信息,然后经过转换把信息传给外界。

输入层 隐含层 输出层

图2 BP人工神经网络模型

1.3 人工神经网络工作原理

为了解决临床上对疾病的预测或识别等问题,神经网络主要是通过学习来获取"知识"或"经验"的,这一过程总体上可分为训练和预测两个阶段。所谓训练就是形成一种病因与疾病之间的函数映射关系,即给定一个实际输出与期望输出的目标误差值,将病人的各种病因、实验室检查、影像超声检查、临床表现等作为网络的输入信息加到其输入端,输入信息经过隐含层神经元的处理后,传递给输出层。如果输出层得到的结果大于预先给定的误差目标值时,神经网络将这种误差信号沿原来的传递路线逐层返回,并调节各个层次间神经元连接的权重值,这种过程不断交替进行,直到误差达到目标值时,训练过程结束。经过训练可使疾病的各种情况分布到连接权上, 使学习后的网络权重值存储了临床症状和疾病类型等相关的知识,此时可以认为神经网络建立起了病人的各种因素与该病人是否患有某种疾病的映射关系,这种映射关系就是一个预测疾病的判别函数。预测就是检验判别函数的可靠程度,利用一些未包括在训练集中的样本构成预测集,将预测集中与疾病相关的数据输入到训练好的网络中去,在训练阶段所得到的判别函数的作用下,就可以得到一个测试结果,从网络的输出端就可以诊断病人是否为疾病患者。

2 人工神经网络诊断类风湿关节炎实例

2.1 病例选取及变量确定

实验数据来源于哈尔滨医科大学附属医院,总共有150例。其中类风湿关节炎患者83例,女71例,占85.5%;男12例,占14.5%。年龄范围为20~79岁,平均年龄为48.92岁。所有患者均符合1987年美国风湿病协会修订的类风湿关节炎诊断标准。用来作正常对照的有67例,其中女62例,占92.5%;男5例,占%7.5,年龄范围为18~79岁,平均年龄为43.63岁。病人资料主要包括临床症状与体征,相关实验室检查,相应影像学检查。

根据中华医学会风湿病学分会制定的类风湿关节炎诊断指南,典型的类风湿关节炎按照1987年美国风湿病协会修订的类风湿关节炎诊断标准来诊断并不困难,但某些不典型、早期类风湿关节炎,常常被误诊或漏诊。2008年,胡勇等[9]通过研究发现,抗CCP抗体对类风湿关节炎的敏感性和特异性分别为80.0%和93.7 %,联合抗CCP抗体和RF可以提高诊断的准确性,对类风湿关节炎的早期诊断有重要意义。因此为了提高神经网络诊断各种类型类风湿关节炎的准确率,我们选取了x1(关节晨僵)、x2(对称性关节炎)、x3(腕、掌指或者近端指间关节至少有一个关节肿)、x4(3个或者3个以上关节部位肿)、x5(关节X线改变)、x6(皮下结节)、x7(RF )和x8(抗CCP抗体)这8个指标来作为神经网络运算的输入数据。其中x1、x2、x3、x4、x5、x6和x7这几个输入数据是1987年美国风湿病协会修订的类风湿关节炎诊断标准所包含的内容,x8是为了提高对不典型、早期类风湿关节炎的诊断所采用的输入数据。上述x1、x2、x3、x4、x5、x6是定性变量(离散变量),临床上常用阳性和阴性来描述,实验中用1和0对这些变量进行赋值,当变量值为1时表示阳性,为0时表示阴性;而变量x7、x8是定量变量(连续变量),用原始数据来描述。

2.2 确定训练样本及预测样本

在以上150例样本中(83例类风湿关节炎和67例正常对照)中分别选取63例类风湿关节炎和50例正常对照的样本,用来组成训练集,并用1~113的数字对其进行顺序编号,1~63号代表是类风湿关节炎,64~113号代表的是正常对照组的样本。剩余的样本用来组成预测集,集中样本总数为37例,其中类风湿关节炎患者有20例,正常对照组有17例,也用同样的方法进行编号。训练集与预测集样本比例大约为4:1。

2.3 网络参数的设定及算法程序

首先对神经网络参数设定如下:输入神经元个数为8,输出神经元个数为1,期望目标输出值用0表示正常,用1表示类风湿关节炎,隐含层采用tansig函数。训练次数为6000次,训练目标为0.06,学习速度为0.05,网络连接权重初始值是[-1,1]之间的随机数,其次网络进行运算所采用的是批动量梯度下降算法,应用MATLAB6.5来编写该程序算法。

2.4 训练及预测结果

将训练集样本的8个指标输入到BP网络的算法程序中,网络经过500次的训练后,达到了训练目标的要求,训练结果如图3所示,预测输出以0.5为阈值,>0.5者为类风湿关节炎患者,

图3 113例样本训练结果从训练得到的图形可以看出,63例类风湿关节炎患者中有54例训练结果都在目标输出值1附近,而且非常靠近1。只有9例稍微偏离了目标输出值1,由于输出结果均在0.5~1.5的范围内,可以认为训练结果与实际相吻合。类似的在50例正常对照组中,有47例输出结果都在目标值0的附近,输出值都在0~0.5之间,训练结果与实际也相吻合。而编号为64、75、92的3例样本,其输出值大于0.5,明显大于目标输出值0,样本训练结果有错误。综上所述,训练集中113例样本有110训练正确,训练正确率达到97.4%。

经过训练可以得到一个能反映类风湿关节炎疾病情况的神经网络模型。把预测集样本的数据导入到训练好的神经网络中去,进行预测,预测的结果如图4。

图4 37例样本预测结果从上图的输出结果可以看出,在20例类风湿关节炎样本的预测中,19例样本的输出结果主要集中在目标输出值1附近,没有超出0.5~1.5的范围,可以视为预测结果与实际相符合,而编号为1的样本,其输出值小于0.5,偏离了目标输出值1,预测结果错误。另外17例正常对照组中,15例预测结果与实际相符合,而编号为27、33号的样本其输出值大于0.5,明显偏离目标输出值0,预测不正确。所以对于预测的总体样本来说,34例预测正确,准确率为91.9%,灵敏度为94.7%,特异度为86.7%。

训练集和预测集的样本,经BP神经网络运算,其结果如表1所示。表1 BP神经网络测试样本的计算结果

3 讨论

由表1可知,2例预测有误的样本,它们来源于预测集的正常对照组中。同样在训练阶段,运算有误的3例样本也全都来源于训练集的正常对照组中。由此可见,运算有误的样本在训练集和预测集之间存在一种对应关系,即神经网络对样本训练的错误率越高,其预测的准确率就越低。同时,一些样本的训练和预测结果也出现了较大范围的波动,没有集中在目标值为1和0的这两条直线上。出现这种结果的原因可能是:有些样本数据偏倚,训练样本总数又不是很多,从而导致这些数据偏倚的样本所占的比例较大,在总体中表现出来的作用也就较强。因此加大训练样本的数量,选择数据偏倚较少或者更有代表性的样本来学习训练,神经网络就能更准确的反映疾病自身情况,同时网络所包含的病因与疾病间相映射的函数关系也就更具有普遍性。

对疾病诊断过程而言,人工神经网络能够模拟专家级医师诊断疾病的思维过程和获得诊断疾病的相关知识。此后对疾病进行预测时就可以避免医师对疾病诊断的主观性及思维定势,因此能提高疾病诊断的客观性。尽管临床上也存在一些疾病患者,往往因为诊断数据的缺失,给医师诊断带来了很多的困难或是误诊,然而神经网络具有的容错性质以及能根据训练得来的知识和处理问题的经验,对上述缺失的数据等这种复杂的问题,做出合理的判断与推理,从而为病人做出较正确的诊断。

在疾病诊断方面, 按照1987年美国风湿病协会修订的类风湿关节炎诊断标准,对一些不典型,早期的类风湿关节炎常常不能作出正确的诊断,特异性也低,往往造成误诊。然而基于人工神经网络类风湿关节炎的诊断方法,通过对37例样本的预测,预测结果表明:本方法对类风湿关节炎的诊断,其准确率为91.9%,灵敏度为94.7%,特异度为86.7%,可作为疾病诊断的一种新方法。当然,实验中也存在一些问题有待于进一步研究,如输入变量的选择及其数据处理,网络初始权重的计算,网络训练的最佳原则,隐含层数的设计等等。随着研究的进一步深入,人工神经网络必将得到临床工作者的认同并为疾病研究带来诸多的便利。

【参考文献】

1 顾福荣,张义东,施锦杰.抗CCP抗体、抗RA33抗体、抗Sa 抗体和RF联合检测对类风湿性关节炎诊断的意义.江西医学检验,2007,25(1):24~25.

2 Matsuo K,Xiang Y,Nakamura H,et al.Identification of novel eitrullinated autoantigens of synovium in rheumatoid arthritis using a proteomie approach.Arthritis Res Ther,2006,8(6):1~3.

3 Harrison MJ,Paget SA. Anti2CCP antibody testing as a diagnostic and prognostic tool in rheumatoid arthritis.QJM,2007,100(4):193~201.

4 王青青.类风湿性关节炎的诊断与治疗.全科医学临床与教育.2008,6(2):92~94.

5 孙文恒,王炜,周文策.人工神经网络技术在胰腺癌诊断中的应用.兰州大学学报,2008,44(7):224~227.

6 宋烨,杨本付,人工神经网络及其在疾病诊断中的应用,中华医学实践杂志,2006,5(3):275~277.

7 王俊杰,陈景武.BP神经网络在疾病预测中的应用.理理医药学杂志,2005,21(3):259~262.

第5篇:神经网络的认识范文

关键词:水动力模型,ANN神经网络系统,模型数据,缺失数据模拟

中图分类号:G250.72 文献标识码:A

我国大多数的城市管网建设滞后于水厂建设,给水管网的铺设会随城市的发展不断地铺设延长,与之相对应的是用水量的急剧增长,与老管线的协调规划问题等等,这一切的问题都使地下管线的管理成为一个极其复杂的问题。构建水动力模型,可以实时的看到管网的薄弱环节,并且通过分析得知造成管网问题的原因。水动力模型可以应用于并的给水系统的规划,设计及改扩建;管网改造优先性评估;管网改造并行方案的的成本分析,运行情况;指导和帮助安排管网检漏工作等。

建立水动力模型是一项复杂并且富有难度的工程,需要将给水管道的的信息,包括管道的管径、材质、管龄,粗糙系数等如实的反应到模型中,运行模型后要选择管网中具有典型代表性的节点,得到这些节点的节点流量与节点压力模拟值,将这些曲线与实际中该节点的流量与压力曲线进行对比。通过调整管网的粗糙系数,节点流量分配等核心数据使模拟曲线与实测曲线相吻合,这个过程称之为模型校核。校核后的模型才能应用于实际的工程工作中。

模型搭建和校核的过程中需要许多数据,而在现有国内的自来水公司,极少有完备的数据,而这些数据的检测和整理是一项复杂并且耗费财力的工程。当有所需的数据缺失时,根据现有的数据搭建ANN(人工神经网络)模型,模拟出缺失的数据曲线,从而用于水动力模型的校核工作中。譬如,节点流量曲线、节点压力曲线、节点的化学物质残留量曲线等等。

1 人工神经网络的概念

人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,是一种运算模型,由大量的节点(或称神经元)和之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。人工神经网络是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,通过统计学的方法,人工神经网络能够类似人 一样具有简单的决定能力和简单的判断能力,这种方法比起正式的逻辑学推理演算更具有优势。因为它不需要全面的数据。实践证明只要中间的隐含层个数足够多,ANN神经网络无限逼近任何连续函数。

图1 3层ANN(BP)网络结构

Fig. 1 Three level ANN model’s structure

2基于ANN人工神经网络的节点压力模型的建立

人工神经网络是一个能够学习,能够总结归纳的系统,也就是说它能够通过已知数据的实验运用来学习和归纳总结。人工神经网络通过对局部情况的对照比较,它能够推理产生一个可以自动识别的系统。人工网络系统之所以能够推理,基础是需要有一个推理算法则的集合。在本次的实例检验过程中使用相关系数和确定性系数来衡量模型的准确性,如果确定性系数越大,预测值和实测值的相关系数越大,误差就越小,模型的计算结果就越好。通过对模型精度的分析,判断节点压力曲线是否可以用于水动力模型的,模型校核工作中。

其实人工神经网络就是一个黑箱子,它所建立的模型不是基于实际的物理联系,而是基于我们所记录数据和所得值之间的函数关系(这种函数关系在运算的过程中不得而知),对于人工神经网络的计算过程我们不关心也不必去了解它计算过程的细节。人工神经网络在做出预测之前是使用记录数据的学习过程,之后的使用就是在上面的学习过程之后,人工神经网络会拟合出一个比较准确的函数关系从而会根据所给数据预测出我们所关心变量的结果。

本文以节点压力曲线的模拟为例子,阐述ANN模型的搭建,以及模拟结果的精确性。

已有的数据为给水管网中8个节点的压力曲线,靠近泵站的一个节点的压力缺失某几个小时的数据,现利用已知数据搭建ANN模型,模拟出此时,一个小时后,两个小时后,4个小时后的模拟压力曲线。通过对模型结果的分析,得出其结果是否能用于水动力模型校核工作。

2.1 训练模式对的准备工作

对于管网中的节点压力来讲,他们之间具有相关性,因为在预测未知点的压力曲线时,其他管网中的节点都是未知节点的重要影响因子。因此在搭建模型时要在输入层配置相应的单元用来模拟未知节点的压力曲线。

目标节点预见期压力=F{(某时间点NODE1水位),(某时间点NODE2水位),(某时间点NODE3水位)…(某时间点NODE8水位)}某时间点指的是预见期之前某个相应的时间点。

整个模型从数据输入到结果分析的过程可以用流程图表示出来。数据输入->数据编辑->模型参数确立->运行模型->模型结果分析。

2.2 目标函数(确定性系数)的确立

R= 式-1

式中 R为确定性系数

为该城市实测河流水位

为实测河流水位的平均值

为模型预测水

为模型预测水位的平均值

R越接近于1,说明模拟结果与实际测量结果越一致,也即模型越精确。

2.3 模型的结构参数的确立

人工神经网络模型中关键的参数有学习率,中间层的神经元数,动量因子,终止学习条件,本文利用设定最大平均误差来终止模型运行。其中的学习率和动量因子会影响到模型的收敛速度。学习率和动量因子的取值范围都在[0,1]之间。学习率越大运算速度越大但是如果取过大的值会导致模型不收敛,由于模型的运算速度比较快为了得到更加精确的结果取学习率为0.02.动量因子根据经验取0.1,中间层的神经元数取30。

3 实例分析

我们拥有管网中9个节点的压力曲线值,但是某个时间段节点9的压力曲线缺失,管网中9个节点的具置见图2.

图2 管网中的9个节点

Fig. 2 The 9 nodes in the network

示意图中观测站一为模型下游目标站的位置,本文所讨论的预测站也就是目标站。

建立模型之后对该城市城市管网中的节点9,此时以及未来1-4小时的节点压力进行预测。根据该中的8个节点和目标节点的的压力曲线数据为基础进行训练,并且对预测的结果进行分析。来判断时候可以将模拟的数据直接用于模型校核。

表1 预见期分别为0-4h的模型精确度参数

Table 1 Model’s forecast precision in 0-4hours

图3 同时刻节点压力的模拟值与实测值

Fig. 4 Forecast water level the same time with measured data

图4 预见期为1h时的节点压力曲线

Fig. 5 Forecast water level 1 hour later

图5 预见期为4h时的节点压力曲线

Fig. 5 Forecast water level 4 hour later

图6 预测同时刻的各个节点与目标节点的相关贡献系数

Fig. 6 Relative contribution coefficient between observation station and objective node on the same

time

图7 预测4h之后的各个观测节点与目标节点的相关贡献系数

Fig. 7 Relative contribution coefficient between and objective station when the forecast stage 4 hours

表2不同预见期的绝对误差

通过研究神经网络模型的结果可见:

(1)通过图6、图7可以得知使用人工神经网络模型,各个节点的实测数据对于最后的目标节点影响是不同的。节点3的对与目标站的相关系数性较小,在实际工作中可以舍弃此地数据的采集,从而减少人力物力的投入。随着预测时间的不同其相关系数亦会发生变化。

(2)预见期越长,其最后结果的可靠性越差。确定性系数,和绝对误差可以反映之,预见期为0h、1h时,其误差很小,当延长其预见期时,其误差会相应变大。当模拟结果用于水动力模型校核时,目标节点的模拟结果与输入节点为同时刻时,模拟数据与实测数据高度吻合,说明该结果可以输入水动力模型,进行校核。随着预见期变长,其模拟结果也越来越不准确。预见期为4小时时,其结果不能作为水动力模型的输入数据进行模型校核。

(3)在水动力模型校核过程中,可以将ANN的预测结果也就是预见期的目标节点压力曲线用于在水动力模型中。从而解决了原始数据缺失的问题。

4 结论

本文采用ANN(人工神经网络)建立了节点压力的预测模型,其预测结果可以应用于水动力模型中,用模型校核的原始输入值。从而为搭建城市的给水管网水动力模型提供科学的依据。也节约了大量人力,物力和财力的消耗。

参考文献

严熙世, 赵洪宾. 给水管网系统理论与分析. 中国建筑工业出版社, 2003.9

陶建科, 刘遂庆, 建立微观动态水力模型标准方法研究.给水排水, 2000, 26(5):4~8

Maier H R, Dandy G C. The use of artificial neural networks for the prediction of water quality parameters. Water Resources, 1996 ,32 (4) :1013 - 1022.

第6篇:神经网络的认识范文

关键词:神经网络 油气层识别 进展

油气勘探具有高投入、高风险的特点,如何利用现有勘探资料,采取切实可行的技术方法,增强测试层位的可靠性和准确性,对于扩大油气储量及提高已发现油气藏的勘探价值具有重要意义。首先精确地判识油气层位,可以大大减少试油成本及减少投资损失。其次对于新的勘探区域,如能准确地判识出油气层,则有助于新的油气藏的发现。因此,对储层进行识别和预测,有着巨大的社会效益和经济效益。

油气层综合解释的任务是要判断储层中所含流体的性质,从而为准确地发现油气层和确定试油层位提供依据。目前油田常用的解释方法主要有定性解释法和交汇图法,其前者不足是受人为因素影响较大,自动化、系统化程度较低;而后者在解释时只能对参数成对考虑,无法同时综合多个有效参数。鉴于上述方法的诸多不足,近年来用人工神经网络对储层进行识别与评价成为研究及应用的较为广泛的方法。

1、概述

神经网络具有很强的自适应学习能力。它模拟人脑的结构,通过对外界事物的感知及认识实现其判别过程,如加利福尼亚技术学院J.J.Hopfield提出的Hopfield网络用于地震模式识别油气层系统。

用从有噪声干扰的模拟地震记录中检测亮点模式,识别能力是十分惊人的。Poultion M.M等人在给定油气层的电磁椭圆图像情况下,用神经网络方法来估算良导体的位置、深度和导电率与面积乘积,效果也是很好的。

模糊识别的优点: ①利用测井多参数模糊识别储层时,各测井参数反映储层类型所包含的信息不同,因此综合储层模糊隶属度中各参数所加权值应根据曲线对模式识别贡献的大小来确定。②模糊识别方法是一种多参数的模式识别方法,具有思想简单、计算速度快、模式识别符合率较高等优点。缺点:建模过程中需要较多的建模样本,对于井资料较少的井不容易识别。目前在油气层识别中的应用比较普遍的神经网络方法有以下几种:

2、结构风险最小神经网络油气识别理论

中国科学院地质与地球物理研究所张向君在深入研究了神经网络系统处理信息的能力之后,针对神经网络油气识别中网络结构设计、提高识别结果准确性等问题,提出了结构风险最小神经元网络方法,在理论上提出了神经网络结构设计方法即网络“修剪"方法,该方法要求首先训练一个大的网络,然后逐渐去掉隐层中多余的节点:Waug和Massimo等的研究结果表示:含有一个隐层的位置、深度和导电率与面积乘积,效果也是很好的。

Hashem和Schmeiser为提高网络训练精度,提出一优化组合方法,即对一训练样本分别独立地用若干网络训练,然后通过对已训练网络的输出加权合并,将各个独立的部分网络组合在一起;Jacobs和Jordan发展了一种分级混合结构网络,它首先将一个复杂问题分解成各种简单问题,再对每一个简单的问题分别由一个网络单独处理,最后再将各个网络组合在一起解决整体复杂问题。结构风险最小神经元网络运用串行训练算法能自适应地扩展网络容量并使网络的结构风险达到最小,提高了储层识别结果的准确性。研究表明,训练样本一定时,神经网络的结构越简单,其风险越小,识别结果愈可靠,并且使神经网络的结构风险达到最小。

3、时间延迟神经网络地震油气识别方法

江汉石油学院刘瑞林等人在研究了目前已发展的几种地震资料油气识别技术后认为通常采用孤立模式分类方法一般先根据目的层的位置选取一个包含目的层的时窗,接着对这个时窗内的地震信号进行特征提取,然后对这些特征信息用相应的分类方法进行分类。特征信息与地层含油气情况的关系是静态的映射关系,方法本身没有考虑特征信息随时间的变化与地层油气聚集的联系,容易产生误识问题。针对以上现象提出了时间延迟神经网络地震油气识别方法即采用滑动时窗的办法进行多时窗特征提取,以表达特征信息随时间的变化,亦即地层层序等因素的变化。时间延迟神经网络模型通过井旁道的标定,对于每一道就有一个多维特征串,这些特征串与地层含油气与否的关系通过一个时间延迟神经网络(TDNN)模型联系起来,用于表达相应时窗特征信息与地层含油气性的关系。时间延迟网络进行油气识别时增加了层序的约束,对于地震油气识别来说是一种合理的方法。

4、前馈式(Back Propagation)神经网络

简称BP神经网络,它是目前应用最广泛、研究最深入的一种多层前馈神经网络。该种网络采用有导师监督的学习方式和广义的Delta学习规则,即误差反传播算法,对非线性可微分函数进行网络权值训练。它经常使用的激活函数是S型对数或正切函数以及线性函数。BP算法是一种监督式的学习算法,它是通过连续不断地在相对于误差函数斜率下降的方向计算网络权值和偏差的变化而逐渐逼近目标的。它由信息的正向传递和误差的反向传播两部分组成。在第一阶段,即信息的正向传递阶段,给出输入信息,通过神经网络处理并计算每个神经元的实际输出值;在第二阶段,即误差反向传播阶段,网络在输出层比较网络输出与目标值,若未能得到期望的输出值,则逐层递归计算目标值与期望输出之差(即误差),以此为根据调节权值。上述两个过程反复进行,直到网络输出与目标匹配或误差达到人们所希望的要求为止。

5、自组织特征映射(seIf-organiZingfeaturemap)SOM神经网络

自组织特征映射网络是一种竞争式学习网络。这种网络采用无导师监督的学习方式,以基本竞争网络算法为基础,通过网络中邻近神经元阳J的侧向交互作用和相互竞争。在一维或二维输出空间中形成输入信号的特征分布拓扑图,自适应的形成对输入模式的不同响应,以完成对输入信号的特征提取功能。SOM模型是由输入层和输出层(竞争层)组成的两层网络。网络中的权分为两类:一类是层与层之间的权;另一类是层内互相抑制的权。一般来讲,它们是固定的,如果满足一定的分布关系,距离近的抑制强,距离远的抑制弱,它是一种对称权。SOM网络将学习过程分成两部分来进行:一是选择最佳匹配神经元,二是权向量的自适应更新过程。SOM模拟了大脑信息处理的自组织、自学习和聚类功能,并以其高强度的特征判别优点在许多领域得到了广泛应用。

6、改进的组合进化算法的神经网络

成都理工大学张学庆等针对使用神经网络进行计算的过程中,神经网络的收敛速度慢、容错能力差、算法不完备等缺点。在充分分析了基于遗传算法的神经网络具有强的全局搜索能力,基于进化规划的神经网络具有强的局部寻优能力的特点后,将组合进化算法应用于油水层测井解释中,降低了误判率。

组合进化算法的过程如下:设立一个竞争池,将所有父代个体放入池中,然后进行杂交和变异操作,并用神经网络进行训练。将产生的个体也放入竞争池,对竞争池中的个体按适应值进行排序,进行确定性选择,保留最好的前n个个体。这样就完成了一次种群进化,重复这一过程,直到满足条件为止。改进的组合进化算法的神经网络具有遗传算法的较强的全局搜索能力和进化规划的较强的局部寻优能力,应用于油气水层测井解释中,效果好。

第7篇:神经网络的认识范文

经过长期不懈努力,科学家认为可以从仿制人脑神经系统的结构和功能出发,研究人类智能活动和认识现象。然而,客观现实世界是纷繁复杂的,非线性情况随处可见,人脑神经系统更是如此。为了更好地认识客观世界,我们必须对非线性科学进行研究。人工神经网络作为一种非线性的、与大脑智能相似的网络模型,就这样应运而生了。因此,首先对人工神经网络进行了概述;而后重点描述BP网络模型,对其基于弹性BP算法的BP网络设计与实现;最后,对网络的训练和测试进行了简单的分析。

关键词:

人工神经网络;数学模型;策略

神经系统,是人体器官的一种较为复杂的系统。人工神经网络是对人脑的神经结构与机制进行模拟,是一种区别于符号推理以及逻辑思维的人工智能技术。人工神经网络是基于现代神经生物学和认知科学对人类信息处理研究成果的基础上研发的,用来模拟生物神经系统对真实世界的物体来做出反应。除此之外,它还属于一种大规模自适应的非线性动力学系统,具备非常强的联想记忆和自主学习能力。人工神经网络具有非线性映射、模式识别、函数逼近、聚类分析、数据压缩以及优化设计的功能,并且在稳定性、收敛性等方面都有良好的性质,被广泛应用于信息处理、模式识别、计算机视觉、优化计算、智能控制等各个领域中。

一、人工神经网络

人工神经网络,可以称之为神经网络或者链接模型,是属于一种对人脑或者自然神经网络的若干个基本特性进行抽象和模拟的网络。现阶段人工神经网络的研究成果基础是对大脑的模拟研究,是为了模拟大脑当中的某些机理与机制,实现某个方面的功能而进行专项研究的。人工神经网络具有可以充分逼近任意复杂的非线性关系,对于定量或者定性的信息会采用并行分布的处理方式,使其可以大量并且快速进行运算、适应不确定的系统和对定量以及定性信息进行同一时间的处理。人工神经网络的优越性表现在三方面,具有自主学习的能力,具有联想存储的能力,具有高速寻找并且寻找优化方式的能力。对人工神经网络的研究,可以分为理论研究和应用研究两个方面的研究。在理论研究中,可以利用神经生理与认知科学对人类的思维以及智能机理进行相关研究,还可以利用人脑神经的基础理论研究成果,用数理方法对神经网络模型进行更加完善、更加优越的探索。在应用研究方面,神经网络可以实现对软件的模拟和对硬件的科学研究。而且,神经网络在各个领域中也都得到了广泛的研究,例如模式识别、信号处理、知识工程、专家系统、优化组合以及机器人控制等领域。

现行的数理知识是建立在集合论的基础上的,随着数学阶段的发展,对于人类系统的行为,或者对于人类复杂系统,比如航天系统、人脑系统以及社会系统等方面,其中的参数和变量有很多,各种因素也是相互交错的,因此,系统是相当复杂的,相对的模糊性也会显得非常明显。就认识方面来讲,可以用模糊性这个词语来概括概念外延的不确定性。因此,模糊数学的概念应运而生,主要的研究内容包括三个方面。首先,可以对模糊数学的理论进行精确研究,其中包含着与精确数学以及随机数学的关系;其次,还需要研究模糊语言学和模糊逻辑,人类的自然语言都是具有模糊性的,人们经常会接收到迷糊语言和模糊的信息,并且可以对其做出正确的判断和辨别。因此,为了可以使得自然语言和计算机语言的直接对话,就必须把人类的自然语言和思维的过程提炼成为数学模型来对计算机进行指令,这样就可以建立模糊数学的模型样本,通过运用此种方式,建立的就是模糊数学的模型,也是运用数学方法的关键之所在。最后,研究模糊数学的应用,模糊数学的研究对象通常是以不确定的事物为主的。模糊的集合通常都是通过数学来适用描述的复杂的事物,将研究的对象数学化,将其中的不确定性很好地和抽象的数学沟通起来,达到形象生动直观的效果。

二、BP网络模型

1.BP网概述BP算法,是由PallWerbas博士在1974年首次提出的,即为误差逆传播学习算法,而对于此算法完整的提出是在1986年由Rumelhart和McCelland为首的科学家小组提出来的。后来,人们把BP算法在进行训练之前的前馈型的神经网络称之为BP网络,逐渐以其简洁、实用和高度的非线性映射能力成为流行的网络模型,在信号处理、模式识别、系统辨识以及数据压缩中都有广泛的应用。在人工神经网络的实际应用过程当中,大部分的模型会采用BP网络或者它所拥有的变化形式,属于前向网络中的基础核心部分,属于人工神经网络中的精华部分。2.BP网络拓扑结构BP网络属于一种前向型神经网络,其中的神经网络具有三层或者三层以上,可以对上下层之间的神经元进行全部的连接,也就是说下层的每一个神经元可以和上层的每一个神经元实现连接,但是在同层之间的神经元是没有办法相连的。3.BP网络的工作原理以及过程对于BP网络的学习可以有两个阶段。首先,需要学习信号的正向传播过程。当一对学习的模式进行网络提供之后,神经元的激活值就会从输入层当中的各隐含层向输出层中进行传播,并且在输出层的各个神经元内会相应地输入响应值。其次,是对正方向的传播过程进行误差的修正,如果在输出层中的输出值和预期的有偏差,就会对实际输入与期望输出之间的误差进行逐层递归的计算,计算方向会按照减小期望输出和实际输出之间的误差方向。对输出层之间的各个隐含层进行每一层的连接权进行逐层的修正,最后再回到输入层,这个循环的过程就称之为“误差逆传播学习算法”。现阶段,这种误差传播的修正方式在不断地进行创新修正,网络对应的输入模式相应的正确率也会随着算法的不断发展得到相对应地提高。4.算法流程BP的算法流程如图2。

三、基于弹性BP算法的BP网设计与实现

1.BP网络结构的设计在1989年,RobertHecht-Nielson证明了在任何一个闭区间当中的一个连续的函数都可以用一个隐含层的BP网络来进行逼近,这就导致了用一个3层的BP网络可以完成任意的从N到M维的映射。输入层节点的点数是根据样本的输入特征项来决定的,而输出的节点数是根据样本的期望输出项来决定的。在隐层节点当中,由于隐层节点的数目过多,平均的收敛速度就会变慢并且速度是极其不稳定的,这样就会增加初始权值的敏感度,网络的泛化能力也会随之降低,在对隐层节点数进行计算的时候。其中,h代表的是隐层节点数,nin代表的是输入层的节点数,则nout则代表的是输出层的节点数。当因为网络发生误差产生下降的时候,也就是E(网络误差)下降的速度非常缓慢的时候,这个时候网络的收敛水平还需要进一步提高的时候,就会增加一个隐层节点。如果遇到相反的情况,则就会减少一个相应的节点。对于BP网络的优化,主要包括以下几个步骤。首先,利用弹性BP算法来对网络的权值和偏差进行修正,利用此种算法,在很大程度上避免了使得学习(是学习)陷入局部狭小的现象,这样可以加快学习收敛的速度;其次,对于隐含的节点数可以进行随意的设定;而后,在对隐含层和输出层的激活函数之间可以在给定的5种畅通的函数当中进行随意的选择,最后就需要对输入向量的归一化了。

四、网络的训练与测试

1.训练样本的声场以及网络的构造如果采用100个样本对来进行声场训练样本对,这里的样本数据采用LINSPACE(X1,X2,N)的函数生成。在本文当中,BP网络有三层构造。在这三层构造当中,第一层采用tansig激活函数;第二层采用logsig激活函数,在第三层则需要采用purline激活函数来进行。在网络训练当中需要用Matlab神经网络工具箱当中的L-M法的trainlm这个函数来进行计算。2.网络学习以及等级的评价通过MATLAB的神经网络工具箱上建立的模型,需要将学3.网络测试成效从评价的结果上来看,运用人工神经网络的评价方法最大限度地减少了人为因素的影响,在这其中可以在很大程度上减少因为传统方式而在设计权重过程当中的不确定性,通过这种方式来对评价的对象进行自动评价。同时,BP的神经网络这种评估方式本身也具有一定的局限性,例如对网络当中的隐层节点个数难以确定,在学习训练的过程当中最容易陷入局部最优的问题,在很大程度上会影响评价结果的精准性。

五、结束语

运用人工神经网络方式有效解决多源、多类型以及多属性地址处理和分析问题,在很大程度上突破了统计数学模型对预测的约束力和限制力。应用人工神经网络进行复杂的地址信息的非线性整合处理,可以精准的对各类资料进行综合分析和归类。

参考文献:

[1]李传杰.基于模糊数学及神经网络的心理评估模型[D].山东大学,2008

[2]徐振东.人工神经网络的数学模型建立及成矿预测BP网络的实现[D].吉林大学,2004

[3]邓丽琼,朱俊.基于BP神经网络的教师课堂教学评价模型[J].国土资源高等职业教育研究,2013

第8篇:神经网络的认识范文

关键词:ZISC78;径向基函数神经网络(RBFNN);实时;预报

1引言

神经网络是近年来得到广泛关注的一种非线性建模预报技术。它具有自组织、自学习、自适应和非线性处理、并行处理、信息分布存储、容错能力强等特性,对传统方法效果欠佳的预报领域有很强的吸引力。基于神经网络的非线性信息处理方法已应用于军事信息处理及现代武器装备系统的各个方面,并有可能成为未来集成智能化的军事电子信息处理系统的支撑技术。该技术在一些先进国家已部分形成了现实的战斗力。

船舶在波浪中航行,会受到风、浪和流的影响,因而将不可避免地发生摇荡运动。严重的摇荡会使船员工作效率下降、物品损坏、军舰的战斗力下降。如果能够预知未来一段时间船舶的运动情况,不仅有利于尽早采用先进控制算法控制舰载武器平台隔离船舶运动的影响,使其始终稳定瞄准目标,而且还可获得未来一个海浪周期内的船舶运动情况,以研究船载武器上层的控制策略,从而提高火力密度,因此,有必要研究在海浪中具有一定精度的海浪中船舶运动的短期预报。此外,如能有效准确地预报船舶的横摇运动,对于提高船舶的耐波性和适航性也有重要意义。

国内外学者也将神经网络用于船舶运动预报研究,但往往没有考虑实时性等实现问题,因而不能实用化。神经网络实现技术是神经网络研究的一个重要方面。神经网络实现可分为全硬件实现和软件实现两种。目前神经网络的实现还主要以软件模拟为主,由于现行的冯诺曼计算机体系结构不能实现并行计算,因而神经网络软件的实时应用还受到一定限制。

目前,一些著名集成电路制造公司如Intel、Mo-torola、松下、日立、富士通等均已推出自己的模拟或数字神经网络芯片,这些芯片无论在网络规模还是运行速度上都已接近实用化的程度,因而给神经网络应用的发展以极大的推动。由于舰载武器系统,需选用具有在片学习功能的神经网络芯片,即将网络训练所需的反馈电路及权值存储、计算和修正电路都集成在了一个芯片,因而可实现全硬件的、具有自学习能力的神经网络系统,也可以说,这是一种具有自适应能力的神经网络。

2ZISC78的功能及工作原理

ZISC78是由IBM公司和Sillicon联合研制的一种低成本、在线学习、33MHz主频、CMOS型100脚LQFP封装的VLSI芯片,图1所示是ZISC78的引脚排列图。ZISC78的特点如下:

内含78个神经元;

采用并行结构,运行速度与神经元数量无关;

支持RBF/KNN算法;

内部可分为若干独立子网络;

采用链连接,扩展不受限制;

具有64字节宽度向量;

L1或LSUP范数可用于距离计算;

具有同步/异步工作模式。

2.1ZISC78神经元结构

ZISC78采用的神经元结构如图2所示,该神经元有以下几种状态:

(1)休眠状态:神经网络初始化时,通常处于这种状态。

(2)准备学习状态:任何时侯,神经网络中的神经元都处于这种状态。

(3)委托状态:一个包含有原型和类型的神经元处于委托状态。

(4)激活状态:一个处于委托状态的神经元,通过评估,其输入矢量处于其影响域时,神经元就被激活而处于激活状态。

(5)退化状态:当一个神经元的原型处于其它神经元类型空间内,而大部分被其他神经元类型空间重叠时,这个神经元被宣布处于退化状态。

2.2ZISC78神经网络结构

从图3所示的ZISC78神经网络结构可以看出,所有神经元均通过“片内通信总线”进行通信,以实现网络内所有神经元的“真正”并行操作。“片内通信总线”允许若干个ZISC78芯片进行连接以扩大神经网络的规模,而这种操作不影响网络性能。

ZISC78片内有6bit地址总线和16bit数据总线,其中数据总线用于传输矢量数据、矢量类型、距离值和其它数据。

2.3ZISC78的寄存器组

ZISC78使用两种寄存器:全局寄存器和神经元寄存器。全局寄存器用于存储与所有神经元有关的信息,每片仅有一组全局寄存器。全局寄存器组中的信息可被传送到所有处于准备学习状态和委托状态的神经元。神经元寄存器用于存储所属神经元的信息,该信息在训练学习操作中写入,在识别操作中读出。

2.4ZISC78的操作

ZISC78的操作包括初始化、矢量数据传播、识别和分类等三部分。

初始化包括复位过程和清除过程。

矢量数据传播包括矢量数据输入过程和神经元距离计算过程。神经元距离就是输入矢量和神经元中存储的原型之间的范数。通常可选L1范数或Lsup范数:

其中,Xi为输入矢量数据,Xs为存贮的原型数据。

对于识别和分类,ZISC78提供有两种可选择的学习算法RBF和KNN。其中RBF是典型的径向基函数神经网络。在该RBF模式下,可输出识别、不确定或不认识的状态;KNN模式是RBF模式的限制形式,即在KNN模式下,新原型的影响域总被设为1,输出的是输入向量和存储原型之间的距离。需要指出的是,ZISC78具有自动增加或减小神经元个数以适应输入信号的分类和识别功能,神经元个数的最大值和最小值在全局寄存器组中设定。

2.5ZISC78的组网

一个ZISC78芯片内可以通过寄存器操作定义若干个独立的网络。若干个ZISC78芯片通过层叠可以组成一个更大的神经网络,组网芯片数量没有限制,小于10个ZISC78组网时,甚至连电源中继器件也不需要。所以,ZISC78具有最大的灵活性,能够满足不同的需要。

3仿真实例

为了验证ZISC78用于船舶运动实时预报的精度,本文对径向基函数神经网络预报进行了仿真,图4给出了基于径向基函数神经网络和船舶运动惯导实测信号预报的0.3秒(15步)误差曲线图。

通过以惯导实测数据ZHX_lg.dat为例预报0.3秒(15步)以后的船舶运动,作者运用相空间重构理论已经判断出本数据为非线性信号。

该仿真的最大预报误差方差为6.4666e-004,该数据可以满足战技指标。

第9篇:神经网络的认识范文

 

计算机网络的快速发展和技术的广泛应用给人们的生产生活提供了便利,但同时,也带来了一些不容忽视的安全隐患。近年来,影响计算机安全的因素很多,例如犯罪团伙利用网络等高科技进行犯罪的案例屡见不鲜。对此进行严格防范,更好地促进计算机和互联网的发展,需要对计算机网络安全进行评价,建立安全、有效的计算机网络评价系统,网络安全评价体系可以对整个计算机网络进行评估和分析,完善评价体系,使系统更准确、可靠,其中使用率最高的则是神经网络。

 

1 神经网络的概述

 

1.1 神经网络的简介

 

神经网络又被称为链接模型,它效仿了生物神经网络而建立,它以人脑的信息处理方式为基础,采用建立数学模型的方式研究大脑行为结构和生物神经元基本特征,世界上第一个神经网络模型是由数学家和生物学家共同提出。神经网络复杂多变,它是由神经元内部通过大量节点进行相互连接形成的一种网络结构,其中每个神经元都可处理信息,从而达到处理海量信息的规模。随后,计算机学家在原有的神经网络模型的基础上增加了学习机制,将神经网络技术应用在工程中,设计出了感知器神经网络模型,我国的计算机学家和数学家通过对神经网络的分析,展开长期的研究工作,掌握了模型的实质,研究表明,神经网络模型适合应用在不同的研究领域。

 

1.2 神经网络的功能

 

神经网络是一项人工智能系统,是通过生物神经网络的工作原理建立而来,它的应用具有全方位的优越性能。计算机神经网络系统还可实现预测功能,此功能为联想模式的升级版,主要运用于市场和企业中,例如股票等证券市场,预测功能可对股市证券和企业的未来效益进行预测分析,基于计算机的神经网络为市场和企业的发展提供了强有力的支持。正是有这些优越性能,神经网络系统在计算机网络安全评价过程中,才能发挥出最大的价值。

 

2 计算机网络安全概述

 

2.1 计算机网络安全的简介

 

计算机网络安全是指在网络环境中,采用先进的科学技术和网络管理控制措施来保证计算机资料能得以安全及完整的保护。计算机网络安全由逻辑安全和物理安全两大重要部分组成:第一,计算机的逻辑安全是指其中信息数据的保密性、完整性及可用性方面的内容;第二,物理安全包括了系统中的组网硬件和相关软件等方面内容,其具有可控性及可审查性等特点。在当今的计算机网络环境中,安全问题是关键,由于网络的开放自由性导致信息在传播过程中会受到硬件漏洞或者通讯协议方面的攻击,这不仅给本地用户带来威胁,对国际网络市场也是一种挑战。

 

2.2 计算机网络安全评价体系的建立

 

计算机网络安全评价体系的建立是对网络安全评价的一个强有力保障,该体系能全面、科学、客观的体现计算机网络中存在的不安全因素并且给出相对应的解决措施,所以应该根据多种综合因素设立评价体系中的评价指标,从而准确地反映评价信息,计算机网络安全评价系统的构建原则是:第一,可行性。在计算机网络安全评价体系构建过程中,结合实际的测评条件,因地制宜,才能有效的进行测评和操作。第二,准确性。在计算机网络安全评价体系的构建过程中,应当对网络安全的技术水平进行真实的体现,及时且准确的对安全信息进行监测分析再反馈到计算机网络中,使技术人员及时有效的解决产生的问题。第三,完备性。建立的安全评价体系,需确保所选指标对网络安全基本特征有全面的反映,进而提高评价结果的真实可靠性。第四,简要性。在选取评价指标的过程中,要选取具有代表性的,保证结果准确可靠从而降低工作量。第五,独立性。计算机网络是一个复杂多变的系统,在选取各项评价指标时,要避免出现重复选择的情况,减少指标间的关联度,从而客观准确的将计算机网络安全运行状态展现出来。计算机安全网络存在一定风险性,在安全保护上也存在难度,遵守以上原则,在实际工作应用中,提高计算机网络的工作质量和效率。

 

3 基于神经网络的计算机网络安全评价系统

 

在神经网络模型中,使用最为广泛的是BP神经网络模型,它采用最速下降法进行反向传播,调整相关数值,将误差降至最低。BP神经网络模型还通过误差逆传播算法,训练前馈多层网络。其算法简单,容易实现,具有非线性逼近能力。本文以BP神经网络为研究对象,对计算机网络安全评价进行分析。

 

3.1 神经网络的计算机网络安全评价模型设计

 

基于神经网络设计的计算机网络安全评价模型,由3个部分组成,分别是输入层、隐含层和输出层:(1)输入层。BP神经网络在设计的过程中规定输入层神经元节点的数量,与计算机网络安全评价指标数量必须一致,所以对模型输入层中神经元节点的数量确定需由二级指标的数量完成。例如,在安全评价体系中设计了10个二级指标,在计算机网络安全评价模型中输入层神经元节点数量也必须是10个。(2)BP神经网络模型在设计的过程中,采用单向隐含层,如果隐含层中的节点数过多会延长神经网络学习时间,如果隐含层节点数的数量过少则会降低神经网络的容错能力。所以隐含层中的节点数量对网络性能有较大的影响。(3)输出层。BP神经网络在输出层的设计工作即反映网络安全评价结果,依据输入层的评价设计,将输出层的节点数设为2个,则(1,1)的输出结果表示非常安全,(1,0)的输出结果基本安全,(0,1)的输出结果表示不安全,(0,0)的输出结果表示非常不安全。

 

3.2 神经网络的计算机网络安全评价模型学习

 

BP神经网络在计算机网络安全评价模型中需完成神经网络的学习,也就表示其在模型构建前需进行神经网络的训练工作,这使BP神经网络具有初始连接权,在完成神经网络的学习后,减少误差值,保证安全评价结果和使用者期望值达成一致。

 

3.3 神经网络的计算机网络安全评价模型验证

 

为确保计算机网络安全模型的应用效能,在完成设计与学习工作后,对其进行验证,首先选取样本数据,再将样本数据输入到模型中,通过模型内部检验分析,完成评价功能的应用,如果输出的安全评价结果与期望值达成一致,则说明基于神经网络的计算机网络安全评价模型具有准确性,可以使用。

 

4 结语

 

随着社会的发展,科学的进步,越来越多的先进信息技术和网络技术得以应用,计算机网络是一个复杂的系统,其中存在一定的风险性,计算机网络的安全问题是目前亟待解决的关键问题。在当前社会,神经网络技术广泛应用于各大领域,将神经网络模型与计算机网络安全相结合,遵守可行性、准确性、完备性、简要性、独立性原则,构建一个网络安全评价体系。有利于对计算机安全管理奠定基础,基于神经网络的计算机网络安全评价体系能使评价结果更具真实性和可靠性,但目前的神经网络技术并不十分成熟,根据其应用特点,将神经网络技术与其他技术相融合的发展问题,仍值得广大学者深入研究。通过本文的分析与研究,认识到神经网络的发展及特点,针对其功能的优越性,加大对神经网络的重视,提高安全评价体系对环境的适应力,提升体系的容错性,实现在线应用模式,促进其在计算机网络安全中的进一步完善和发展,为计算机网络安全评价提供保障,使神经网络在计算机网络安全评价中发挥更大的作用。

相关热门标签