前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络总结主题范文,仅供参考,欢迎阅读并收藏。
关键词:人工神经网络;神经元;可视化
中图分类号:TP183文献标识码:A文章编号:1009-3044(2008)36-2882-03
Analysis and Comparison Between ANN and Viewdata
ZHAO Chun, LI Dong
(Department of Computer Science, Xinxiang University, Xinxiang 453000, China)
Abstract: ANN and viewdata two calculating methods of obtaing new data by the dig and learrangement of the original data. This paper intends to make a general analysis of the featurcs of the two methods and a friof comparison between the two, and summed up the two algorithms and the similarity of common ground.
Key words:ANN; nerve cell; viewdata
1 引言
人工神经网络和可视化方法是数据挖掘中的两个重要的算法模型,两者都是根据模拟人脑和人的视觉神经与传统的数字计算机相比较而抽象出来的数据挖掘算法。可视化方法是人脑神经网络的一部分,它们之间存在着必然的联系,而算法又各有所异。随着数据挖掘技术的快速发展,存储在数据库中的数据量也迅速增长,这证明传统的关系数据库和存储图像、CAD(计算机辅助设计)图纸、地理信息和分子生物结构的复杂2D和3D多媒体数据库是合理的。许多应用都要用到大型的数据库,这些数据库有几百万种数据对象,这些数据对象的纬度达到几十甚至几百。面对如此复杂的数据时,我们常常面临着一些棘手的问题:应该从哪里开始着手?哪些是有用的数据?还有一些其他可用的数据吗?能得出答案的其他方法是什么?人们在寻求突破的同时反复地思考并询问复杂数据的专门问题。我们从人工神经网络和可视化方法的算法、特有属性进行横向和纵向的比较来找出他们的共同点和相似点。
2 人工神经网络算法与可视化方法性能比较
2.1 人工神经网络提供特有的属性和能力
1) 人工神经网络有超强的运算功能――人脑大约有1011个微处理神经元,这些神经元之间相互连接,连接的数目大约达到1015数量级[1]。每个神经元都相当一个微型计算机,把每个微型计算机链接起来就形成了一个超级计算机网络。
2) 由于人工神经网络相当于一个超级因特网,每个神经元都相当于一个微型计算机,对所有的任务都可并行,并且是分布式处理,其处理能力也是超强的――每个神经元节点都可以看作一个微型计算机,这样就形成了一个庞大的神经元网络。
3) 人工神经网络有归纳总结和分类的能力。――归纳总结和分类是人工神经网络对输入而产生合理的输出。
4) 人工神经网络有离散性。
5) 人工神经网络通过典型的实例中进行归纳总结。
6) 对整个网络有很强的适应性和快速的验证的能力。
7) 对整个人工神经网络的包容性。
8 对整个人工神经网络统筹能力。
2.2 可视化方法特有的属性和能力
1) 在正常情况下人对图像的信息比较敏感。而对数据的反映比较迟钝。
2) 人从图像视觉接受到的信息比从文本或表格上接受更快、更有效。比如“百闻不如一见”。
3) 人从图像视觉接受到的信息总是有选择的接受
4) 人的视觉选择的特征为形状、颜色、亮度、运动、向量、质地等。
这些筛选仍然是通过人庞大的神经网络中的部分神经元来处理的。其中进行的样本的学习能里以及自适应性得到了充分的体现。
2.3 人工神经网络和可视化方法的共同点
1) 对接受到的信息进行归纳处理。
2) 对接受到的信息进行转化,只是转化的方式不同。
3) 对接受到的信息进行筛选,并对接受到的信息产生合理的输出。
4) 容错性。
5) 从接受到的信息进行学习的能力。
2.4 人工神经网络和可视化方法的不同点
1) 人工神经网络是好比因特网,而可视化方法的计算网络好比计算机网络。可视化网络的计算能力只是人工神经网络很小的一部分。
2) 可视化方法虽然也是并行分布式处理的结构,但是它也只是人工神经网络分布式处理的很小部分。其速度要远远低于人工神经网络
3) 人的视觉和人工神经网络对信息的筛选的方式各有不同。
3 算法比较
3.1 人工神经网络
人工神经元是一个抽象的自然神经元模型,将其数据模型符号化为:
netk=x1wk1+x2wk2+ … … +xm wkm +bk
在ANN中输入和相应权重乘机的累加为xiwki(其中,i=1, ……m),一些输入xi,i=1, ……m,其中k是ANN中给定的神经元的索引,权重模拟了自然神经元中的生物突出强度[2]。
一个神经元就是一个微型计算机,它是一个ANN运转的最小单位,就像是整个因特网中的一台计算机。下例图1是人工神经元的模型。
从这个模型可以看出人工神经元是有三个基本元素组成:
第一、一组连接线。X1 、X2 、…、Xm,每个连接线上的Wki为权重。权重在一定范围类可能是正值,也可能是负值。
第二、累加器。将Xi与对应的权重值相乘的积累加。
第三、筛选函数。通过每个神经元经过函数筛选后输出数值。
同样,还可以用矢量符号来将其表示成两个m维向量的无向乘积:
netk= X・W
其中
X={x0, x1, x3,… , xm}
W={w0, w1, w3,… , wkm}
3.2 可视化方法
可视化技术在字典中的意思为“心理图像”,在计算机图形学领域。可视化将自身行为联系起来,特别是和人眼可以理解的复杂行为联系起来。计算机可视化就是用计算机图形和其他技术来考虑更多的样本、变量和关系。
可视化技术其目的是清晰地、恰当地、有见解地思考,以及有着坚定信念的行动。
基于计算机的可视化技术不仅仅把计算机作为一种工具,也是一种交流媒介,可视化对开发人类认知方面提出了挑战,也创造了机遇。挑战是要避免观察不出不正确的模式,以免错误地做出决策和行动。机遇是在设计可视化时运用关于人类认知的知识。
安得鲁曲线技术把每个n维样本绘制成一条直线。
f(t)=x1/1.41+x2sin(t)+x3cos(t)+ x4sin(2t) +x3cos(2t)+ …
其中t为时间域,函数f(t)把n维点X=(x1, x2, x3, x4, …,xn)
将f(t)进行部分变换:
f(t)= X・W
其中
X={x0, x1, x3,… , xm}
W={w0, w1, w3,… , wkm} (w0= sin(t),w1= cos (t))
这种可视化的一个好处是它可以表示很多维,缺点是要花很多的时间计算,才可以展示每个维点。这种几何投影技术也包括探测性统计学,如主成分分析、因子分析和纬度缩放。平行坐标可视化技术和放射可视化技术也属于这类可视化[3]。
3.3 人工神经元模型与可视化化方法中的安得鲁曲线技术分析与比较
人工神经元是一个抽象的自然神经元模型,将其数据模型符号化为:
netk=x1wk1+x2wk2+ … … +xmwkm+bk
netk= X・W
安得鲁曲线技术把每个n维样本绘制成一条曲线。这种方法与数据点的傅立叶转换相似。它用时间域T的函数f(t)来把n维点X=(x1,x2,x3,x4, …,xn)转换为一个连续的点。这个函数常被划分在-∏≤t≤∏区间。
f(t)=x1/1.41+x2sin(t)+x3cos(t)+ x4sin(2t) +x3cos(2t)+ …
f(t)= X・W
人工神经网络和可视化方法部分算法比较可以近似的计算认为:
netk= f(t) =X・W
通过对人工神经网络和可视化方法公式的整理可以得出它们有着很多的共同性和相似性[4],在容错允许的情况下其算法为:
F(t)= X・W
其中F(t)可表示为人工神经网络
F(t)= netk
或可视化方法
F(t)= f(t)
4 kohonen神经网络
Kohonen神经网络也是基于n维可视化的聚类技术,聚类是一个非常难的问题,由于在n维的样本空间数据可以以不同的形状和大小来表示类,n维空间上的n个样本。
Mk=(1/n)
其中k=1,2,…,k。每个样本就是一个类,因此∑nk=N。[5]
Kohonen神经网络可以看作是一种非线性的数据投影这种技术和聚类中的k-平均算法有些相似。
可见,Kohonen神经网络属于可视化方法也属于神经网络算法。
5 结束语
现代世界是一个知识大爆炸的世界。我们被大量的数据所包围着,这些数据或是整型的、或是数值型或其他类型,它们都必须经过各种方法的分析和处理,把它转换成对我们有用的或可以辅助我们决策和理解的信息。数据挖掘是计算机行业中发展最快的领域之一,原始数据在爆炸式的增长,从原始数据中发现新知识的方法也在爆炸性地增长。人工神经网络和可视化方法是两种对海量数据进行数据挖掘整理的不同算法,通过以上纵向和横向的对比,我们可以发现它们的相似性和共同点:对接受到的信息进行归纳处理、转化、筛选、容错性、并对接受到的信息产生合理的输出。在应用中可以根据它们不同的属性和能力选择不同的算法。
参考文献:
[1] Tang,Z H.数据挖掘原理与应用[M].北京.清华大学出版社,2007:74.
[2] Kantardzic M.数据挖掘[M].北京.清华大学出版社,2002:89.
[3] 李守巨,王吉.基于概率神经网络的岩土边坡稳定性预测方法[J].岩土力学,2000(2).
[4] Tam C M, Tong T K L.Diagnosis of Prestressed Concrete Pile Defects Using probabilistic Neural Networks[J].Engineering Structures,2004,26(8):1155.
关键词:图像复原 BP神经网络 Hopfield神经网络 应用
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2013)11-0040-02
1 引言
图像复原是一项富有现实意义的工作,它涉及到广泛的技术领域,是图像处理领域研究的焦点之一。在得到图像的过程中,由于各种各样的原因,包括与观测对象的相对运动、介质散射、成像系统缺陷和环境噪声等原因,使得最终的图像都会有一定程度的退化。图像复原就是从退化的图像中恢复图像的本来面目。传统的图像复原处理问题的关键在于建立退化模型,估计退化过程中的参数,由此通过相应的逆过程得到原始图像。获得准确的图像退化模型是比较困难的事情。大多数图像复原的实际问题是点扩展函数以及原始图像均未知的盲复原问题,这类问题具有更严重的病态性因而进一步增加了解决的难度。人工神经网络(Artificial Neural Network,ANN)为图像复原问题的解决提供了另外一条路径,这是基于人工神经网络具有的模拟人类神经的非线性、自组织、自学习、自适应特性。一般而言,人工神经网络适合于解决无法或很难精确建立数学模型、不完全清楚内部机理的问题,人工神经网络的很多特性适合解决图像复原问题。近些年来,对人工神经网络应用于图像复原的研究越来越多,形成了很多丰富的神经网络模型和算法。BP(Back Propagation反向传播)和Hopfield(霍普菲尔德)是典型的人工神经网络类型,也是在图像复原领域应用较多的神经网络类型。
2 BP神经网络在图像复原中的应用
2.1 BP神经网络的特性
BP神经网络是上世纪80年代美国加州大学的Rumelhart、McClelland及其团队研究并行分布信息处理时提出的采用反向传播算法的多层前馈网络。BP神经网络具有良好的泛化能力,其隐层的非线性传递函数神经元可以学习输入输出之间的线性或非线性关系。在1989年,RobertHecht-Nielson证明了对于任何一个在闭区间内连续的函数都可以由具有一个隐含层的BP网络来逼近,这样,一个三层(输入层、隐层和输出层)的BP神经网络即能完成对多维度函数的逼近。这些特性,使得选用BP神经网络简单地实现在未知点扩展函数的情况下,拟合原始图像与退化图像之间的关系,从而得到满意的图像复原结果成为可能。
2.2 BP神经网络应用于图像复原
BP神经网络用退化图像与相对应的原始图像进行训练,退化图像为网络的输入,原始图像为网络的输出。训练完成的神经网络会在退化图像与原始图像之间建立非线性的映射关系,使得利用这种非线性关系即可实现在只有退化图像的情况下对齐进行复原。
利用BP神经网络进行图像复原,一般用输入图像的N×N邻域内的N2个像素点对应输出图像的一个像素点。这样的对应方法会使整个运算量增大,但正由于参与运算的像素点增加,使得网络具有更好的泛化和鲁棒能力。由于三层BP神经网络可以任意精度逼近某一多维度函数,因而其应用于图像复原时使用三层网络结构。输入层和输入层节点数分别由输入图像像素数量和输出图像像素数量决定,隐层节点数量和训练方法在很大程度上决定了网络性能。
为了便于网络计算,通过神经网络计算前通常将输入图像进行归一化。以灰度图像为例,将图像数据[0~255]转换到[-1~1]或[0~1]。图像经过神经网络复原后还需进行反归一化转换,将计算得到的数据转换为图像数据,即将[-1~1]或[0~1]转换到[0~255]。
通常,运用BP网络进行图像复原算法流程包括:(1)图像的预处理,得到归一化的便于神经网络计算的数据;(2)使用退化图像与对应的原始图像(训练BP神经网络;(3)将待复原图像输入训练好的BP神经网络进行图像复原;(4)数据的后处理,将网络输出数据进行反归一化,得到复原图像。
3 Hopfield神经网络在图像复原中的应用
3.1 Hopfield神经网络的特性
不同于BP神经网络,Hopfield神经网络是一种单层反馈网络,信号在网络中不仅向前传递,还在神经元之间传递。图1是有三个神经元的Hopfield神经网络结构图。Hopfield神经网络由美国加州理工学院物理学家J·J·Hopfield在上世纪80年代提出,并首次在神经网络研究中引入了计算能量函数的概念,通过研究网络的稳定性与计算能量函数的相关性给出了网络的稳定性判据。J·J·Hopfield运用Hopfield神经网络成功地探讨了旅行商问题(TSP)的求解方法。HNN神经网络采用灌输式学习方式,其网络权值是事先按一定规则计算出来的,确定之后不再改变,各神经元的状态在运行过程中不断更新,网络稳定时各神经元的状态便是问题的解。Hopfield神经网络的这些自身特征使其适于应用于联想记忆和求解最优化问题。
3.2 Hopfield神经网络应用于图像复原
利用神经网络进行图像复原的方法分为两类:一种是用原始图像和模糊图像构成的样本训练神经网络,在训练好的网络中建立起原始图像与模糊图像的非线性映射关系,然后以带复原的模糊图像作为网络的输入,经过网络输出的图像数据就是经过复原的图像,BP神经网络就是运用这种方法进行图像复原的典型神经网络。另一种是经过神经网络反复的数学迭代计算复原,运用Hopfield神经网络进行图像复原属于这类方法。
其中是神经网络的状态向量,为网络的权值矩阵,为由网络中各神经元阈值构成的向量。Hopfield神经网络的运行结果即网络达到稳定状态就是达到最小值时的状态。由式(4)和(5)可以看出图像复原的目标函数与Hopfield神经网络能量函数具有相似的表达形式,因而可以建立两者之间的联系,从而将图像复原问题转变为神经网络的运算问题,这也就是Hopfield神经网络应用于图像复原的基本原理。
运用Hopfield神经网络解决图像复原问题首先要确定网络的权值矩阵。可以按照Hebb学习规则得出[4]。完成网络初始化后,将退化图像输入网络,从网络中选取一个神经元按照Hopfield神经网络的运算规则得出神经元的输出,将所有神经元求出输出后判断该网络是否达到稳定状态,即计算前后的网络能量函数的误差是否小于要求的范围。如果网络不稳定,需要重复迭代计算;网络达到稳定状态时,神经网络的状态向量就是要求的原始图像。经过一定的后处理就能得到具有一定精度的原始图像。
4 结语
人工神经网络在图像复原问题中的应用已经扩展到了很多方面,包括三维显微图像、高能闪光照相等领域[5-6]。神经网络在图像复原中的应用机理也不断得到深入研究。这些得益于神经网络算法不依赖求解问题本身数学模型的特点,以及自身强大的泛化能力。BP和Hopfield神经网络都能成功地运用在图像复原问题中,在选用神经网络进行图像复原研究时要注意到BP神经网络强烈地依赖退化图像与原始图像构成的样本集合对网络进行训练,这就要求得到足够的先验知识或者通过某种算法得到退化图像与原始图像相对应的样本群。Hopfield神经网络不依赖于退化图像与原始图像的先验知识,可以直接针对退化图像进行复原。这就需要根据不同的实际情况选取合适的网络类型来解决问题。
参考文献
[1]尚钢,钟珞,陈立耀.神经网络结构与参数选取[J].武汉工业大学学报,1997,19(2).
[2]王晗.基于Hopfield神经网络的图像恢复[D].武汉:华中科技大学南京理工大学,2006年4月.
[3]席旭刚,罗志增.用Hopfield神经网络实现触觉图像恢复[J].仪器仪表学报,2008,30(10).
[4] Bianchini M,Frasconi P.Learning without local minima in radial basis function networks[J].IEEE Transaction on Neural Networks,1995,6(3):749~756.
BP(Back Propagation)神经网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hidden layer)和输出层(output layer)。
二、BP神经网络在坐标转换中的应用
坐标转换基本思路: 首先就是要建立网络的模型结构, 即确定层数、每层的神经元数和功能函数; 其次, 建立网络的学习规则, 利用样本数据(WGS284 椭球大地坐标和北京54 坐标) 对网络进行训练, 确定网络中的各个权矩阵和偏差向量, 使得网络输出值与实际值在一定准则之下尽可能吻合, 从而完成坐标的转换。
三、数据计算
本次设计选用MATLAB语言为作为编程语言,BP神经网络为理论基础。MATLAB语言是一种解释性执行语言,它灵活、方便,其调试程序手段丰富,调式速度快,需要学习时间少,而且MATLAB语言与C语言、VB、Java有很多相似之处,可以相互调用。由于MATLAB软件里有很多神经网络函数,使用MATLAB建立BP神经网络非常方便。
1、指令格式
四、分析总结
1、在应用BP神经网络转换GPS坐标时,网络结构的设计非常重要,训练函数和传递函数选择、网络隐含层数确定、隐含层节点数的确定、网络训练次数的选择非常重要,在选择函数、层数和节点数时,对于大量数据的处理应该考虑计算机的性能,以选择合适的函数使计算机能够运行且稳定,学习速率选择、初始权值等的选择可以根据坐标转换精度要求确定;
2、BP神经网络转换坐标时,由于所选择的函数不同,网络的性能也不同,本文由于数据位数较大,没有合适的数据压缩模型,所以采用了线性函数purelin作为传递函数,对于purelin函数,网络节点数和层数的增加都会增加网络的训练时间,这一点与其他函数不同;
3、本文设计的利用网络误差作为评价标准选择神经网络的节点数的选择效果良好,值得推广;
4、利用神经网络进行坐标转换, 其内插的精度很高, 外推精度较低;
5、利用神经网络进行坐标转换是完全可行的,其模拟精度可达到厘米级;
6、神经网络方法对GPS坐标联测点数目要求较少,可以解决已知点较少的测区GPS坐标转换问题,且效果较好,这对于充分利用GPS坐标信息,减少坐标测量外业,有着一定的现实意义。用神经网络方法转换GPS坐标的优点还在于它可以利用地面坐标系或WGS-84坐标系中的数据直接获得所需要的坐标。网络通过学习形成的是数据集之间的映射,不需要先进行坐标类型转换,然后再进行坐标转换。这样也就不会有中间环节的精度损失。总的来说,用神经网络方法可能解决已知点较少的测区中GPS坐标转换问题;
计算机网络技术已经逐渐发展成为广泛应用于人们日常生产生活的重要技术,而在实际的使用过程中,却难免要遇到安全隐患,例如黑客的入侵、安全漏洞和病毒传播等。在计算机网络安全的评价体系中,神经网络的应用以其能够形成非线性自适应动态系统的特点,迅速适应网络环境,进而实现对信息的运算、识别和控制功能,提高了计算机的工作效率和安全性。
2计算机网络安全的概念
计算机的网络安全,主要指的是针对网络信息浏览和操作等过程中的安全管理,以达到提高网络信息保密性、安全性的目的,维护使用者的合法权益,最终实现整个网络的顺利运行。我国当前的计算机网络安全问题通常涉及到信息安全、计算机网络技术等多个方面,而伴随计算机网络的日益普及,其网络信息的安全问题更加为人们所重视。例如,对于企业而言,其日常经营活动中往往会运用到计算机网络,因此要求网络必须具备核心技术,对企业信息实施保护和保密,维护重要内部信息的安全性,从而维护企业利益。即便是个人在使用计算机网络时,也同样需要网络对个人信息实施控制与保护,防止泄漏或被不法分子盗取,损害人民的权益和实际利益。
3神经网络概述
3.1概念
所谓神经网络,其模型建立的基础,是人体脑部的信息处理模式作为参考,然后运用数学模型,模拟生物的神经元、脑细胞结构,以及其生理特征,最终模拟获得该神经网络模型。此后,计算机专家则以此模型为基础,添加入编制好的学习机制,然后将其应用到实际工程中,最终开发出了感知器神经网络模型。该模型具备了声纳波的识别功能,可用于探测潜艇位置等实践中。经过进一步的深入研究,相关研究人员在其中运用了映射拓扑性质,在计算机的基础之上建立了映射自组织网络模型;继而通过分析研究生物自组织神经网络,确定神经网络模的实质,获得一组微分非线性方程,然后将神经网络应用于实际,最终形成了神经网络的系统性科学研究,例如具有一定代表性的BP神经网络。
3.2神经网络的优越性
神经网络建立的基础是生物大脑结构和工作原理,因而属于人工智能系统,该系统基于计算机网络内部大量节点的关系分析,发挥出方面优越的应用性能,主要包括以下方面:
3.2.1自学功能
神经网络系统能够进行自我学习,通过自动识别正在输入的信息,自行为操作者总结相关的规律,进而形成联想的模式。其优势即在于这种对于信息的识别能力,使系统能够在之后的工作中,进行独立自动运作,从而缩短操作人员的工作时间。现有计算机神经网络系统,甚至能够实现高于联想模式的预测功能,应用于证券市场中,系统可以基于对当前股市证券、市场经济和企业现状的研究分析,预测其未来的效益,从而企业未来的良性发展,提供了有力的智能支持。
3.2.2优化系统
神经网络同时还具备了自我优化的能力,可以自行提高计算机运转能力,同时帮助操作用户,针对某些问题提出解决方案。基于此,神经网络系统被建议应用于计算机的网络安全评价中,以发挥其自身的优越性能。
4计算机网络安全评价中神经网络的应用
4.1计算机网络安全评价体系的构建
4.1.1构建神经网络体系的必要性
基于神经网络的计算机网络安全评价保护是多元化的,由于其对于环境的适应力较强,因而能够迅速适应周围状况,并对自身进行调整,以降低误差。另外,神经网络的自我训练使其能够在计算机网络安全评价的体系中,实现自我总结和完善。此外,神经网络还具备了良好的容错性,对于一些不完整信息、噪声等并不敏感,因而在网络节点出现问题时,不会对神经网络的整体保护产生影响。且神经网络在进行自我训练之后,能够将正常的工作效率提升至常规的4~5倍。加上神经网络对于结果的获取高效快捷,因此更加便于使用,其各方面的设置也更加人性化。
4.1.2安全评价体系构成指标
计算机网络安全的一级评价,其中的指标通常包括:管理安全、物理安全以及逻辑安全,具体如下:①管理安全评价指标时二级指标,分别为安全组织体系、安全管理制度、人员安全培训以及应急响应机制;②物理安全评价指标为二级指标,包括防电磁泄漏措施、供电线路、网络机房、容错冗余以及设备安全;③逻辑安全评价指标同样是二级指标,包括数据的备份、恢复,访问的控制、软件安全、防病毒措施、系统审计、数字签名、数据加密以及入侵防范。
4.2实现评价指标的标准化
不同的评价指标集,对于影响因素的描述也存在差异,因此需要在实施定量、定性评价时有所侧重。此外,应当合理运用科学的方法,对计算机的网络安全情况作出反应,因而一定程度上影响了指标的客观对比。因此,必须保持客观的态度,对评价指标的取值规则进行调整,以实现指标的标准化。在定量指标评价时,相关工作人员应当结合计算机网络系统的实际运行状况,对其进行客观评价与取值,进行科学的分析。此外,对于不同的评价指标,应当使用不同的衡量单位,有所侧重地进行标准化处理,将取值固定到一定范围内,通常在0~1之间。而为了实现定性指标评价,则通常会采用打分的方式来客观评价计算机的网络系统机型,定性指标评价标准化。
4.3基于神经网络的计算机网络安全评价构建
4.3.1服务器维护机制规范化构建
构建计算机网络安全评价体系,其首要的任务和硬件维护的关键,即在于服务器维护。在构建服务器维护机制规范化的过程中,应当注意避免不当服务器所可能造成的伤害,要求操作人员时刻警醒,保证及时清除网卡冗余,调整服务器的荷载,以维持服务器的平衡与稳定。
4.3.2云主机的建立
以神经网络为基础建立的计算机网络安全评价体系,需要快速打造安全云主机,用以集成包括了云锁服务安全软件的所有安全防护体系,从而达到突破传统服务器安防理念,实现对于用户的实时安全服务效果。因此,构建过程中需要在云主机中使用很多快捷自动安装软件,如MYSQL、PHP、ASP等。这些软件的共同点在于均适用于对网站数据库的实时管控、对于站点信息的实时监控,以及对于计算机各种软件温度进行的调节,和WebShell病毒查杀功能。如今的计算机网络安全系统已经首创了以C/S的神经网络架构为基础的应用体系,实现了计算机端和服务器之间的远程访问与控制功能,从而提升了计算机网络对于木马、病毒和恶意代码、恶意攻击等危害的防御能力,起到保护计算机服务器与网站安全的作用。
4.3.3安全管理和服务体系的建立
基于神经网络建立起来的计算机网络安全评价体系,其作用即在于在进行安全评价时,管理人员能够提供与评价标准判定相对应的具体内容、实施范围等信息,然后针对计算机安全状况、信息技术的关键点,实施研究与分析,运用评价方法测算其安全等级。计算机网络的安全级别评价,可以按照以下公式生成评价因子,基于神经网络的计算机网络安全评价级别公式如下:f=(x1,x2,x3……,xi……xm)式中:xi-计算机网络安全评价中最主要的评价因子;f-计算机网络安全评价模型主体。管理人员应当结合实际,为计算机系统选取正确的评价模型主体与安全等级,进而依据系统要求,对神经网络安全管理体系采取必要的优化措施,以做到有备无患。
4.4建立并完善评价结果评语集
基于计算机网络安全评价指标特征,可建立评价结果评语集,按照网络安全等级差异,将该评语集划分为四个集合:①第一等集合设置为“安全”;②第二等集合设置为“较为安全”;③第三等集合设置为“不安全”;④最后一个等集合则设置为“很不安全”。此外,还可以对这些集合附以说明,从而有效地位计算机使用者提供便捷的方式,来了解计算机网络安全状况,提供良。
5结语
神经网络技术在计算机网络安全评价中的应用,实现了评价体系的自动抽提功能,体现出了外推性、容错性、适应性等优势,满足了计算机网络的在线实用性要求,在有效提高计算机网络评价客观性、正确性的同时,为用户提供了安全的使用环境,确保用户能够通过网络获得可靠、有效的数据信息。
参考文献
[1]王强.基于神经网络的计算机网络故障诊断[J].信息与电脑:理论版,2015(10):157~158.
关键词:模糊神经网络,训练函数,学习函数,性能函数
中图分类号: TP391 文献标识码: A
模糊神经网络( fuzzy neural network,FNN) 是模糊逻辑推理与BP神经网络的结合,利用误差信号反向传播、调节权重,具有良好的自适应性、自组织性和很强的自学习能力,是数据分类和模式识别的有力工具,目前,模糊神经网络在临床疾病诊断中的应用日益广泛[1-4] 。消化道系统中的急性胰腺炎、胆囊炎(胆石症)、急性胃肠炎等疾病之间,由于有很多相似的症状体征,从而极容易引起误诊,为了能对这些疾病进行准确的辅助诊断,本文将消化道系统中急性胰腺炎、胆囊炎(胆石症)、急性胃肠炎等疾病的诊断技术引入模糊神经网络,借助模糊神经网络的模式识别来进行诊断。
1 资料与方法
1.1 一般资料 收集了2011年1月~2012年10月南昌大学第四附属医院的100例消化道系统疾病患者的各种检测结果,100例患者中胆结石伴胆囊炎患者30例,急性胆囊炎10例,急性胃肠炎32例,急性胰腺炎28例,诊断结果均得到病理证实。
1.2 数据预处理 提取胆结石伴胆囊炎患者、急性胆囊炎患者、急性胃肠炎患者、急性胰腺炎患者的血液分析及生化筛查等39项检测数据和7项临床症状为第1层的输入向量。7个临床症状通过利用模糊数学的"降半梯形"结构的录属函数来赋值:
其中, yji为第i 个对象对第j 类症状的隶属函数 ,其定义域为[0 ,λ(2)m (i)] 。
1.3 模糊神经网络模型的建立: 由3层前向BP神经网络组成。第1层为数据预处理层,先提取患者的46个特征值再对其进行模糊化处理;第2层为隐含层;第3层为输出层,输出层为消化道系统的四种疾病,其结构如下图(图1):
2 模糊神经网络临床诊断的实现
2.1 网络训练 从全部样本中随机抽取70 例(胆结石伴胆囊炎21例,急性胆囊炎6例,急性胃肠炎23例,急性胰腺炎20例)作为训练组,15例作为验证组(胆结石伴胆囊炎6例,急性胆囊炎3例,急性胃肠炎2例,急性胰腺炎4例),15例为测试组(胆结石伴胆囊炎3例,急性胆囊炎1例,急性胃肠炎7例,急性胰腺炎4例)。用MATLAB 2012a编程,分别对FNN 进行训练,并用完成训练的网络模型进行验证和测试。网络的训练函数为trainlm,学习函数为learngdm,误差性能函数为mse,各层的传递函数为logsig,训练次数设置为1000。
2.2 仿真诊断结果 通过神经网络的训练、验证和和测试,在训练次数达到40次时,训练、验证和和测试误差同时达到最小,其中验证误差稍大一点,但也只有2.99 ,见图2:
从图2中可以看出,模糊神经网络(FNN)具有较快的收敛速度,只用了40次训练,就使训练误差、验证误差、测试误差都同时达到最小,从而使仿真诊断测试的准确率能大大提高。为了能了解模糊神经网络临床诊断的效果,于是把训练组、验证组和测试组的诊断结果进行对照,见表1:
3总结
将神经网络技术与模糊理论结合构起来进行医学知识处理是一种很好的方法,这种方法也适用于其他它领域的知识处理,该系统的识别能力与训练集关系密切,若能搜集更多的典型病例,系统的识别能力将进一步提高。
参考文献:
[1]黄永锋, 岑康等. 模糊神经网络在颅脑磁共振图像分割中的应用研究[N]. 中国生物医学工程学报, 2003, 22( 6) : 508-512.
[2]徐力平,尚丹. 模糊神经网络在肺癌CT 诊断中的应用[N]. 郑州大学学报(医学版),2014,49(2):191-194.
【关键词】PCA神经网络算法阈值区低功耗低面积积分器
一、引言
本文中为实现植入式的脑电信号特征提取,而设计的一种基于模拟模块的硬件实现方法,实现对神经spike信号的神经网络算法的特征提取的PCA2-1网络,本文的神经网络算法的硬件完全采用模拟电路来实现,以满足植入式的芯片,需要具有低功耗,低面积的特点。本文中的特征提取选择了主成分分析法(PCA),采用基于PCA算法的全模拟电路实现架构,由具有足够线性范围的模拟乘法器,基于亚阈值区的积分器,合理的加法器模块,来实现设计低功耗,低面积的神经信号处理电路。最终验证通过模拟电路实现的神经特征提取电路的权值变化和MATLAB计算出的权值变化相一致,以此来证明该系统的正确性。
二、PCA神经网络
主分量分析的目的在于减少数据维数。其基本思想是提取出空间数据中的主要特征(主分量),减少数据冗余,去掉数据相关性,使得数据能够在一个低维空间来处理。它确定一个方向向量w,使得输入向量x在该方向上的投影y=wTx的方差最大。PCA神经网络克服了传统方法的缺点,它通过学习自动收敛到主分量方向而不用计算相关矩阵[2]。本文中的实现PCA的神经网络为一个单层的前向网络。
本文中的基于神经网络的PCA的算法实现步骤如下:
(1)在t=1时,用小的随机数赋给主元神经网络的权值,另权值修正系数为一小的正数;
(2)对于在t=1,从训练样本集中选取样本输入网络,计算:
由于积分器的输出是权值w,所以对输出幅度有较高要求。本文采用的积分器的OTA为两个单端输出的镜像电流源结构。这样输出的幅度是全差分双端输出的2倍。而且两个单端输出很好的提高了电路的共模抑制比CMRR。OTA的输出级为共源共栅的结构,这让OTA的输出
图3为对输入数据进行长时间的仿真后数据的图像特性,可以看出w的值有很好的收敛特性。
三、总结
PCA算法在噪声比较大的情况下容易聚类失败,而本文中的系统是作为已经实现的低噪声放大器和NEO信号去噪检测之后的一级,所以选取PCA作为特征提取的方法是可行的。本文设计了一种基于神经网络算法的信号特征提取的硬件实现,采用了完全的模拟电路来实现。并根据算法的特点,合理的选择和改进积分器电路和乘法器电路的拓扑结构,来实现电路的功能。并实现了系统的低功耗,低面积的特点。有利于集成于植入式系统的实现。通过对输入一组方波数据的仿真,通过短时间来验证瞬态输出的准确性,而长时间的仿真来验证该系统可有效的让权值w收敛。
参考文献
[1] Hongge Li, Zhao Wei, Zhang Youguang. Micropower fully integrated CMOS readout interface for neural recording application[J]. 2010, 50(2): 273-281.
[2] Oja E. Principal Components, Minor Components, and Linear Neural Networks[J]. Neural Networks, 1992,5(6):927-935.
关键词:负荷预测 RBF 神经网络 电力系统
0 引言
负荷预测是实现电力系统优化运行的基础,对于电力系统的安全性、可靠性和经济性都有着显著影响。负荷预测是指从已知的经济、社会发展和电力系统需求出发,考虑政治、经济、气候等相关因素,通过对历史数据的分析和研究,探索事物之间的内在联系和发展规律,以未来经济和社会发展情况的预测结果为依据,对未来的电力需求做出估计和预测[1]。相关研究工作已在国内广泛开展,其研究成果已经广泛应用到电力系统实际运行维护当中,并取得了良好的经济效益。
负荷预测的方法主要分为两大类,分别是基于参数模型预测法和基于非参数模型预测方法。基于参数模型的预测方法主要有单耗法、负荷密度法、电力弹性系数法、回归模型预测法、趋势外推预测法、时间序列预测法等;基于非参数模型预测方法主要有专家系统法、模糊预测法、灰色预测法、人工神经网络预测法、小波分析预测法等[2]。
RBF神经网络具有良好的函数逼近功能,在函数回归上表现出较好的性能,已被广泛应用到人工智能领域。在负荷预测方面,RBF也得到了广泛的应用。本文的主要工作是整理了主要的基于RBF的电力负荷研究内容,对存在的问题进行了分析,并对未来的发展进行了展望。
本文接下来的内容安排如下,第二章介绍了RBF神经网络的基本原理,第三章对基于RBF的电力负荷研究进行了综述,最后给出了总结。
1 RBF神经网络基本原理
RBF网络的结构与多层前向网络类似,如图1所示,它由三层组成:第一层为输入层,第二层为隐含层,第三层为输出层[3]。
假设RBF神经网络的输入向量为n维,学习样本为 (X,Y),其中,X=(X1,X2,…XN),为输入向量,Xi=(Xi1,Xi2,…,XiN)T,1≤i≤Nj;Y=(y1,y2,…,yN),为期望输出;N为训练样本个数。当神经网络输入为Xi时,隐含层第j节点的输出如式(1)所示[4]。
对于全体输入学习样本,RBF神经网络的输出如式(2)所示。
2 基于RBF负荷预测相关研究
文献[4]通过建立径向基(RBF)神经网络和自适应神经网络模糊系统(ANFIs)相结合的短期负荷预测模型来应对实时电价对短期负荷的影响。由于固定电价时代的预测方法在电价敏感环境下效果不理想,文章根据近期实时电价的变化应用ANns系统对RBF神经网络的负荷预测结果进行修正,提高预测效果。
文献[5]研究了基于RBF神经网络的多变量系统建模。文章将正规化正交最小二乘算法引入多输入多输出系统,进行相关研究,建立了基于RBF神经网络的多变量系统的模型。对电厂单元机组负荷系统进行建模仿真研究的结果表明,用该方法建立的多变量热工系统的非线性模型是有效的,具有较高的辨识精度和较好的泛化能力。
文献[6]提出了一种基于交替梯度算法的RBF神经网络,并将之应用到负荷预测领域,取得较好的效果。通过使用交替梯度算法来优化RBF输出层权值和中心与偏差值来得到改进的RBF算法。与传统梯度下降算法相比,改进的RBF算法具有更高的预测精度和更快的收敛速度。模型综合考虑了气象数据、日类型等影响负荷变化的多种因素,实验结果表明改进的RBF网络算法具有更优的性能。
文献[7]将RBF神经网络和专家系统相结合,在深入研究天气和特殊事件对电力负荷的影响的基础上,提出了新的负荷预测模型。利用RBF神经网络的非线性逼近能力预测出日负荷曲线,然后利用专家系统根据天气因素或特殊事件对负荷曲线进行修正,使其在天气突变等情况下也能达到较高的预测精度。表1为文献[7]的实验结果对比表。
文献[8]将模糊聚类分析中的隶属度应用到负荷预测应,通过隶属度原理得到一批与预测日在样本信息上类似的历史日。采用模糊聚类分析获得的样本作为RBF神经网络的训练样本,并应用改进的RBF神经网络进行训练,在不需大量训练样本的前提下实现对短期负荷的预测。
影响电网负荷预测的因素很多,而地区电网负荷易受气象因素影响,文献[9]针对电网负荷预测以上特点,把气象因素作为影响负荷的主要因素,采用模糊规则控制的径向基神经网络(RBF)算法,对某地区电网的日负荷数据进行预测,实验证明采用这种预测方法可以提高负荷预测的速度和精度。表2给出了文献[9]的实验结果表。
3 结束语
本文针对基于RBF神经网络负荷预测进行了综述,但由于文章篇幅的原因,不能将所有的方法列举出来,只列举了具有代表性的方法,希望能起到抛砖引玉的作用。
参考文献:
[1]肖国泉,王春,张福伟.电力负荷预[M].北京:中国电力出版社,2001.
[2]李昀.电力系统中长期负荷预测方法研究与应用[D].2011.
[3]张师玲.基于RBF神经网络与模糊控制的电力系统短期负荷预测[D].江苏大学,2010.
[4]雷绍兰,孙才新,周等.基于径向基神经网络和自适应神经模糊系统的电力短期负荷预测方法[J].中国电机工程学报,2005.
[5]刘志远,吕剑虹,陈来九等.基于RBF神经网络的单元机组负荷系统建模研究[J].控制与决策,2003.
[6]郭伟伟,刘家学,马云龙等.基于改进RBF网络算法的电力系统短期负荷预测[J].电力系统保护与控制,2008.
[7]张涛,赵登福,周琳等.基于RBF神经网络和专家系统的短期负荷预测方法[J].西安交通大学学报,2001.
关键词:矩形混凝土柱;屈服位移;人工神经网络;预测模型
中图分类号:TU375.3 文献标识码:A
文章编号:1674-2974(2015)11-0017-08
随着社会经济的发展,以及对近些年大地震的不断反思,基于性能的结构抗震设计已成为地震工程领域研究的热点问题和前沿发展方向,为众多国家的规程所提及或者采用(如FEMA273[1],FEMA356[2],ASCE41[3]和Eurocode8[4]).柱子作为实际结构中承受竖向荷载和抵抗水平荷载的关键构件,其屈服位移的合理评估对于性能化结构抗震设计中结构的动力响应、结构性能水准的评估和抗震延性设计有很大影响.综合以往对柱子屈服位移的研究,其定义不明确,经验理论模型预测结果离散度较大的特点,使柱屈服位移的合理取值成为一个亟待解决的问题.
对于柱屈服位移的定义,国内外研究者提出了不同的看法,如Park在文献\[5\]中总结了4种不同的定义方法,并推荐使用割线刚度的方法定义屈服位移.Panagiakos[6]认为判定柱屈服的条件是柱中纵向钢筋屈服或者混凝土发生严重的非线,并在此基础上给出了对应的经验公式.Montes[7]基于柱中钢筋屈服,提出了对应不同强度等级钢筋的柱有效屈服曲率计算公式.Berry[8]等模拟了PEER[9]柱性能数据库中255根矩形截面混凝土柱的屈服位移.钱稼茹[10]亦对该数据库中144根剪跨比大于2的矩形柱考虑轴压比的影响进行回归分析,提出了修正的柱屈服转角表达式.蒋欢军[11]综合Berry[8]关于屈服位移以及Priestley[12]对于屈服曲率的定义,在计算屈服位移的公式中加入了考虑柱端钢筋滑移和柱子剪切变形影响的修正项.Peru[13]基于Eurocode8[14]中柱屈服位移的定义,利用CAE方法对PEER柱性能数据库的柱屈服位移进行了预测.
柱屈服过程中钢筋和混凝土都发生了复杂的非线,加之影响屈服性能的因素也非常多,上述基于经验理论的非线性拟合公式预测柱屈服性能时存在预测结果离散度非常大的问题.人工神经网络作为一种在数据稀少的情况下能够有效预测数据输入和输出关系的手段而进入研究者的视野.人工神经网络是以人类神经活动为基础而发展起来的一项新颖的计算手段,适合处理复杂线性及非线性映射问题.由于其强大的非线性映射能力,神经网络在工程领域被用于预测圆柱形混凝土柱约束状态的极限压应力和对应的压应变[15],模拟金属疲劳裂纹开展速率[16].神经网络的其它工程应用还有如混凝土柱在弯曲失效模式下的极限变形预测[17],边坡稳定性分析[18],修正结构有限元模型[19]等.
本文基于经验理论模型对弯曲型混凝土柱屈服性能影响因素的研究,利用神经网络预测PEER柱性能库210组矩形混凝土柱的屈服性能,并以此来探讨神经网络对柱性能预测的可行性和有效性.通过对比神经网络的预测结果与实验结果以及经验理论模型估算结果,评价神经网络预测模型的效果.最后基于Carson敏感性分析方法验证所选神经网络输入参数的合理性并得到输入各参数对混凝土柱屈服位移的贡献程度.
1 经验模型预测实验数据库柱屈服转角
1.1 实验数据库
本文对弯曲型失效为主的柱屈服转角进行预测,在PEER[9]柱性能数据库中通过以下标准:1)柱子截面形状为矩形;2)柱子受往复荷载作用直至失效;3)柱子的实验失效模式为弯曲失效.选择210组实验数据,作为神经网络预测数据库.该预测数据库的主要属性参数范围如图1所示.
从图1中可看出本文所选数据库主要参数分布覆盖了常规设计的参数取值范围,具有广泛的代表性.
从图2和表1中可以看出,利用4种经验模型估算构件的屈服转角时,预测值与实验值的比值分布相当离散,ASCE41模型计算结果变异系数相对较小为0.443,而利用ACI318-08(b)变异系数则达到0.65.针对上述预测结果离散的问题,本文采用BP神经网络预测PEER数据库柱的屈服转角.
2 神经网络预测柱屈服转角方法
2.1 BP神经网络
BP神经网络作为前向型多层神经网络的一种,其实质是利用误差反向传播算法(Back-Propagation)对神经网络进行训练.BP神经网络结构由输入层、隐含层和输出层三个部分组成,Hornik[22]已经证明单隐层的神经网络可以实现任意精度的非线性映射关系.BP神经网络训练分为信息的正向输入和误差的反向传播两个阶段.在信息正向输入阶段,输入参数通过阀值和权值的调节,再经激活函数传递对计算结果进行输出;而在误差反向传播阶段则是通过计算输出层的结果和目标值之间的误差来反向调节各神经元的权值和阀值;在实际训练中这两个阶段交替进行,直至达到训练的性能目标为止.
但由于BP学习算法其本质是梯度下降学习算法,权值的修正是沿性能函数梯度的反向进行,使普通的BP神经网络在训练时有以下不足:1)作为一种局部搜索的方法,容易陷入局部极小值而不能得到全局最优的结果;2)由于BP算法本身反向传播的特点,使其在求解矩阵时耗费大量的计算时间,致使神经网络收敛速度很慢.针对上述不足,众多学者对其进行修正,其中L-M(Levenberg-Marquardt)[23] 算法因其能够进行快速迭代,又具有全局优化的特点而在小型神经网络中得以广泛应用.L-M算法中迭代项如式(3)所示:
综合以上讨论,可以确定影响柱屈服转角的主要参数有:混凝土的抗压强度、轴压比、剪跨比、纵向钢筋的屈服强度、配筋率以及纵向钢筋直径,并将作为神经网络预测模型的输入参数.
2.3 构建BP网络预测模型
根据前述从PEER数据库中遴选出的210组数据,180组作为BP神经网络的训练集,30组作为测试集.将2.2节讨论的6个主要参数作为神经网络输入参数,柱的屈服转角为输出结果,在MATLAB中建立如图3所示的3层BP神经网络N 6-H-1(其中输入层节点数为6,H为隐含层的节点数,输出层节点数为1).
利用MATLAB神经网络工具箱建立神经网络模型需要确定以下参数:学习函数、学习速率、激活函数、训练函数、学习周期、性能目标和隐含层节点数.神经网络参数选择如下:
利用BP网络进行预测分析,为避免因输入因子数量级差别而引起较大的网络误差,一般先将输入因子进行归一化处理.为避免激活函数其极值0和1附近饱和而伴随出现“麻痹现象”,这里采用如式(12)所示方法将神经网络的输入和输出规格化:
2.4 BP网络预测结果
根据以上讨论对图3中BP神经网络进行训练、测试,得到如表2所示的预测结果.
从表2中可以看出当隐含层节点数为13和15时,其测试集和训练集的性能函数值分别达到最小;而当隐含层节点数为17和21时,神经网络训练集和测试集的性能函数均有相对较好的取值.限于篇幅,本文只以13和15节点神经网络为例,讨论其对混凝土柱屈服性能预测的适用性.
图4和表3列出了对应节点数目为13和15的BP神经网络模型预测结果.为了进一步检验神经网络的预测能力,将这两组预测结果与实验结果进行线性回归分析,结果如图5所示.
根据表2和图5给出的预测结果以及对应的线性回归结果,其对应较小的性能函数MSE的值和较高的相关系数R的值,可以看出神经网络能够准确预测混凝土柱的屈服转角.
在表3和图4中可以看出,2种不同节点数的神经网络均能取得较好的预测结果,表3中训练集和测试集的最大变异系数仅为0.164和0.179.从图4~图5以及表2~表3分析可以看到,利用BP网络预测柱的屈服位移可以得到相当满意的结果.
2.5 BP网络预测结果与经验模型比较
为了对比说明神经网络预测结果的准确性,本文也将Elwood在文献\[20\]基于理论推导的有效刚度模型带入式(2),计算结果列于图6(a)中.同时对应式(1)中屈服位移的定义,计算对比文献\[11\]所提出的经验模型屈服转角:
从图6和表4中可以看出:在利用Elwood计算模型估算构件的屈服转角时,估算精度高于前述4种规范模型,但是也看出Elwood模型和Jiang经验模型估算结果依旧相当离散,其中Elwood模型计算结果变异系数较小为0.365,而Jiang模型的计算结果则为0.477.相对于上述6种经验理论模型,本文所提的13和15节点神经网络模型,其预测结果与实验值的比值均值为1;变异系数仅为0.16和0.13.
相对于前述6种经验理论模型中仅考虑其中一部分因素的影响或者用一个数学表达式描述输入参数和柱子屈服位移之间的关系,神经网络综合考虑输入参数之间的相互影响,通过权值和阀值矩阵的调节得到更为准确的预测结果.
2.6 BP网络敏感性分析
为得到输入参数对混凝土柱屈服位移的影响程度以及验证2.2节通过经验模型选用神经网络输入参数方法的合理性,本文采用基于Garson算法[28]的神经网络敏感性分析.作为基于连接权神经网络敏感性分析方法的代表,该方法通过连接权的乘积计算输入变量对输出变量的贡献程度.对于一个N X-H-1的神经网络,其计算表述如式(14)所示:
3 结 论
为了能够准确地预测混凝土柱构件的屈服性能,建立一种基于BP神经网络预测混凝土柱的屈服性能的方法.本文首先利用以往的经验理论模型详细解构了影响混凝土柱屈服性能的因素,并将混凝土强度、轴压比、剪跨比、纵向钢筋配筋率、纵向钢筋直径及纵向钢筋屈服强度作为BP神经网络的输入参数预测混凝土柱的屈服性能.通过与已有估算模型结果的对比,显示出利用BP神经网络预测模型的高效性.最后通过利用Garson敏感性分析方法证明了本文选择预测模型输入参数合理性,并评估了各个输入因素对混凝土柱屈服位移影响的程度.本文通过利用神经网络预测矩形混凝土柱的屈服性能,说明在数据不充分的情况下神经网络对于预测工程结果是一种很有潜力的手段.
参考文献
[1] FEMA 273 Guidelines for the seismic rehabilitation of buildings[S]. Washington: Federal Emergency Management Agency, 1997:13-14.
[2] FEMA 356 Prestandard and commentary for the seismic rehabilitation of buildings \[S\]. Washington: Federal Emergency Management Agency, 2000:218-218.
[3] ASCE/SEI41 Seismic rehabilitation of existing buildings \[S\]. American Society of Civil Engineers, Reston, VA. 2007:354-354.
[4] Eurocode 8:Design of Structures for earthquake resistance Part 1: General rules, seismic actions and rules for buildings\[S\]. Brussels European Committee for Standardization,1998:219-219.
[5] PARK R. Ductility evaluation from laboratory and analytical testing \[C\]// Proceedings 9th World Conference on Earthquake Engineering.Tokyo-Kyoto, Japan. 1988:VIII,605-616.
[6] PANAGIOKOS T B, FARDIS M N. Deformations of reinforced concrete members at yielding and ultimate \[J\]. ACI Structural Journal, 2001, 98(2): 135-148.
[7] MONTES H E, ASCHLEIM M. Estimates of the yield curvature for design of reinforced concrete columns \[J\]. Magazine of Concrete Research, 2003, 55(4): 373-383.
[8] BERRY M, EBERHARD M O. Performance models for flexural damage in reinforced concrete columns \[R\]. Pacific Earthquake Engineering Research Center, College of Engineering, University of California, 2004:158-158.
[9] PEER. Peer structural performance database \[DB/OL\]. \[2003-12-29\]. http: // nisee. berkeley. edu / spd.
[10]钱稼茹,徐福江.钢筋混凝土柱基于位移的变形能力设计方法\[J\]. 建筑结构, 2007(12): 30-32.
QIAN Jia-ru, XU Fu-jiang. Displacement-based deformation capacity design of RC columns \[J\]. Building Structure, 2007(12): 30-32.(In Chinese)
[11]JIANG Huan-jun, LU Xi-lin, KUBO T. Damage displacement estimation of flexure-dominant RC columns[J]. Advances in Structural Engineering, 2010, 13(2): 357-368.
[12]PRIESTLEY M. Brief comments on elastic flexibility of reinforced concrete frames and significance to seismic design \[J\]. Bulletin of the New Zealand National Society for Earthquake Engineering, 1998,31(4): 246-259.
[13]PERU I, FAJFAR P. Prediction of the forceCdrift envelope for RC columns in flexure by the CAE method \[J\]. Earthquake Engineering & Structural Dynamics, 2007,36(15): 2345-2363.
[14]Eurocode 8: design of structures for earthquake resistance CPart 2: Bridge\[S\]. Brussels European Committee for Standardization, 2005:133-133.
[15]ORETA A W, KAWASHIMA K. Neural network modeling of confined compressive strength and strain of circular concrete columns \[J\]. Journal of Structural Engineering, 2003, 129(4): 554-561.
[16]罗广恩,崔维成. 金属疲劳裂纹扩展速率的贝叶斯正则化BP神经网络预测\[J\]. 船舶力学, 2012, 16(4): 433-441.
LUO Guang-en, CUI Wei-cheng. Prediction of fatigue crack growth rate of metal based on Bayesian regularized BP neural network \[J\]. Journal of Ship Mechanics, 2012, 16(4): 433-441. (In Chinese)
[17]INEL M. Modeling ultimate deformation capacity of RC columns using artificial neural networks \[J\]. Engineering Structures, 2007, 29(3): 329-335.
[18]刘思思,赵明华,杨明辉,等. 基于自组织神经网络与遗传算法的边坡稳定性分析方法\[J\]. 湖南大学学报:自然科学版,2008,35(12): 7-12.
LIU Si-si, ZHAO Ming-hua, YANG Ming-hui, et al. Slope stability analysis method based on self-organizing neural network and genetic algorithm\[J\]. Journal of Hunan University: Natural Sciences, 2008, 35(12): 7-12. (In Chinese)
[19]王蕾,郁胜,李宾宾,等. 基于径向基神经网络的桥梁有限元模型修正\[J\]. 土木工程学报, 2012,45(S2): 11-15.
WANG Lei, YU Shen, LI Bin-bin, et al. Bridge model updating based on radial basis function neural network \[J\]. China Civil Engineering Journal, 2012,45(S2): 11-15. (In Chinese)
[20]ELWOOD K J, EBERHARD M O. Effective stiffness of reinforced concrete columns \[J\]. ACI Structural Journal, 2009, 106(4):483-483.
[21]ACI 318-2008 Building Code requirements for structural concrete and commentary \[S\]. Farmington Hills: 2008, American Concrete Institute, 2008:143-143.
[22]HORNIK K, STINCHCOMBE M, WHITE H. Multilayer feedforward networks are universal approximators \[J\]. Neural Networks, IEEE Transactions on, 1989, 2(5): 359-366.
[23]HAGAN M T, MENHAJ M B. Training feedforward networks with the Marquardt algorithm \[J\]. Neural Networks, IEEE Transactions on, 1994, 5(6): 989-993.
[24]郑罡,李贵乾. 钢筋混凝土桥墩有效刚度\[J\]. 土木工程学报, 2013,46(6):44-52.
ZHENG Gang, LI Gui-qian. Effective stiffness of reinforced concrete bridges piers \[J\]. China Civil Engineering Journal, 2013,46(6):44-52. (In Chinese)
[25]SEZEN H, MOEHLE J P. Bond-slip behavior of reinforced concrete members \[C\]//Proceedings of fib symposium on concrete structures in seismic regions. Athens, Greece. CEB-FIP. 2003.
[26]BERRY M J, LINOFF G. Data mining techniques: for marketing, sales, and customer support \[M\].New York: John Wiley & Sons Inc,1997:444-444.
80年代初,在美国、日本、接着在我国国内都掀起了一股研究神经网络理论和神经计算机的热潮,并将神经网络原理应用于图象处理、模式识别、语音综合及机器人控制等领域。近年来,美国等先进国家又相继投入巨额资金,制定出强化研究计划,开展对脑功能和新型智能计算机的研究。
人脑是自生命诞生以来,生物经过数十亿年漫长岁月进化的结果,是具有高度智能的复杂系统,它不必采用繁复的数字计算和逻辑运算,却能灵活处理各种复杂的,不精确的和模糊的信息,善于理解语言、图象并具有直觉感知等功能。
人脑的信息处理机制极其复杂,从结构上看它是包含有140亿神经细胞的大规模网络。单个神经细胞的工作速度并不高(毫秒级),但它通过超并行处理使得整个系统实现处理的高速性和信息表现的多样性。
因此,从信息处理的角度对人脑进行研究,并由此研制出一种象人脑一样能够“思维”的智能计算机和智能信息处理方法,一直是人工智能追求的目标。
神经网络就是通过对人脑的基本单元---神经元的建模和联结,来探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。本文介绍神经网络的特点以及近年来有关神经网络与混沌理论、模糊计算和遗传算法等相结合的混合神经网络研究的动态。
一.神经网络和联结主义
回顾认知科学的发展,有所谓符号主义和联结主义两大流派。符号主义从宏观层次上,撇开人脑的内部结构和机制,仅从人脑外在表现出来的智能现象出发进行研究。例如,将记忆、判断、推理、学习等心理活动总结成规律、甚至编制成规则,然后用计算机进行模拟,使计算机表现出各种智能。
符号主义认为,认识的基本元素是符号,认知过程是对符号表示的运算。人类的语言,文字的思维均可用符号来描述,而且思维过程只不过是这些符号的存储、变换和输入、输出而已。以这种方法实现的系统具有串行、线性、准确、简洁、易于表达的特点,体现了逻辑思维的基本特性。七十年代的专家系统和八十年代日本的第五代计算机研究计划就是其主要代表。
联接主义则与其不同,其特点是从微观出发。联接主义认为符号是不存在的,认知的基本元素就是神经细胞(神经元),认知过程是大量神经元的联接,以及这种联接所引起的神经元的不同兴奋状态和系统所表现出的总体行为。八十年代再度兴起的神经网络和神经计算机就是这种联接主义的代表。
神经网络的主要特征是:大规模的并行处理和分布式的信息存储,良好的自适应、自组织性,以及很强的学习功能、联想功能和容错功能。与当今的冯.诺依曼式计算机相比,更加接近人脑的信息处理模式。主要表现如下:
神经网络能够处理连续的模拟信号。例如连续灰度变化的图象信号。
能够处理混沌的、不完全的、模糊的信息。
传统的计算机能给出精确的解答,神经网络给出的是次最优的逼近解答。
神经网络并行分布工作,各组成部分同时参与运算,单个神经元的动作速度不高,但总体的处理速度极快。
神经网络信息存储分布于全网络各个权重变换之中,某些单元障碍并不影响信息的完整,具有鲁棒性。
传统计算机要求有准确的输入条件,才能给出精确解。神经网络只要求部分条件,甚至对于包含有部分错误的输入,也能得出较好的解答,具有容错性。
神经网络在处理自然语言理解、图象模式识别、景物理解、不完整信息的处理、智能机器人控制等方面有优势。
符号主义和联接主义两者各有特色,学术界目前有一种看法:认为基于符号主义得传统人工智能和基于联接主义得神经网络是分别描述人脑左、右半脑的功能,反映了人类智能的两重性:精确处理和非精确处理,分别面向认识的理性和感性两个方面,两者的关系应该是互补而非互相代替。理想的智能系统及其表现的智能行为应是两者相互结合的结果。
接下去的问题是,符号AI和联接AI具体如何结合,两者在智能系统中相互关系如何?分别扮演什么角色?目前这方面发表的文献很多,大致有如下几种类型:
1.松耦合模型:符号机制的专家系统与联接机制的神经网络通过一个中间媒介(例如数据文件)进行通讯。
2.紧耦合模型:与松耦合模型相比较,其通讯不是通过外部数据进行,而是直接通过内部数据完成,具有较高的效率。其主要类型有嵌入式系统和黑板结构等。
3.转换模型:将专家系统的知识转换成神经网络,或把神经网络转换成专家系统的知识,转换前的系统称为源系统,转换后的系统称为目标系统,由一种机制转成另一种机制。如果源系统是专家系统,目标系统是神经网络,则可获得学习能力及自适应性;反之,可获得单步推理能力、解释能力及知识的显式表示。当然,转换需要在两种的机制之间,确定结构上的一致性,目前主要问题是还没有一种完备而精确的转换方法实现两者的转换。有待进一步研究。
4.综合模型:综合模型共享数据结构和知识表示,这时联接机制和符号机制不再分开,两者相互结合成为一个整体,既具有符号机制的逻辑功能,又有联接机制的自适应和容错性的优点和特点。例如联接主义的专家系统等。
近年来神经网络研究的另一个趋势,是将它与模糊逻辑、混沌理论、遗传进化算法等相结合,即所谓“混合神经网络”方法。由于这些理论和算法都是属于仿效生物体信息处理的方法,人们希望通过她们之间的相互结合,能够获得具有有柔性信息处理功能的系统。下面分别介绍。
二.混沌理论与智能信息处理
混沌理论是对貌似无序而实际有序,表面上看来是杂乱无章的现象中,找出其规律,并予以处理的一门学科。早在七十年代,美国和欧洲的一些物理学家、生物学家、数学家就致力于寻求在许许多多不同种类的不规则性之间的联系。生物学家发现在人类的心脏中有混沌现象存在,血管在显微镜下交叉缠绕,其中也有惊人的有序性。在生物脑神经系统中从微观的神经膜电位到宏观的脑电波,都可以观察到混沌的性态,证明混沌也是神经系统的正常特性。
九十年代开始,则更进一步将混沌和神经网络结合起来,提出多种混沌神经网络模型,并探索应用混沌理论的各种信息处理方法。例如,在神经元模型中,引入神经膜的不应性,研究神经元模型的混沌响应,研究在神经网络的方程中,不应性项的定标参数,不定性时间衰减常数等参数的性质,以及这些参数于神经网络混沌响应的关系,并确定混沌---神经网络模型具有混沌解的参数空间。经过试验,由这种混沌神经网络模型所绘出的输出图形和脑电图极为相似。
现代脑科学把人脑的工作过程看成为复杂的多层次的混沌动力学系统。脑功能的物理基础是混沌性质的过程,脑的工作包含有混沌的性质。通过混沌动力学,研究、分析脑模型的信息处理能力,可进一步探索动态联想记忆、动态学习并应用到模式识别等工程领域。例如:
对混沌的随机不规则现象,可利用混沌理论进行非线性预测和决策。
对被噪声所掩盖的微弱信号,如果噪声是一种混沌现象,则可通过非线性辨识,有效进行滤波。
利用混沌现象对初始值的敏锐依赖性,构成模式识别系统。
研究基于混沌---神经网络自适应存储检索算法。该算法主要包括三个步骤,即:特征提取、自适应学习和检索。
模式特征提取采用从简单的吸引子到混沌的层次分支结构来描述,这种分支结构有可能通过少数几个系统参数的变化来加以控制,使复杂问题简单化。自适应学习采用神经网络的误差反传学习法。检索过程是通过一个具有稳定吸引子的动力学系统来完成,即利用输入的初始条件与某个吸引子(输出)之间的存在直接对应关系的方法进行检索。利用这种方法可应用于模式识别。例如黑白图象的人脸识别。
三.模糊集理论与模糊工程
八十年代以来在模糊集理论和应用方面,也有很大进展。1983年美国西海岸AI研究所发表了称为REVEAL的模糊辅助决策系统并投入市场,1986年美国将模糊逻辑导入OPS---5,并研究成功模糊专家系统外壳FLOPS,1987年英国发表采用模糊PROLOG的智能系统FRIL等。除此通用工具的研制以外,各国还开发一系列用于专用目的的智能信息处理系统并实际应用于智能控制、模式识别、医疗诊断、故障检测等方面。
模糊集理论和神经网络虽然都属于仿效生物体信息处理机制以获得柔性信息处理功能的理论,但两者所用的研究方法却大不相同,神经网络着眼于脑的微观网络结构,通过学习、自组织化和非线性动力学理论形成的并行分析方法,可处理无法语言化的模式信息。而模糊集理论则着眼于可用语言和概念作为代表的脑的宏观功能,按照人为引入的隶属度函数,逻辑的处理包含有模糊性的语言信息。
神经网络和模糊集理论目标相近而方法各异。因此如果两者相互结合,必能达到取长补短的作用。将模糊和神经网络相结合的研究,约在15年前便已在神经网络领域开始,为了描述神经细胞模型,开始采用模糊语言,把模糊集合及其运算用于神经元模型和描述神经网络系统。目前,有关模糊---神经网络模型的研究大体上可分为两类:一类是以神经网络为主,结合模糊集理论。例如,将神经网络参数模糊化,采用模糊集合进行模糊运算。另一类以模糊集、模糊逻辑为主,结合神经网络方法,利用神经网络的自组织特性,达到柔性信息处理的目的。
与神经网络相比,模糊集理论和模糊计算是更接近实用化的理论,特别近年来美国和日本的各大公司都纷纷推出各种模糊芯片,研制了型号繁多的模糊推理板,并实际应用于智能控制等各个应用领域,建立“模糊工程”这样一个新领域。日本更首先在模糊家电方面打开市场,带有模糊控制,甚至标以神经---模糊智能控制的洗衣机、电冰箱、空调器、摄象机等已成为新一代家电的时髦产品。我国目前市场上也有许多洗衣机,例如荣事达洗衣机就是采用模糊神经网络智能控制方式的洗衣机。
四.遗传算法
遗传算法(GeneticAlgorithm:GA)是模拟生物的进化现象(自然、淘汰、交叉、突然变异)的一种概率搜索和最优化方法。是模拟自然淘汰和遗传现象的工程模型。
GA的历史可追溯到1960年,明确提出遗传算法的是1975年美国Michigan大学的Holland博士,他根据生物进化过程的适应现象,提出如下的GA模型方案:
1.将多个生物的染色体(Chromosmoe)组成的符号集合,按文字进行编码,称为个体。
2.定义评价函数,表示个体对外部环境的适应性。其数值大的个体表示对外部环境的适应性高,它的生存(子孙的延续)的概率也高。
3.每个个体由多个“部分”组合而成,每个部分随机进行交叉及突然变异等变化,并由此产生子孙(遗传现象)。
4.个体的集合通过遗传,由选择淘汰产生下一代。
遗传算法提出之后,很快得到人工智能、计算机、生物学等领域科学家的高度重视,并在各方面广泛应用。1989年美国Goldberg博士发表一本专著:“GeneticAlgorithmsinSearch,OptimizationandMachineLearning”。出版后产生较大影响,该书对GA的数学基础理论,GA的基本定理、数理分析以及在搜索法、最优化、机器学习等GA应用方面进行了深入浅出的介绍,并附有Pascal模拟程序。
1985年7月在美国召开第一届“遗传算法国际会议”(ICGA)。以后每隔两年召开一次。近年来,遗传算法发展很快,并广泛应用于信息技术的各个领域,例如:
智能控制:机器人控制。机器人路径规划。
工程设计:微电子芯片的布局、布线;通信网络设计、滤波器设计、喷气发动机设计。
图象处理:图象恢复、图象识别、特征抽取。
调度规划:生产规划、调度问题、并行机任务分配。
优化理论:TSP问题、背包问题、图划分问题。
人工生命:生命的遗传进化以及自增殖、自适应;免疫系统、生态系统等方面的研究。
神经网络、模糊集理论和以遗传算法为代表的进化算法都是仿效生物信息处理模式以获得智能信息处理功能的理论。三者目标相近而方法各异;将它们相互结合,必能达到取长补短、各显优势的效果。例如,遗传算法与神经网络和模糊计算相结合方面就有:
神经网络连续权的进化。
传统神经网络如BP网络是通过学习,并按一定规则来改变数值分布。这种方法有训练时间过长和容易陷入局部优化的问题。采用遗传算法优化神经网络可以克服这个缺点。
神经网络结构的进化。
目前神经网络结构的设计全靠设计者的经验,由人事先确定,还没有一种系统的方法来确定网络结构,采用遗传算法可用来优化神经网络结构。
神经网络学习规则的进化。