前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络卷积层的作用主题范文,仅供参考,欢迎阅读并收藏。
关键词:卷积神经网络;深度学习;图像处理;训练时间
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)33-0167-04
如今在机器学习领域中,深度学习方法已经占据了相当重要的地位,通过模仿人X学习方式构造模型,在图像、文本、语音处理方面取得了显著成果[1]。目前应用较为广泛的深度学习模型包含多层感知器模型(MLP)[2],卷积神经网络模型和限制性玻尔兹曼机模型等[4]。多层感知器[2]网络结构的神经节点一般分层排列,主要由输入层,输出层和一些隐层组成,同层之间的神经元节点无连接,相邻的两层神经元进行全连接,前一层的神经元的输出作为后一层神经元的输入,但本身此种算法存在着一些问题,那就是它的学习速度非常慢,其中一个原因就是由于层与层之间进行全连接,所以它所需要训练的参数的规模是非常大的,所以对其进行改进,产生了卷积神经网络模型。卷积神经网络模型在图像识别方面的应用十分广泛[5,8,9]。从它的结构上来看,层与层之间的神经元节点采用局部连接模式,而并非MLP的全连接模型,这样就降低了需要训练的参数的规模。而在它卷积层中,它的每一个滤波器作为卷积核重复作用于整个输入图像中,对其进行卷积,而得出的结果作为输入图像的特征图[6],这样就提取出了图像的局部特征。而由于每一个卷积滤波器共享相同的参数,这样也就大大降低了训练参数的时间成本。而本文,以卷积神经网络为研究对象,在其模型的基础上通过对其结构中卷积核也就是滤波器的大小进行调整并结合卷积核个数调整和gpu加速等已有的训练提速方法,达到降低训练时间并且对识别结果并无太大影响的目的。
1 卷积神经网络
卷积神经网络在MLP的基础上,已经对结构进行了优化,通过层与层之间的局部连接以及权值共享等方式对要训练的参数的进行了大幅减低。
1.1局部连接
BP神经网络中,神经元在本层中呈线性排列状态,层与层之间进行全连接,而在卷积神经网络中,为了减少每层之间的可训练参数数量,对连接方式进行了修改,相对于BP神经网络的全连接,卷积神经网络采取了局部连接的连接方式[7],也就是说按照某种关联因素,本层的神经元只会与上层的部分神经元进行连接。
2.2 权值共享
在CNN中,卷积层中的卷积核也就是滤波器,重复作用在输入图像上,对其进行卷积,最后的输出作为他的特征图,由于每个滤波器共享相同的参数,所以说他们的权重矩阵以及偏置项是相同的。
我们从上图看出,相同箭头连线的权值是共享的,这样在原有的局部连接的基础上我们又降低了每层需要训练的参数的数量。
2.3卷积过程
特征图是通过滤波器按照特定的步长,对输入图像进行滤波,也就是说我们用一个线性的卷积核对输入图像进行卷积然后附加一个偏置项,最后对神经元进行激活。如果我们设第k层的特征图记为[hk],权重矩阵记为[Wk],偏置项记为[bk],那么卷积过程的公式如下所示(双曲函数tanh作为神经元的激活函数):
2.4 最大池采样
通过了局部连接与权值共享等减少连接参数的方式卷积神经网络中还有另外一个重要的概念那就是最大池采样方法,它是一种非线性的采样方法。最大池采样法在对减少训练参数数量的作用体现在两个方面:
1 )它减小了来自m-1层的计算复杂度。
2 )池化的单元具有平移不变性,所以即使图像在滤波后有小的位移,经过池化的特征依然会保持不变。
3卷积神经网络整体构造以及减少训练时间的方法
3.1使用GPU加速
本次论文实验中,使用了theano库在python环境下实现卷积神经网络模型,在lenet手写数字识别模型上进行改进,由于theano库本身支持GPU加速,所以在训练速度上实现了大幅度的提高。
3.2 数据集的预处理
本次实验使用的两个数据集是mnist手写数字库以及cifar_10库
Mnist手写数字库具有60000张训练集以及10000张测试集,图片的像素都为28*28,而cifar_10库是一个用于普适物体识别的数据集,它由60000张32*32像素的RGB彩色图片构成,50000张图片组成训练集,10000张组成测试集。而对于cifar_10数据集来说,由于图片都是RGB的,所以我们在进行实验的时候,先把其转换为灰度图在进行存储。由于实验是在python环境下运行,theano函数库进行算法支持,所以我们把数据集进行处理,此处我们对使用的数据集进行了格式化。格式化的文件包括三个list,分别是训练数据,验证数据和测试数据。而list中每个元素都是由图像本身和它的相对应的标签组成的。以mnist数据集为例,我们包含train_set,valid_set,test_set三个list,每个list中包含两个元素,以训练集为例,第一个元素为一个784*60000的二维矩阵,第二个元素为一个包含60000个元素的列向量,第一个元素的每一行代表一张图片的每个像素,一共60000行,第二个元素就存储了对相应的标签。而我们取训练样本的10%作为验证样本,进行相同的格式化,而测试样本为没有经过训练的10000张图片。在以cifar_10数据集为实验对象时,把其进行灰度化后,进行相同的格式化处理方式。
3.3实验模型结构
本次实验是在python环境下基于theano函数库搭建好的lenet模型进行参数的调整,以达到在实验准确度可接受情况下减少训练时间的目的。
上图为实验中的基础模型举例说明实验过程,首先以mnist数据集为例,我们的输入图像为一个28*28像素的手写数字图像,在第一层中我们进行了卷积处理,四个滤波器在s1层中我们得到了四张特征图。在这里要特别的说明一下滤波器的大小问题,滤波器的大小可根据图像像素大小和卷积神经网络整体结构进行设置,举例说明,假如说我们的输入图像为28*28像素的图像,我们把第一层卷积层滤波器大小设置为5*5,也就是说我们用一个大小为5*5的局部滑动窗,以步长为一对整张图像进行滑动滤波,则滑动窗会有24个不同的位置,也就是说经过卷积处理后的C1层特征图的大小为24*24。此处的滤波器大小可进行调整,本论文希望通过对滤波器大小的调整,已达到减少训练时间的目的,并寻找调整的理论依据。C1层的特征图个数与卷积过程中滤波器数量相同。S1层是C1经过降采样处理后得到的,也就是说四点经过降采样后变为一个点,我们使用的是最大池方法,所以取这四个点的最大值,也就是说S1层图像大小为12*12像素,具有4张特征图。而同理S1层经过卷积处理得到C2层,此时我们滤波器的大小和个数也可以自行设置,得到的C2层有6张特征图,C2到S2层进行降采样处理,最后面的层由于节点个数较少,我们就用MLP方法进行全连接。
3.4实验参数改进分析
由此可见,我们对滤波器的大小以及个数的改变,可以直接影响到卷积训练参数的个数,从而达到减少训练时间的目的。
从另一种角度来看,增大滤波器的大小,实际效果应该相似于缩小输入图像的像素大小,所以这样我们可以预测增大滤波器的大小会减少样本的训练时间,但是这样也可能会降低训练后的分类的准确率,而滤波器的大小是如何影响训练时间以及分类准确率的,我们通过对两种图片库的实验来进行分析。
4 实验结果与分析
4.1以mnist手写数字数据集作为实验数据
我们知道卷积层可训练参数的数字与滤波器的大小和数字有关,所以我们通过对卷积层滤波器大小的变化来寻找较为普遍的可减少训练参数从而达到减少训练时间的目的。在实验记录中,我们表格纵列记录两层卷积层滤波器大小,横列分别为对已经过训练图像识别和对未经过训练的验证图像进行识别的错误率,最后记录每种滤波器大小搭配的使用时间。我们设定每次试验都进行100次重复训练,每次对权重矩阵进行优化。
此处我们记录两层滤波器大小之和作为横坐标,比较滤波器大小与实验之间的关系。两层滤波器大小相加后相同的元素我们把其对应时间做平均。
4.2以cifar_10数据集作为实验数据
同样是以100次循环训练进行测试,通过改变两层中滤波器的大小来寻找减少训练时间的设定。
此处以同样的方法,记录两层滤波器大小之和作为横坐标,比较滤波器大小与实验之间的关系。
4.3实验结果分析
从两组试验中,在不同的数据集下,我们得到了滤波器的大小与训练时间成反比的关系,而在减少了训练时间的同时确实增大了训练的错误率。
5 总结
通过实验结果分析表明,增大卷积层滤波器大小的方法,在此两种数据库的情况下,是有效减小训练时间的方式,而在不同的数据库对分类准确率的影响程度不同,mnist手写数字数据库中图像之间的相似度非常高,所以滤波器的增大对准确率产生的负面影响较小,而ifar_10数据集中图像之间的相似度较小,所以增大滤波器的大小对其分类结果的准确率的负面影响较大。
参考文献:
[1]LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.
[2] Ruck D W, Rogers S K, Kabrisky M. Feature selection using a multilayer perceptron[J]. ]Journal of Neural Network Computing, 1990, 2(2): 40-48.
[3]LeCun Y, Bengio Y. Convolutional networks for images, speech, and time series[J]. The handbook of brain theory and neural networks, 1995, 3361(10): 1995.
[4] Larochelle H, Bengio Y. Classification using discriminative restricted Boltzmann machines[C]//Proceedings of the 25th international conference on Machine learning. ACM, 2008: 536-543.
[5]Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Advances in neural information processing systems. 2012: 1097-1105.
[6] Zeiler M D, Fergus R. Visualizing and understanding convolutional networks[C]//European Conference on Computer Vision. Springer International Publishing, 2014: 818-833.
[7] Jarrett K, Kavukcuoglu K, Lecun Y. What is the best multi-stage architecture for object recognition?[C]//2009 IEEE 12th International Conference on Computer Vision. IEEE, 2009: 2146-2153.
关键词:卷积神经网络;反向传播算法;仿射变换;sloth;python;theano
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2017)04-0096-02
随着环保压力的增大,各国已经开始利用摄像头来监控渔船的捕捞活动,并运用机器学习技术来对渔船捕获的鱼类图像进行自动的识别与分类从而扼制非法的捕捞。
目前计算机性能的飞速发展、图像数据采集设备的廉价与普及促进了机器学习理论与方法的发展,数据科学家已经可以构建复杂的机器学习模型并利用从廉价的数码摄像头设备采集到大量的数据快速的训练模型。吴一全等[1]采用了手动选择特征的方法, 基于支持向量机对5种鱼进行识别,各类鱼的识别精度平均为83.33%。万鹏等[2]计算鱼的长轴方向各段的平均宽度与长度的比值并将其作为特征参数,利用3层BP(back propagation)神经网络对鲫鱼和鲤鱼进行识别,识别精度为92.50%。但是这些方法都是基于手动选择特征的机器学习方法,手动选择特征的方法基于人的经验选择特征, 会导致遗漏重要的特征, 导致分类准确率低。深度学习中的卷积神经网络能在训练过程中自动学到“好”特征,避免了手动选择特征。本次研究采用了基于VGG16的卷积神经网络(CNN)来进行鱼类分类,并运用了数据集扩增方法,dropout方法, batch normalization方法来降低模型的过拟合。但是原始数据集背景干扰很大,船上的人、物体和甲板上捕获的鱼类糅合在一起,直接采用原始数据集训练会导致训练出的模型稳定性不好。
基于上述分析,本文从原始数据出发,设计了一种目标检测方法,即在原始训练数据已经有鱼类类别标签的基础上,再标注上一层表示鱼类在图片中坐标位置的标签,然后利用这些二次标注过的数据训练模型,就可得到一个既能预测鱼在图片中的坐标位置又能预测鱼的分类的糅合模型。因为这两种预测网络在卷积层共同训练一套滤波器,所以在训练滤波器预测鱼的坐标位置时,训练完成的滤波器便能在另一方面辅助预测鱼的分类,使特征提取只专注于鱼的坐标区域,这样就有效的排除了背景干扰。实验结果显示此模型具有很高的识别精度和鲁棒性,能在背景干扰很强的图片数据集上准确的完成鱼类的识别和分类。
1 模型构建
实验数据来源于某组织举办的图像识别竞赛。数据通过固定在渔船某个位置的摄像头采集,通过采集甲板上捕获的鱼类照片,共采集到3777张共8个分类的照片作为训练样本,分别为长鳍金枪鱼、大眼金枪鱼、黄鳍金枪鱼、鳅鱼、月鱼、鲨鱼、其他、无鱼类(表示没有鱼出现在照片里)。按一定比例做分层采样,其中2984张用作训练集,394张用作验证集,399张用作测试集。训练集用经过错切幅度值为0.15的仿射变换作数据集扩增来降低过拟合,因为在从原始数据集上分层采样得来的小样本数据集上验证显示当错切幅度值等于0.15时,模型在测试集上的分类精度最高。
在训练集上采用sloth@款图片标注工具手动标注鱼类在图片中的位置,并把这些标注结果和已有的鱼类分类标注结果当做输入数据和图片数据一起传给模型训练。
本次研究的神经网络模型结构如图1所示。卷积层采用了被广泛使用在图像分类任务中的VGG模型的卷积滤波器的权重[3],并在其模型上作微调来实现本次研究的目标。
输入层将不同尺寸的图片统一转换成244*244大小。
汇合层(max pooling)是指取一小块像素区域的像素最大值,作用是可减少数据量,控制过拟合。
全连接层的权重采用反向传播算法(back propagation)训练,参数寻优采用随机梯度下降方法。动态学习率设定方法采用了 Adam方法,可根据损失函数在迭代训练中产生的信息自动调整学习率。
激活层函数采用RELU方法,公式为。最后一层预测鱼类分类的激活曾需要把对应于各个分类的分数值转换成总和为1的对应于各个分类的概率值,所以激活函数采用Softmax方法,公式如下
由于卷积神经网络网络强大的表示能力,为了降低模型的过拟合以及加快模型的训练速度,本次工作在激活曾后面再依次加入一层dropout层和batch normalization层。dropout层是指随机的舍弃一部分激活曾神经元的值,并将其置为0[4]。batch normalization层是指规范化每层激活层的输出,并加入4个规范化参数来抑制模型训练过程中的反规范化现象[5]。
2 程序实现
具体的软件实现采用python编程语言和keras框架平台。keras底层采用轻量易用的theano框架,并依赖计算机的显卡来进行更快速的训练工作。整个图像分类的软件框架主要由4部分组成,分别是输入图像数据处理、模型各个网络层的实现及拼接、模型编译、模型训练及预测。下面按数据在模型中流动的顺序具体的阐述各个部分的程序实现。
2.1 输入图像数据处理
人工智能、大数据、光纤网络等技术的发展和改进,人类社会已经进入到了“互联网+”时代,有力的促进了信息化系统的普及和使用,比如证券交易所开发了结算交易系统,政府机关开发了电子政务系统,旅游景区开发了旅游住宿管理系统等,提高了行业智能化、自动化和共享化水平。互联网虽然为人们带来了极大的方便,提高了各行业的信息化水平,但是其也面临着海量的安全攻击威胁,比如数以万计的病毒或木马,都给互联网的应用带来了极大的障碍。目前,网络中流行的攻击包括病毒木马、DDOS攻击等,这些病毒木马常常发生各类型的变异,比如2018年初爆发的勒索病毒,攻击了很多政企单位的服务器,导致终端操作系统无法登录和访问,传统的防火墙、杀毒软件等网络安全防御软件已经无法满足需求,需要引入大数据技术,以便能够将被动防御技术改进为主动防御技术,及时的查处网络中的病毒或木马,从而可以提高互联网防御水平。
1.网络安全防御现状研究
网络安全防御经过多年的研究,已经吸引了很多的学者和企业开发先进的防御技术,比如360安全卫士、访问控制列表、防火墙等,同时还提出了一些更加先进的深度包过滤和自治网络等防御技术,这些技术均由许多的网络安全防御学者、专家和企业进行研究提出,已经在网络中部署喝应用,一定程度上提高了网络防御水平。(1)防火墙防火墙是一种部署于因特网和局域网之间防御工具,其类似一个过滤器,可以不熟一些过滤规则,从而可以让正常的数据通过防火墙,也可以阻止携带病毒或木马的数据通过防火墙,防火墙经过多年的部署,已经诞生了数据库防火墙、网络防火墙、服务器防火墙等,使用枚举规则禁止查看每一个协议是否正常,能够防御一定的病毒或木马。(2)杀毒软件杀毒软件也是一个非常关键的程序代码,可以在杀毒软件系统的服务器中保存检测出的病毒或木马基因特征片段,将这些片段可以与网络中的数据信息进行匹配,从而可以查找网络中的病毒或木马,及时的将其从网络中清除。杀毒软件为了能够准确的识别病毒,目前引入了许多的先进技术,这些技术包括脱壳技术、自我保护技术等,同时目前也吸引了更多的网络安全防御公司研究杀毒软件,最为著名的软件厂商包括360、瑞星、江民、卡巴斯基等,同时腾讯公司、搜狗公司也开发了自己的安全管理技术,大大的提高网络防御能力。(3)访问控制列表访问控制列表是一个易于配置、安装简单和管理容易的网络安全防御工具,设置了黑白两个关键名单,白名单收录了安全数据源IP地址,黑名单收录了非法的数据源IP地址。访问控制列表已经可以在四个层次配置防御策略,分别是目录及控制级、入网访问控制级、属性控制级和权限控制级。访问控制列表级别越高访问性能越好,但是工作效率非常慢,不能够实时升级访问控制列表,因此应用的场所比较简单,一般都是不重要的中小学实验室等,许多大型政企单位都不用这个防御措施。(4)深度包过滤深度包过滤能够嵌入到硬件中形成一个固件,这样就可以快速的采集网络中的数据,然后利用深度包过滤的枚举检查规则,不仅检查数据包的头部IP地址、目的IP地址,还检查数据包中的内容,以便能够深入到数据包内部检查是否存在病毒或木马,一旦发现就可以启动防御软件。深度包过滤可以实施穿透式检查规则,分析每一个协议字段,深入到内部检查的更加详细和全面,从而避免病毒或木马隐藏在数据包内部,因此深度包过滤已经在很多领域得到应用,比如阿里云、腾讯云、百度云等都采用了这些技术,许多的政企单位也采用了深度包过滤技术,进一步提高了数据防御水平。(5)自治网络自治网络作为一种先进的互联网安全防御技术,其采用了自动愈合的建设理念,在网络中构建了一个冗余策略,一旦网络受到病毒或木马的攻击,此时自治网络就可以将这些一部分网络设备隔离,同时形成一个新传输通道为网络设备提供连接,知道数据修复完毕之后才能够将这些网络拓扑结构纳入到网络中。自治网络可以实现自我防御,也可以调动网络信息安全的许多的资源,将网络病毒导入备用服务器,此时就可以杀灭这些病毒。
2.基于大数据的网络安全防御系统设计
网络安全防御系统集成了很多先进的技术,尤其是快速的数据采集和大数据分析技术,能够将传统的被动网络安全防御模式转变为主动,提高网络安全防御性能。本文结合传统的网络安全防御功能及引入的大数据技术,给出了网络安全防御系统的主要功能,这些功能包括四个关键方面,分别是数据采集功能、大数据图1基于大数据的网络安全防御系统功能分析功能、网络安全防御功能和防御效果评估功能。(1)网络数据采集功能目前,人们已经进入到了“互联网+”时代,网络部署的软硬件资源非常多,访问的用户频次数以亿计,因此网络安全防御首先需要构建一个强大的数据采集功能,可以及时的采集网络中的软硬件数据资源,将这些网络数据发送给大数据分析功能。网络数据采集过程中可以引入深度包过滤功能,利用这个深度包过滤可以快速的采集网络数据,提高网络数据采集速度。(2)大数据分析和处理功能网络数据采集完毕之后,系统将数据发送给大数据分析和处理模块,该模块中包含了很多的病毒基因片段或特征,可以针对网络数据进行智能分析,将预处理后的网络数据与学习到的特征进行对比,以便能够发现这些数据信息中是否潜藏着木马或病毒,发现之后及时的将其发送给安全防御模块。(3)网络安全防御功能网络安全防御与传统的防御技术一致,采用木马或病毒查杀软件,因此一旦发现网络中存在病毒或木马,此时就可以启动网络安全防御工具,及时的将网络中的病毒或木马杀灭,并且可以跟踪病毒或木马来源,从而可以锁定源头服务器,将源头清除掉。如果源头涉及到犯罪就可以获取这些证据,同时将这些证据发送给公安机关进行侦破。(4)防御效果评估功能网络安全防御功能完成之后,系统可以针对处理效果进行评估,从而可以获取网络系统中的杀毒信息,将这些网络病毒消灭,避免网络中的病毒或木马复发。网络安全防御效果评估之后,还可以跟踪大数据分析的准确度,一旦准确度降低就可以及时进行学习,从而提高网络安全防御性能。大数据是一种非常关键的数据处理和分析技术,可以利用多种算法,比如BP神经网络算法、支持向量机、深度学习、K-means算法等挖掘数据中潜在的知识,这些知识对人们是有价值的,能够帮助人们进行决策。本文为了能够更好的展示互联网应用性能,重点描述了深度学习算法分析互联网安全数据过程。深度学习算法是一种多层次的卷积神经网络,包括两个非常关键的层次结构,一个是卷积层称为病毒数据特征提取层,一个卷积层为病毒数据特征映射层,可以识别病毒数据中的特征数据,同时将池化层进行处理,压缩和处理池化层数据信息,比如进行预处理、二值化等,删除病毒数据中的一些明显的噪声特征。池化层可以将海量的病毒数据进行压缩,减少卷积神经网络分析时设置的参数,解决卷积神经网络学习和训练时容易产生的过度拟合问题,避免病毒识别模型陷入到一个过度拟合状态,避免无法提高病毒识别能力,还会提升病毒识别处理开销。全连接层就是一个关键分类器,可以将学习到的病毒知识标记到一个特征空间,这样就可以提高病毒识别结果的可解释性。卷积神经网络通过学习和训练之后,其可以形成一个动态优化的网络结构,这个结构可以在一定时期内保持不变,能够实现病毒特征的识别、分析,为病毒识别提供一个准确的结果。
关键词:视觉注意;自顶向下;显著性;对象信息;卷积神经网
中图分类号:TP391.41
文献标志码:A
文章编号:1001-9081(2016)11-3217-05
0 引言
视觉注意机制的研究是探索人眼视觉感知的重要一环。在过去几十年中,如何用计算模型模拟人眼视觉注意过程一直是核心问题。尽管取得了很大的进步,但是快速准确地在自然场景中预测人眼视觉注意区域仍然具有很高的挑战性。显著性是视觉注意的一项重要研究内容,它反映了区域受关注的程度。本文的研究着眼于显著性计算模型,更多模型对比和模型分类可以参考Borji等[1]的文章。视觉注意存在两种机制:自底向上(Bottom-up)和自顶向下(Top-down)。过去的研究中,大多数的计算模型是基于自底向上的信息,即直接从图像像素获取特征。
自底向上显著性计算模型开创性工作源自于文献[2]的Itti模型,该模型是很多其他模型的基础和对照基准,它通过整合多种低层次特征,如颜色、亮度、方向等,给出一个显著度的概率分布图。Harel等[3]在Itti模型的基础上引入图算法,通过计算节点间特征值相似性和空间位置距离进行差异性度量获取显著图。近年来随着深度学习技术在目标识别领域的成功应用[4],研究者们对特征学习产生了更多的兴趣。Borji等[5]通过稀疏编码方法获取特征,使用图像块的稀疏表示结合局部和全局统计特性计算图像块的稀有性(rarity),稀有性反映了当前图像块中心位置的显著性。Vig等[6]通过训练多个神经网络获取层次特征,然后自动优化特征组合。特征提取的过程可以看作是一种隐式空间映射,在映射空间中使用简单的线性模型进行显著或非显著的分类。以上学习方法获得的特征都是一些低层次特征,对图像中的边缘和特定纹理结构敏感。此外,部分研究人员希望从数学统计和信号处理的角度来度量显著性。Bruce等[7]根据最大化信息采样的原则构建显著性模型。Li等[8]总结了多种基于频域的视觉注意研究工作,提出了一种基于超复数傅里叶变换(Hypercomplex Fourier Transform)的视觉注意模型,并展示了其他多种基于频域的模型在某种程度上都是此模型的特例。
以上模型均为数据驱动的显著性模型,模拟人眼视觉注意过程中自底向上的机制。由于人眼视觉注意过程中不可避免地受到知识、任务、经验、情感等因素的影响,因而整合自底向上和自顶向下信息的视觉注意研究受到更多的关注。现有模型整合的自顶向下信息可以分为三类:任务需求、场景上下文和对象特征。
Borji等[9]提出了一种构建任务驱动的视觉注意模型的联合贝叶斯方法。Zhang等[10]提出了一种使用贝叶斯框架整合自底向上和自顶向下显著性信息的方法。Siagian等[11]利用多种低层次特征对场景主旨进行建模,使用场景主旨引导视觉注意的转移。考虑到任务需求和场景上下文建模的复杂性,研究人员将对象特征视为一种高层次的知识表示形式引入视觉注意模型中。Judd等[12]和Zhao等[13]通过将低层次特征和对象特征整合在一个学习框架下来获得特征整合过程中每张特征图的叠加权重,但是模型使用的对象特征只有人脸、行人、车辆等有限的几种。Borji等[14]遵循了同样的方法,但是在整合过程中添加了更多特征并且结合了其他显著性模型的结果,最后用回归、支撑向量机(Support Vector Machine, SVM)、 AdaBoost等多种机器学习算法结合眼动跟踪数据进行训练。实验结果表明对象特征引入较大地提高了模型性能。Xu等[15]将特征划分为像素级、对象级和语义级三个层次,并重点探索对象信息和语义属性对视觉注意的作用;然而,模型中的对象级和语义级特征是手工标定的,因而不是一种完全意义上的计算模型。
总的来看,虽然部分模型已经使用对象特征作为自顶向下的引导信息,但是在对象特征的获取和整合上仍有很大的局限性。首先,对不包含特定对象的场景适应性较差;其次,对象特征描述困难,通常是通过特定目标检测方法获取对象特征,计算效率低下;此外,对象特征的简单整合方式不符合人眼的视觉感知机制。本文提出了一种结合深度学习获取对象特征的视觉注意计算模型,重点研究了对象级特征的获取和整合方法。算法结构如1所示,其中像素级突出图获取采用现有视觉注意模型的方法,对象级突出图获取采用本文提出的基于卷积神经网(Convolutional Neural Network, CNN)的特征学习和基于线性回归的特征整合方法。实验结果表明,对象级特征的引入可以明显提高显著性预测精度,预测结果更符合人类视觉注意效果。
1 对象信息获取
1.1 对象特征
大量实验证据表明对象特征引导视觉注意的转移。视觉注意中引入对象特征是为了获得图像中对象位置等信息,目的与计算机视觉中的目标检测类似。因而,已有的视觉注意计算模型的对象特征通常是通过特定目标检测方法获得。其中,Viola&Jones人脸检测和Felzenszwalb车辆行人检测是最常用的方法。文献[12-14]均使用此类方法引入对象特征。由于这一类特征针对特定对象样本进行设计和训练,因而推广能力不强。
li=fixations(obji)area(obji)(3)
其中: fixations()表示落入当前对象区域的正样本的数目;area()表示对象区域面积。li衡量当前对象单位面积受关注的程度,对象单位面积受关注程度越高,其在对象整合过程中的权重应越高,因而li与叠加权重成正比。
式(4)通过一个线性回归模型对已有样本数据进行训练,获得对象整合叠加权重W:
L=WF(4)
其中:F={F1,F2,…,FN}为训练样本数据集合;L={l1,l2,…,lN}为训练样本标签集合。
测试时根据式(5)~(6)获得对象级突出图:
3 显著图生成
视觉注意是自底向上和自顶向下两种机制作用的结果。完全使用自顶向下的对象特征进行显著区域预测有一定缺陷,主要表现在以下几个方面:首先,知识是对训练样本数据的抽象表示,由于神经网络的规模和训练样本中对象种类的限制,场景中部分对象对应的特征没有被抽象在网络结构中;其次,部分不具有明确语义的区域被错误地认为是对象,对视觉注意形成错误的引导;另外,人眼视觉注意转移的生理学机制并不清楚,兴趣区可能落在不具有对象特征区域中。因此,使用像素级特征给出低层次显著性信息是必要的。
视觉注意模型中常用的像素级特征有颜色、亮度、方向等[2-3,12]。本文直接使用GBVS(Graph-Based Visual Saliency)算法[4]整合多种像素级特征获取像素级突出图Spixel。式(7)给出了整合的方法:
其中:S(i, j)为最终给出的视觉注意显著图;N()为归一化操作;λ控制对象级突出图与像素级突出图的相对权重,通过实验分析可知λ=0.4时效果较好。当图像中不存在显著物体或无法获得高置信度的对象信息时,图像任意位置Sobj(i, j)=0,此时完全由像素级特征驱动的视觉注意引导。
4 实验结果及分析
本次实验是以Visual Studio 2012为实验平台,选取OSIE和MIT数据集作为实验数据。OSIE数据集包含700张含有一个或多个明显语义对象的图片以及15名受试者的眼动跟踪数据,此外该数据集还提供了语义对象统计及人工标注的精确对象区域。MIT数据集包含1003张自然场景图片以及15名受试者的眼动跟踪数据。这两个数据集是当前视觉注意研究领域中较大的数据集。为了验证本文方法的准确率,将本文算法与GBVS[4]、 Itti[2]、 Judd[3]、 AIM[10]、LG[8]等视觉注意方法进行对比。
对比实验中使用的评价指标为ROC(Receiver Operating Characteristic)曲线,实现方法与文献[12,15]相同。图6~8为实验对比结果,显著区域百分比是通过对归一化显著图作阈值处理获得,真正率(True Positive Rate)反映当前落入显著区域的样本占所有样本的比例。通过变化显著区域百分比获得ROC曲线。为了更直观比较算法效果,实验结果图中标注了每种算法的AUC(Area Under Curve)值,AUC值通过计算ROC曲线下的面积获得。AUC值越大表示该方法给出的显著性预测结果越准确。
图6为利用对象级突出图作为显著图在OSIE数据集上的实验结果。相对于RCNN算法, fasterRCNN算法使用了更深层次的网络结构和更多对象类别的训练样本,具有较高的对象位置预测准确率和对象检出率。实验分析可以看出,使用fasterRCNN算法生成对象级突出图可以更好进行显著性预测。同时,人脸特征(FACE)的引入进一步提升了预测准确性,从一个侧面说明了对象性信息对视觉注意的转移具有引导作用。
图7是多种视觉注意算法在OSIE数据集上的ROC曲线,可以看出本文方法实验效果明显好于其他算法。仅次于本文算法的是GBVS和Judd,Itti的准确率较差。图中对象级特征曲线为使用fasterRCNN结合人脸特征生成对象级突出图获得,由于该方法完全使用自顶向下的对象特征,显著性预测准确率明显弱于其他方法,因而证明了引入像素级特征必要性。图8为MIT数据集上的实验结果,本文方法和Judd算法为最好的两种方法,实验结果相差不大。AIM和LG方法效果较差。本文方法和Judd方法均使用了对象特征,可以看出整合了对象特征的方法相对于完全自底向上模型有明显优势。
图9中给出了多种算法显著图的直观对比。与其他方法强调对象边缘不同,本文结合了对象信息的方法可以有效突出图像中的完整对象区域。
5 结语
本文提出一种结合对象信息的视觉注意方法。与传统的视觉注意整合对象方法相比,该方法利用卷积神经网学到的对象特征,获取图像中对象位置等信息;然后通过一个线性回归模型将同一幅图像的多个对象加权整合,获得对象级突出图;最后,根据视觉注意的层次整合机制,将低层次特征和对象特征进行融合形成最终的显著图。本文方法在不同数据集上的准确率要高于现有模型。针对包含明显对象的图像,本文方法克服了部分现有模型由于边缘强化效果导致的显著区域预测不准的问题。本文方法仍然存在一定局限性,未来的工作将尝试非线性对象整合以及增大训练样本数量和网络规模以获取更多种对象特征。
参考文献:
关键词:人工智能;科技情报;自动感知
中图分类号:TP18文献标志码:A文章编号:2095-2945(2020)32-0057-02
Abstract:Fromtheperspectiveofartificialintelligence,peoplerequireasignificantimprovementintheaccuracyofscientificandtechnologicalinformationservices,sothatitsvaluecontinuestorise,bringingchallengesandopportunitiesforintelligencework.Bysummarizingthecontentsofartificialintelligenceandscientificandtechnologicalinformation,combinedwithartificialintelligencetechnology,thispaperstudiestheautomaticperceptionofscientificandtechnologicalinformationneedsconcerningthekeypoints,contentperceptionandotheraspects,highlightingthewisdom,intelligenceandefficiencyofscientificandtechnologicalinformationwork,andoptimizingtheautomaticperceptionscheme.
Keywords:artificialintelligence;scientificandtechnologicalinformation;automaticperception
前言
当前科技情报服务对象不仅局限于特定的行业和领域,已经逐渐渗透至某一技术和个人,情报机构只有提升情报分析和反应能力才可以满足新需求。因此,机构有必要加强对用户需求的感知度,依托人工智能技术构建科技情报的感知框架,提升感知工作的合理性和高效性,进而挖掘科技情报感知领域的价值。
1人工智能及科技情报感知概述
1.1人工智能分析
人工智能又称AI,伴随着计算速度、核心算法的优化,该技术已经在神经网络、自然语言、机器学习等方面趋于成熟。当前人工智能技术可以定制个性化任务,结合不同的环境响应个体需求,制定解决方案[1]。因此,人工智能技术能够快速处理海量数据,若人类智力水平已无法满足严苛工作要求,可以借助人工智能技术处理复杂工作。同时,科技情报感知模块属于综合预测过程,因此有必要结合人工智能技术制定科技情报感知方案,实现情报工作向智慧化、个性化、精准化方向发展。
1.2情报感知分析
科技情报感知主要是工作人员针对采集到的数据完成处理、分析,进而满足受众对于情报的需求,并对今后其发展过程进行预测。学者刘记曾指出,依托科技情报感知工作可以为实现国家治理体系和治理能力现代化提供支持,加快情报刻画、情报感知以及情报响应能力的建设进程。其中,情境感知的研究具有一定复杂度,G.Chen通过调查情境信息、情境类型、情境传播等模型和系统,分析情境感知的应用程序,得出情境感知是领域普适学习的关键。例如,借助情境感知可以为用户提供体温、运动路径、温度等方面的服务。
因此,科技情报感知工作对于我国情报治理、预先感知等方面影响较大,结合人工智能技术创新科技情报感知模块已是大势所趋。当前大数据时代科技情报已经不仅停留于文献领域,正逐渐向多种数据源模式发展,要求科技情报软硬件不断升级优化,数据存储和处理水平逐渐升级,进而满足社会对情报数据的需求。
2人工智能视域下科技情报需求自动感知研究
2.1融合关键点
(1)创新驱动。当前科技情报需求逐渐向科技创新领域发展,依托我国创新驱动的发展战略,基于科学技术完成升级和发展。将科学技术和科技情报相结合后,情报工作的创新性较强,具有数字化和智慧化优势,并突出情报工作的个性化和精准性。因此,依托人工智能技术完成科技情报的自动感知十分关键,是当前科技发展的必经之路。
(2)前瞻性定位。新时期资源的网络化和数字化发展为科技情报研究工作提供大数据支持,可以在海量数据的收集、分析、处理方面发挥优势。传统的数据研究方式很难在大量数据的基础上提升情报研究质量,同时会增加研究人员的任务量。且每位工作人员自身的专业知识、情报敏感度、知识状态存在差异性,导致最终得出的情报结果不同甚至差异化较大。应用人工智能技术完成科技情报的自动感知十分重要,可以突出工作的准确性、高效性和稳定性。因此,将新兴人工智能技术和传统情报服务工作相融合是现代情报领域的关键,如自动获取和加工情报、高速处理文本信息、人工智能决策平台、依托語义内容的科研成果评价等[2]。
2.2内容感知
(1)感知系统分析。大数据背景下,科技情报预测和传播功能受到重视和应用,属于科技领域的研究热点,可以对竞争、合作、研究方面进行正确的价值判断。科技情报感知主要依托可靠、丰富的数据,借助“互联网+大数据”模式获取信息,在多种资料中得到关键的信息和数据,进而完成科技情报的感知工作。同时,数据源具有冗余度高、形式多样、存储量大的优势,因此能够落实科技情报感知工作,筛选数据源、除去冗余数据、分析剩余有效信息。借助数据集模式与知识储备库、感知数据库一同为感知过程提供信息支持。内容感知系统内的数据源并非固定不变,且信息的更新速度较快、技术淘汰时间较短,因此内容感知是实时更新、持续变化的数据系统。基于相关辅助项目,帮助用户了解工作内容。例如,借助“科技情报产品报告”为感知系统研究和应用提供支持,该报告可以帮助用户了解系统,提前评估系统实际能力,便于用户针对性提出情报需求。
(2)系统实现模式。a.数据源存储。若想发挥科技情报的自动感知作用,系统内需要具备大容量数据集合,进而为感知产品提供分析支持。同时,数据处理过程中对于信息查询、存储挑战较大。因此,本课题结合Neo4j数据库、互联网技术提升数据处理和存储效率,提高系统适应水平,保证其良好的查询效率。Neo4j数据库主要划分为两类应用模式:服务器模式、内嵌模式。本课题利用内嵌模式,借助Java-API,将Neo4j数据库和图模型相互整合。由于API的特点是数据结构灵活,因此可以通过直接编码的模式和图数据库完成交互操作。b.数据源分类。若想对数据源完成自动分类,建议识别数据源的结构功能。例如,利用机器学习、词汇特征等方式划分数据源的功能及结构。依托数据源要素、类型词汇特点、词汇分布特征等方面,依托神经网络内分类器训练模式,围绕领域技术、专题、情报报告、组织数据库等方面对数据源进行分类[3]。c.构建任务抽取模型。结合用户需求抽取目标任务可以充分发挥科技情报的自动感知优势,优化RNN模块。在研究阶段利用Bi-LSTM-CRF、卷积网络模型抽取数据源,并借助长短时双向记忆模型化解RNN梯度爆炸、消失情况。抽取模型内的输入数据是卷积,包含知识元素、句子、词等特征向量,而输出数据则依托(Conditionalrandomfield)条件随机得到结果完成预测。此模型借助多元组的方式展示数据源抽取结果,围绕数据源性质、事项、主体、依据、对象等要素进行连接。
2.3情境感知
(1)情境感知系统。情境感知系统内部因素种类较多,且科技情报感知阶段需要依据情境完成,并对感知结果造成影响。因此,在开展科技情报感知工作时,建议对特定用户完成重新评估。同时,情境感知在情报感知工作中十分关键,若忽视结果会对外部情境产生较大影响,使预测工作丧失精准度。因此,应基于外部情境条件定位事物发展方向,得到精准感知结果,发挥情报前瞻性优势。其中在获取情境数据时应关注“小数据”,即初始结构化数据,此类资源虽数量较小,但是内部包含价值信息,可以获取历史情境信息。此外,问题情境应围绕横向和纵向两个层面分析,横向维度是梳理本层实际情况,针对性选择研究方法和处理方式;纵向维度则依托时间节点理清情境信息。
(2)系统执行方案。情境感知系统建设主要内容是借助科技手段获取某一情境内的数据并完成融合。因此,情境感知技术实际上是借助人工智能中传感器等技术,依托计算机感知当前情境,完成感知应用、智能识别、决策支持,具有无干扰的优势。情境感知包含情境获取、处理、应用三个阶段。其中,情境获取主要依靠传感器终端获取设备关联、用户关联、资源关联、环境关联情境,并将上述情境信息转变为数字信号,利用嵌入系统完成判断和处理;情境处理过程则借助建模的方式控制情境信息,构建信息数据库。整合情境感知信息并协调对应的组合,控制资源分布并将其嵌入至感知数据库内;服务应用阶段相当于人工智能处理模块,可以结合用户需求提供合理服务。
2.4需求-反馈机制
(1)工作过程。需求-反馈机制实际上可以体现用户和人工智能间的关联性,属于科技情报感知的关键环节,包含自动感知信息、数据、产品模块。依托人工智能技术,通过AI方式减轻工作人员任务量。其中,AI能够智能化处理多领域工作,如医疗、教育、驾驶、金融、安防等。在科技情报感知领域引入人工智能技术可以准确、高效、及时地开展情报工作,提升工作效率、减少决策偶然性、加快数据分析处理速度。同时,科技情报感知工作的主体是用户,首先需要将其对产品的需求发送至AI处,其次借助人工智能模块分析、整合内外感知数据库信息,最后向用户反馈情报产品和相关结果。
(2)情报感知产品。情报感知产品主要结合用户产品需求,依据感知数据库内的条件因素预测今后用户对于情报产品的需求,进而在后续工作中有针对性地向用户推送产品信息,为科技情报工作的可持续发展提供支持。因此,人工智能和科技情报感知工作相结合可以充分发挥自动感知优势,降低对工作人员决策的依赖性。专业人员依据多种数据源进行分析与评估,最终得出精准的感知结果。同时,人工智能技术的应用可以自动形成情报感知产品,并向用户推送反馈数据,由主动感知向自动感知发展,契合新时期情报3.0的发展趋势,加快国家科技决策和科技创新发展进程。
1 当前电力行业热工自动化技术的发展
随着世界高科技的飞速发展和我国机组容量的快速提高,电厂热工自动化技术不断地从相关学科中吸取最新成果而迅速发展和完善,近几年更是日新月异,一方面作为机组主要控制系统的DCS,已在控制结构和控制范围上发生了巨大的变化;另一方面随着厂级监控和管理信息系统(SIS)、现场总线技术和基于现代控制理论的控制技术的应用,给热工自动化系统注入了新的活力。
1.1 DCS的应用与发展
火电厂热工自动化系统的发展变化,在二十世纪给人耳目一新的是DCS的应用,而当今则是DCS的应用范围和功能的迅速扩展。
1.1.1 DCS应用范围的迅速扩展
20世纪末,DCS在国内燃煤机组上应用时,其监控功能覆盖范围还仅限DAS、MCS、FSSS和SCS四项。即使在2004年的Q/DG1-K401-2004《火力发电厂分散控制系统(DCS)技术规范书》中,DCS应用的主要功能子系统仍然还是以上四项,但实际上近几年DCS的应用范围迅速扩展,除了一大批高参数、大容量、不同控制结构的燃煤火电机组(如浙江玉环电厂1000MW机组)的各个控制子系统全面应用外,脱硫系统、脱硝系统、空冷系统、大型循环流化床(CFB)锅炉等新工艺上都成功应用。可以说只要工艺上能够实现的系统,DCS都能实现对其进行可靠控制。
1.1.2 单元机组控制系统一体化的崛起
随着一些电厂将电气发变组和厂用电系统的控制(ECS)功能纳入DCS的SCS控制功能范围,ETS控制功能改由DCS模件构成,DEH与DCS的软硬件合二为一,以及一些机组的烟气湿法脱硫控制直接进入单元机组DCS控制的成功运行,标志着控制系统一体化,在DCS技术的发展推动下而走向成熟。
由于一体化减少了信号间的连接接口以及因接口及线路异常带来的传递过程故障,减少了备品备件的品种和数量,降低了维护的工作量及费用,所以近几年一体化控制系统在不同容量的新建机组中逐渐得到应用,如浙江华能玉环电厂4×1000MW机组、台州电厂2×300MW机组和安徽凤台电厂4×600MW机组均全厂采用西屋Ovation系统,国华浙能宁海电厂4×600MW机组全厂采用西门子公司的T-XP系统,大唐乌沙山电厂4×600MW机组全厂采用I/A系统,浙江乐清电厂4×600MW机组全厂采用ABB公司的SYMPHONY系统等。
控制系统一体化的实现,是电力行业DCS应用功能快速发展的体现。排除人为因素外,控制系统一体化将为越来越多的电厂所采用。
1.1.3 DCS结构变化,应用技术得到快速发展
随着电子技术的发展,近年来DCS系统在结构上发生变化。过去强调的是控制功能尽可能分散,由此带来的是使用过多的控制器和接口间连接。但过多的控制器和接口间连接,不一定能提高系统运行可靠性,相反到有可能导致故障停机的概率增加。何况单元机组各个控制系统间的信号联系千丝万缕,互相牵连,一对控制器故障就可能导致机组停机,即使没有直接导致停机,也会影响其它控制器因失去正确的信号而不能正常工作。因此随着控制器功能与容量的成倍增加、更多安全措施(包括采用安全性控制器)、冗余技术的采用(有的DCS的核心部件CPU,采用2×2冗余方式)以及速度与可靠性的提高,目前DCS正在转向适度集中,将相互联系密切的多个控制系统和非常复杂的控制功能集中在一对控制器中,以及上述所说的单元机组采用一体化控制系统,正成为DCS应用技术发展的新方向,这不但减少了故障环节,还因内部信息交换方便和信息传递途径的减少而提高了可靠性。
此外,随着近几年DCS应用技术的发展,如采用通用化的硬件平台,独立的应用软件体系,标准化的通讯协议,PLC控制器的融入,FCS功能的实现,一键启动技术的成功应用等,都为DCS增添了新的活力,功能进一步提高,应用范围更加宽广。
1.2 全厂辅控系统走向集中监控
一个火电厂有10多个辅助车间,国内过去通常都是由PLC和上位机构成各自的网络,在各车间控制室内单独控制,因此得配备大量的运行人员。为了提高外围设备控制水平和劳动生产率,达到减员增效的目的,随着DCS技术和网络通讯功能的提高,目前各个辅助车间的控制已趋向适度集中,整合成一个辅控网(简称BOP 即Balance Of Plant的缩写)方向发展,即将相互独立的各个外围辅助系统,利用计算机及网络技术进行集成,在全厂IT系统上进行运行状况监控,实现外围控制少人值班或无人值班。
近几年新建工程迅速向这个方向发展。如国华浙能宁海电厂一期工程(4×600MW)燃煤机组BOP覆盖了水、煤、灰等共13个辅助车间子系统的监控,下设水、煤、灰三个监控点,集中监控点设在四机一控室里,打破了传统的全厂辅助车间运行管理模式,不但比常规减员30%,还提升了全厂运行管理水平。整个辅控网的硬件和软件的统一,减少了库存备品备件及日常管理维护费用[1]。由于取消了多个就地控制室,使得基建费用和今后的维护费用都减少。一些老厂的辅助车间也在进行BOP改造,其中浙江省第一家完成改造的是嘉兴发电厂2×300MW机组,取得较好效果。
1.3 变频技术的普及应用与发展
变频器作为控制系统的一个重要功率变换部件,以提供高性能变压变频可控的交流电源的特点,前些年在火电厂小型电机(如给粉机、凝泵)等控制上的应用,得到了迅猛的发展。由于变频调速不但在调速范围和精度,动态响应速度,低速转动力矩,工作效率,方便使用方面表现出优越性,更重要的是节能效果在经济及社会效益上产生的显著效应,因此继一些中小型电机上普遍应用后,近年来交流变频调速技术,扩展到一些高压电机的控制上试用,如送、引风机和给水泵电机转速的控制等。
因为蕴藏着巨大的节能潜力,可以预见随着高压变频器可靠性的提高、一次性投资降低和对电网的谐波干扰减少,更多机组的风机、水泵上的大电机会走向变频调速控制,在一段时间内,变频技术将继续在火电厂节能工作中,扮演重要角色。
1.4 局部系统应用现场总线
自动化技术的发展,带来新型自动化仪表的涌现,现场总线系统(FCS)是其中一种,它和DCS紧密结合,是提高控制信号传输的准确性、实时性、快速性和机组运行的安全可靠性,解决现场设备的现代化管理,以及降低工程投资等的一项先进的和有效的组合。目前在西方发达国家,现场总线已应用到各个行业,其中电力行业最典型的是德国尼德豪森电厂2×950MW机组的控制系统,采用的就是PROFIBUS现场总线。
我国政府从“九五”起,开始投资支持现场总线的开发,取得阶段性成果,HART仪表、FF仪表开始生产。但电厂控制由于其高可靠性的要求,目前缺乏大型示范工程,缺乏现场总线对电厂的设计、安装、调试、生产和管理等方面影响的研究,因此现场总线在电厂的应用仍处于探讨摸索阶段,近二年我国有十多个工程应用了现场总线,但都是在局部系统上,其中: 国华浙能宁海电厂,在单元机组的开、闭式水系统中的电动门控制采用Profibus DP总线技术,电动执行机构采用原装进口德国欧玛公司的一体化智能型产品Puma Matic,带有双通道Profibus-DP冗余总线接口作为DP从站挂在总线上。为了提高安全性可靠性,总线光纤、作为总线上的第一类DP主站的AP和相应的光电转换装置都采用了冗余结构,这是国内首家在过程控制中采用现场总线技术的火力发电厂。
华能玉环电厂的补给水处理系统和废水系统[2],采用了二层通讯网络结构的现场总线控制系统,其链路设备和主站级网络采用冗余配置。控制系统人机终端与主控制器之间采用工业以太网通讯,以太网交换机采用ITP形式接口,四台交换机构成光纤高速路网。现场设备层之间采用Profibus-DP现场总线通讯。主环网采用光缆,分支现场总线通讯选用总线电缆。配置二套冗余的主控制器,分别用于锅炉补给水系统和废水系统,且各自有两条由光电耦合器组成的现场总线环形光缆网构成冗余配置,所有现场仪表和气动阀门定位器(均采用带PA总线接口),通过DP/PA耦合器连接到现场总线上。中低压电器设备(MCC)采用具有现场总线通信接口功能的智能电机控制器。加药泵的电动机采用带总线的变频器。锅炉补给水的阴阳离子床气动隔膜阀的电磁控制阀,采用具有总线接口的阀岛来控制,阀岛与现场总线连接。这是国内在局部过程控制中全面采用现场总线技术的首个火电厂,其应用实践表明,辅控网全面采用现场总线技术已成熟。
1.5 热工控制优化技术的应用发展
随着过程生产领域对控制系统要求的不断提高,传统控制方法越来越难以满足火电厂热力流程对系统稳定性和性能最优化方面的要求,汽温超标已经成为制约机组负荷变化响应能力和安全稳定运行的主要障碍之一(燃烧优化主要是锅炉专业在进行,本文不作讨论)。由此基于现代控制理论的一些现代控制系统逐步在火电厂过程控制领域中得到应用。如基于过程模型并在线动态求解优化问题的模型预测控制(简称MPC)法、让自动装置模拟人工操作的经验和规律来实现复杂被控对象自动控制的模糊控制法、利用熟练操作员手动成功操作的经验数据,在常规的串级PID调节系统的基础上建立基于神经网络技术的前馈控制作用等,在提高热工控制系统(尤其是汽温控制系统)品质过程中取得较好效果。
如宁海发电厂使用的西门子公司PROFI系统,充分使用了基于模型的现代控制理论,其中汽温控制原理示意图如图1所示。
图1 机组汽温控制原理示意图
图1中,用基于状态空间算法的状态观测器解决汽温这种大滞后对象的延迟造成的控制滞后,焓值变增益控制器解决蒸汽压力的变化对温度控制的影响,基于模型的Smith预估器对导前温度的变化进行提前控制;通过自学习功能块实时补偿减温水阀门特性的变化;而对再热汽温控制,尽量以烟道挡板作为调节手段,不采用或少采用减温水作为控制手段,以提高机组效率;在机组协调控制模块中,采用非最小化形式描述的离散卷积和模型,提高系统的鲁棒性;根据控制品质的二次型性能指标连续对预测输出进行优化计算,实时对模型失配、时变和干扰等引起的不确定性因素进行补偿,提高系统的控制效果;PROFI投入后,AGC状态下以2% Pe /min负荷率变化时的响应时间为57秒,压力最大偏差0.208MPa,汽包水位变化最高和最低之差为-38.86mm,炉膛负压变化曲线最高值和最低值差-145Pa,主蒸汽温度偏差稳态基本控制在2℃以内,动态基本控制在5℃以内。
1.6 SIS系统的应用发展
SIS系统是实现电厂管理信息系统与各种分散控制系统之间数据交换、实时信息共享的桥梁,其功能包括厂级实时数据采集与监视,厂级性能计算与分析。在电网明确调度方式有非直调方式且应用软件成熟的前提下,可以设置负荷调度分配功能。设备故障诊断功能、寿命管理功能、系统优化功能以及其它功能(根据电厂实际情况确定是否设置)[3]。自从国家电力公司电力规划总院在2000年提出这一概念和规划后,至今估计有200家多电厂建立了SIS系统,可谓发展相当迅速。
但是自从SIS系统投运以来,其所起的作用只是数据的采集、存储、显示和可打印各类生产报表,能够真正把SIS的应用功能尽情发挥出来的很少,其面向统计/生产管理的数据分析工具,基于热经济性分析的运行优化,以品质经济性为目标的控制优化,以提高可靠性为目的的设备故障诊断等功能基本多数都未能付绪实施。其原因主要有设计不够完善,多数SIS厂家并没有完全吃透专业性极强的后台程序及算法,使其在生产实际中未能发挥作用,加上与现场生产脱节,因此SIS商所能做的只是利用网络技术,边搭建一个基本的SIS 架构边进行摸索。此外SIS应涵盖哪些内容没有统一的标准也缓慢了其功能的应用。
但从大的方向上看,SIS系统的建设符合技术发展的需要和中国电力市场发展的趋势,将给发电厂特别是大型的现代化发电厂带来良好的经济效益。
2 电力行业热工自动化系统的未来发展动向及前景
随着国家法律对环保日益严格的要求和计算机网络技术的进步,未来热工系统将围绕 “节能增效,可持续发展”的主题,向智能化、网络化、透明化,保护、控制、测量和数据通信一体化发展,新的测量控制原理和方法不断得以应用,将使机组的运行操作和故障处理,象操作普通计算机一样方便。
2.1 单元机组监控智能化是热工自动化系统发展方向
单元机组DCS的普及应用,使得机组的监控面貌焕然一新,但是它的监控智能化程度在电力行业却没有多大提高。虽然许多智能化的监视、控制软件在国内化工、冶金行业中都有较好的应用并取得效益,可在我国电力行业直到近几年才开始有所起步。随着技术的进步,火电厂单元机组自动化系统的智能化将是一种趋势,因此未来数年里,实现信息智能化的仪表与软件将会在火电厂得到发展与应用,如:
仪表智能管理软件,将对现场智能传感器进行在线远程组态和参数设置、对因安装位置和高静压造成的零位飘移进行远程修正,精度自动进行标定,计算各类误差, 并生成标定曲线和报告;自动跟踪并记录仪表运行过程中综合的状态变化,如掉电、高低限报警、取压管路是否有堵或零位是否有飘移等。
阀门智能管理软件将对智能化阀门进行在线组态、调试、自动标定和开度阶跃测试,判断阀门阀杆是否卡涩, 阀芯是否有磨损等,通过阀门性能状况的全面评估,为实现预测性维护提供决策。
重要转动设备的状态智能管理软件将对重要转动设备的状态如送风机,引风机,给水泵等,综合采用基于可靠性的状态监测多种技术,通过振动、油的分析以及电机诊断,快速分析(是否存在平衡不好,基础松动, 冲击负荷,轴承磨损)等现象和识别故障隐患, 在隐患尚未扩展之前发出报警,为停机检修提供指导和帮助。
智能化报警软件将对报警信号进行汇类统计、分析和预测,对机组运行趋势和状态作出分析、判断,用以指导运行人员的操作;故障预测、故障诊断以及状态维修等专用软件,将在提高机组运行的安全性,最大限度地挖掘机组潜力中发挥作用。单元机组监控智能化将带来机组检修方式的转变,以往定期的、被动式维护将向预测性、主动式为主的维护方式过渡,检修计划将根据机组实际状况安排。
2.2 过程控制优化软件将得到进一步应用
进一步提高模拟量控制系统的调节范围和品质指标,是火电厂热工自动化控制技术研究的一个方向。虽然目前有关自适应、状态预测、模糊控制及人工神经网络等技术,在电厂控制系统优化应用的报道有不少,但据笔者了解真正运行效果好的不多。随着电力行业竞争的加剧,安全、经济效益方面取得明显效果、通用性强、安装调试方便的优化控制专用软件(尤其是燃烧和蒸汽温度优化、性能分析软件、)将会在电厂得到亲睐、进一步发展与应用。
目前机组的AGC均为单机方式(由调度直接把负荷指令发给投入AGC的机组)。由于电网负荷变化频繁,使投入AGC的机组始终处于相应的变负荷状态,锅炉的蒸汽压力和温度波动幅度大,辅机、阀门、挡板等设备动作频繁,这种方式对机组和设备的寿命都会产生一定的负面影响。随着发电成本的提高,发电企业需从各个角度考虑如何切实降低电厂运行成本,延长机组的使用寿命。因此配置全厂负荷分配系统(即电网调度向电厂发一个全厂负荷指令,由电厂的全厂负荷分配系统,以机组的煤耗成本特性为基础,在机组允许的变化范围内,经济合理地选择安排机组的负荷或变负荷任务,使全厂发电的煤耗成本最低,降低电厂的发电成本)将是发电企业必然的要求,相信不久的将来,单机AGC方式将会向全厂负荷分配方式转变。转贴于
SIS系统将结合生产实际进行二次开发,促进自身应用技术走向成熟,在确保火电厂安全、环保、高效益及深化信息化技术应用中发挥作用。
2.3 现场总线与DCS相互依存发展
未来一段时间里,现场总线将与DCS、PLC相互依存发展,现场总线借助于DCS和PLC平台发展自身的应用空间,DCS和PLC则借助于现场总线完善自身的功能。
2.3.1 现场总线与DCS的关系
现场总线作为一个完整的现场总线控制系统,目前还难以迅速应用到整个电厂中,而DCS虽然是电厂目前在线运行机组的主流控制系统,但由于其检测和执行等现场仪表信号仍采用模拟量信号,无法满足工程师站上对现场仪表进行诊断、维护和管理的要求,限制了控制过程视野,因此DCS通过容入通信协议国际标准化的现场总线和适合现场总线连接的智能化仪表、阀门,并将自身的输出驱动功能分离移到现场或由现场智能驱动器代替,功能简单且相对集中的控制系统下放到采用FCS控制和处理功能的现场智能仪表中,然后由少量的几根同轴电缆(或光缆)和紧急停炉停机控制用电缆,通过全数字化通信与控制室连接。将有助于降低电厂造价,提高自身的可靠性,拓宽各自的功能,推动各自的发展。除新建电厂将会更多的采用现场总线的智能设备外,也会成为运行多年的机组下一步的改造计划。
2.3.2 现场总线与PLC的关系
现场总线在电厂的应用将借助于PLC,这不但因为PLC已广泛应用于电厂辅助设备的控制,将现场总线技术和产品溶合到PLC系统中,成为PLC系统中的一部分或者成为PLC系统的延伸部分,在辅助设备的控制中将直接明显地体现其经济效益。还因为现场总线和PLC的制造商间关系密切,如Contr01.Net、ProfiBus等本身就是由PLC的主要生产供货商支持开发。
由于电厂现场的环境恶劣,温度高、灰尘多、湿度变化大,因此现场总线在电厂应用,首先要解决的是自身质量。
2.4 辅助车间(系统)集控将得到全面推广
随着发电厂对减员增效的要求和运行人员整体素质的提高,辅助车间(系统)通过辅控网集控将会得到进一步全面推广。但在实施过程中,目前要解决好以下问题:
(1)辅控系统I/O点数量大(浙江宁海电厂已达到10000点),各辅助车间物理位置分散,存在远距离通信、信号衰减和网络干扰问题,因此监控系统主干通信网宜采用多模光缆以确保通信信号的可靠性。
(2)各辅助控制系统采用不同的控制设备,控制系统的通信接口协议不同,甚至不同的物理接口,因此须解决网络通信协议的转换问题,选型时应事先规定好各系统间的接口连接协议。
(3)各个辅助车间的控制系统为不同的厂商供货,由于使用的软件不同,其操作员站的人机界面很有可能不一致。因此选型时应注意上位机软件,设计统一的人机界面,采用统一的风格及操作方式,以便方便各系统画面接入BOP网络。
辅助车间集控系统能否实现设计目标,除了自身的技术以外,很大程度上取决于辅助系统本身的自动投入情况。因此高可靠性的执行机构、动作灵活可靠的限位开关、智能化的变送器将会得到应用;
2.5 单元机组监控系统的物理配置趋向集中布置
过去一个集控室的概念,通常为一台单元机组独用或为二台机组合用,电子室分成若干个小型的电子设备间,分别布置在锅炉、汽轮机房或其它主设备附近。其优点是节省了电缆。但随着机组容量的提高、计算机技术的发展和管理水平的深化,近几年集控室的概念扩大,出现了全厂单元机组集中于一个控制室,单元机组的电子设备间集中,现场一般的监视信号大量采用远程I/O柜的配置方式趋势,如浙江省国华浙能宁海发电厂(获国家金奖),一期工程四台机组一个控制室集中监控,单元机组电子室集中,提高了机组运行管理水平。
2.6 APS技术应用
APS是机组级顺序控制系统的代名词。在机组启动中,仅需按下一个启动控制键,整个机组就将按照设计的先后顺序、规定的时间和各控制子系统的工作情况,自动启停过程中的相关设备,协调机炉电各系统的控制,在少量人工干预甚至完全不用人工干预的情况下,自动地完成整台机组的启停。但由于设备自身的可控性和可用率不满足自动化要求,加上一些工艺和技术上还存在问题,需要深入地分析研究和改进,所以目前燃煤机组实施APS系统的还不多见。
由于APS系统的实质是电厂运行规程的程序化,其优势在于可以大大减轻运行人员的工作强度,避免人为操作中的各种不稳定因素,缩短机组启停时间。作为提高生产效率和机组整体自动化水平,增强在电力企业的市场竞争能力行之有效的方法,将会成为未来机组控制发展的方向之一,引导设计、控制系统厂商和电厂人员更多地去深入研究,设计和完善功能,并付绪实施。
2.7 无线测量技术应用
无线测量技术能监视和控制运行过程中发生的更多情况,获得关键的工艺信息,整合进入DCS。除节省大量安装成本以外,还将推动基本过程和自动化技术的改善。如供热、供油和煤计量,酸碱、污水区域测量等,都可能通过无线测量技术实现远程监控。
2.8 提高热工自动化系统可靠性研究将深入
由于热控系统硬软件的性能与质量、控制逻辑的完善性和合理性、保护信号的取信方式和配置、保护连锁信号的定值和延迟时间设置,以及热控人员的检修和维护水平方面,都还存在一些不足之处,由此使得热控保护系统误动作引起机组跳闸事件还时有发生。在电力生产企业面临安全考核风险增加和市场竞争加剧的环境下,本着电力生产“安全第一,预防为主”的方针,以及效益优先原则,从提高热工自动化系统的可靠性着手,深入开展技术研究,是热工自动化系统近期的一项急需进行的工作。提高热工自动化系统的可靠性技术研究工作,包括控制软硬件的合理配置,采集信号的可靠性、干扰信号的抑制,控制逻辑的优化、控制系统故障应急预案的完善等。随着机组控制可靠性要求的提高,重要控制子系统的硬件配置中,将会采用安全型控制器、安全型PLC系统或者它们的整合,保护采集信号将会更多的采用三选二判断逻辑。独立的测量装置需要设计干扰信号抑制功能。此外基建机组一味以最低价中标的招标模式也应得到扭转(最低价中标,迫使厂商通过减少配置来降低投标价,导致控制系统可靠性下降)。
2.9 火电厂机组检修运行维护方式将改变
随着电力市场的竞争,发电企业将趋向集约化经营和管理结构扁平化,为提高经济效益,发电企业在多发电,以提高机组利用小时的同时,将会通过减少生产人员的配备,密切与外包检修企业之间的联系,让专业检修队伍取替本厂检修队伍的方式来提高劳动生产率。因此检修维修工作社会化将是一种趋势。此外DCS的一体化及其向各功能领域渗透,提高电厂整体协调和信息化、自动化水平的同时,也将会使电厂原专业间及专业内的分工重新调整,比如热工与电气二次回路的专业划分打通。为了降低成本,电厂不再保持大批的检修维修人员,因此检修维护方式也将因此而改变,比如让生产厂家和公司承担DCS和相关设备的检修工作。
电厂机组容量的不断增大,热工自动化系统所依赖的测量仪表也大量增加。在现场总线和智能仪表未全面使用的情况下,这些仪表还需定期校验。为提高测量仪表校验工作的效率,实现测量仪表从校验、基础数据台帐的建立、设备校验计划和日常维护工作的产生、执行、校验、数据输入、终结及统计分析,周期调整等的全过程自动管理代替人工管理,将是电厂仪表管理发展的趋势,因此全自动仪表校验装置和自动管理软件的需求量将会迅速增加。