卷积神经网络的主要思想精选(九篇)

前言：一篇好文章的诞生，需要你不断地搜集资料、整理思路，本站小编为你收集了丰富的卷积神经网络的主要思想主题范文，仅供参考，欢迎阅读并收藏。

卷积神经网络的主要思想

第1篇：卷积神经网络的主要思想范文

关键词：列车车号；车号识别；卷积神经网络； LeNet?5

中图分类号： TN911.73?34； TP391 文献标识码： A 文章编号： 1004?373X（2016）13?0063?04

Abstract： For the character recognition of freight train license， the improved recognition method based on convolutional neural network LeNet?5 is proposed. Considering the structural features of the hierarchical convolutional neural network and local field， the parameters of quantity and size of each layer feature pattern in the network were improved correspondingly to form the new network model suitable for the freight train license recognition. The experimental results show that the proposed method has strong robustness to solve the license breakage and stain， and high recognition rate， which provides a guarantee for the accuracy of the entire license recognition system.

Keywords： train license； license recognition； convolutional neural network； LeNet?5

0 引言

目前货运列车车号识别系统[1?2]主要是基于RFID技术实现的，但是，由于该系统的准确性依赖于列车底部安装的RFID标签，而RFID标签容易损坏、丢失，因此，此类系统无法保证车号识别的准确性。为此，研究者开发了基于图像的货运列车车号识别系统，系统根据视频采集到的图像，利用模糊集合论[1?2]、人工神经网络[3]、支持向量机[4]以及隐马尔可夫模型[4]等技术进行车号字符的识别。但是，由于货运列车车号存在因喷涂方式而导致的单个字符断裂，或者列车长期的野外运行导致的车厢污损，车号字符的残缺等现象，这使得目前的基于图像的货运列车车号识别系统的鲁棒性与识别率还有待进一步提高。

LeNet?5[5?7]是由YannLecun等人提出的一种专门用于二维图像识别的卷积神经网络，该网络避免了人工提取特征依赖于主观意识的缺点，只需要将归一化大小的原始图像输入网络，该网络就可以直接从图像中识别视觉模式。LeNet?5把特征提取和识别结合起来，通过综合评价和学习，并在不断的反向传播过程中选择和优化这些特征，将特征提取变为一个自学习的过程，通过这种方法找到分类性能最优的特征。LeNet?5已经成功应用于银行对支票手写数字的识别中。

为此，本文将卷积神经网络LeNet?5应用于列车车号字符的识别中，为了使之适用于列车车号字符的识别需求，去除掉了LeNet?5中的一些针对手写字符识别而特别设计的连接方式及参数，并在此基础上，改变网络中各层特征图的数量以形成新的网络模型。

1 LeNet?5的改进

卷积神经网络可以从很多方面着手改进。诸如多层前馈网络，可以考虑在误差函数中增加惩罚项使得训练后得到趋向于稀疏化的权值，或者增加一些竞争机制使得在某个特定时刻网络中只有部分节点处在激活状态等。本文主要从卷积神经网络的层次化以及局部邻域等结构上的特点入手，考虑卷积神经网络中各层特征图数量及大小对网络训练过程及识别结果的影响。

以LeNet?5结构为基础，去除掉LeNet?5中的一些针对手写字符识别而特别设计的连接方式及参数，得到改进后的神经网络。在此基础上，改变网络中各层特征图的数量以形成新的网络模型。定义一种新的网络模型，将其命名为LeNet?5.1，该网络结构与LeNet?5基本相同，主要做出以下改变：

（1）将原先LeNet?5所采用的激活函数由双曲正切函数修改为Sigmoid函数，此时，网络中所有层的输出值均在[0，1]区间内，输出层的最终结果也将保持在[0，1]区间内。

（2）省略掉F6层，将输出层与C5层直接相连，连接方式为全连接，而不是原LeNet?5中所采用的径向基函数（RBF）网络结构。

（3）简化原LeNet?5中的学习速率。原LeNet?5网络中采用的学习速率为一个特殊的序列，而在本网络中将学习速率固定为0.002。

（4）输入数据原始尺寸为28×28，采取边框扩充背景像素的方法将图像扩充至32×32。

之所以做以上相关改动，是因为原始的LeNet?5就是专门为手写字符识别任务而特殊设计的，这就造成了LeNet?5网络中相关的预处理及参数的选择过程或多或少均带有一些针对特定问题的先验知识。例如激活函数中参数的选择，学习速率定的速率序列以及数据预处理殊的填充方式等，这些特定的设计使得LeNet?5在其他任务的识别过程中并不一定适用，或者需要进行长期的观察实验以选得一组针对特定任务的较好的值，造成了LeNet?5不能快速的应用于除手写字符外其他的识别任务中。

2 改进后的网络对列车车号字符的识别

车号经过分割之后为一个个的单字符图像，采用边框扩充背景像素的方法将其归一化为32×32，如图1所示。

由图1中可以看出，待识别的字符图像质量不高，有的数字字符出现残缺、断裂或者严重变形。这都给识别任务提出了一定的挑战。

本文采集到的车号图像来自于不同型号的货运列车。从中选取400幅图像作为训练集，另外选取400幅图像作为测试集。用上一节提出的LeNet?5.1网络进行训练，误分类率曲线如图2所示。可以看出，在LeNet?5.1训练过程中，训练MCR（Misclassification Rate）和测试MCR的变化过程相对稳定，验证了改进后网络结构的合理性。在经过16次的迭代之后，测试MCR降至最低（5.75%），之后基本保持稳定，即16次迭代之后，网络达到了当前的最佳训练效果，达到了收敛状态。这时，训练MCR为0.5%，测试MCR是5.75%。

训练过程中的误分类率曲线

而针对相同的数据，采用原始的LeNet?5进行训练和测试后，误分类率如图3所示。从图3中可以看出，LeNet?5经过了18次的迭代后，测试MCR才达到相对稳定的状态，降至6%，最终的训练MCR为1%。相比之下，经过简化和改进的LeNet?5.1，由于改进了原始的LeNet?5中专门为手写字符识别任务而特殊设计的一些预处理及函数选择等固定模式，并且精简了网络结构，使得LeNet?5.1在列车车号的识别方面具有了更快的训练速度和收敛速度，另外，最终达到的准确度也有所提升。

在证明了改进后的LeNet?5.1网络的合理性之后，增加训练图像的规模，采用10 000幅车号数字字符图像用来训练，5 000幅用来测试。为了与其他方法进行比较，采用相同的训练数据对车号识别中常用的三层BP网络进行训练和测试，这里采用的BP网络隐含层节点数量为450，学习速率采用0.01。实验结果比较如表1所示。从表1可以看出，改进后的LeNet?5.1网络的识别率比BP网络的识别率高出4.62个百分点，在识别速度方面，LeNet?5.1也明显优于传统的BP神经网络。

3 针对车型号字母识别而改进的神经网络及其结果

货运列车车号的组成是由车型号与车号共同组成的，因此还需要对车型号进行识别，车型号中除了有阿拉伯数字字符之外，还有很多表示车种及车厢材质等属性的英文字母，这些英文字母同样采用卷积神经网络来识别。由于车型号很多，初期针对若干常用型号的列车进行识别，以测试网络的性能，后期对全车型进行识别。

3.1 常用列车车型的识别

在试运行阶段主要识别的车型局限于7种主要的车型：C64K，C64H，C70A，C70E，C80，C62AK和C62BK。由于车种都为敞篷车（第一个大写字母C），主要对后面代表该车型载重量的两位数字以及最后代表车厢材质等属性的字母进行识别。考虑到车型号字符串的固定模式，如图4所示，可以分别建立两个不同的卷积神经网络分别用来识别数字和字母，由于之前已经解决了数字的识别问题，接下来主要进行字母的识别。要识别的代表车厢材质的字母共有6个：K，H，A，E，A和B，为了尽可能的避免因字母分割问题而导致的识别错误，把AK和BK分别作为一个整体来识别，那么需要识别的字符组合变为：K，H，A，E，AK和BK。由于识别种类的减少，可以对网络模型LeNet?5.1进行相应的简化，命名该模型为LeNet?5.2。

LeNet?5.2是在LeNet?5.1的基础上进行改动而得到的：

（1）卷积层C1的特征图由6个减少为4个，相应地，S2层的特征图也由6个减少为4个。

（2）卷积层C3的特征图由16个减少为11个，相应地，S4层的特征图也由16个减少为11个。

（3）卷积层C5的特征图个数由120个减少为80个。

（4）输出分类的数目由10个减少为6个。

另外，卷积层C3层与次抽样层S2层的连接情况如表2所示。

表2的连接方式采用与表1相同的思想，每一列都说明了C3层中的一个特征图是由S2中的那几个特征图结合而成。卷积层C3中第0个至第5个特征图分别与次抽样层S2中的两个特征图相连接，一共6种组合。C3中的这6个特征图负责抽取上一层中某两个特征图所潜在的特征。C3层中第6个至第9个特征图中每个特征图分别对应上一层中的3个特征图的组合，而C3层中最后一个特征图则与上一层中所有的特征图相连接。这样卷积层C3中的特征图就包含了次抽样层S2中多个特征图的所有组合，这样使得卷积层C3抽取到的特征比S2层更抽象、更高级，同时，相对于输入数据，C3层相比S2层具有更好的对位移、扭曲等特征的不变性。

相比LeNet?5.1，LeNet?5.2将网络层中的特征图数量做了相应的削减，减少了网络中可训练参数的数量。

实验数据来自以上提到的7类常用车型。经过前面过程的定位和分割之后，将分割之后代表车厢材质等属性的字母图像收集起来。本实验中，共收集到6种代表不同车厢材质属性的字母共800幅，其中400幅用作训练数据，另外400幅用作测试数据。

图5为LeNet?5.2使用以上数据训练过程中得到的MCR曲线图。由图5中可以看出，在经过13次迭代之后，测试MCR达到最低的3.25%，并且在随后的迭代过程中基本保持稳定，而对应的训练MCR为0.75%。

3.2 全车型识别

经过对铁道行业标准《铁路货车车种车型车号编码》（TB2435?93）里面包含的所有车型号进行统计，除了10个阿拉伯数字外，包括了除O，R，V，Z四个字母外所有的大写英文字母，总共有32类字符。

训练过程中的误分类率曲线

针对车型号的识别需求，本文在LeNet?5.1的基础上提出了一种新的网络模型，称之为LeNet?5.3。与LeNet?5.2相反，LeNet?5.3是在LeNet?5.1的基础上对网络中各层的特征图数量进行扩充：

（1）卷积层C1的特征图由6个增加至8个，相应地，S2层的特征图也由6个增加至8个。

（2）卷积层C3的特征图由16个增加至24个，相应地，S4层的特征图也由16个增加至24个。

（3）卷积层C5的特征图个数由120个增加至240个。

（4）输出层神经元的个数由10个增加至32个。

其中卷积层C3层与次抽样层S2层的连接情况参考LeNet?5.2所采用的原则，使卷积层C3中的特征图包含次抽样层S2中多个特征图的主要组合。

与LeNet?5.1相比，LeNet?5.3需要有更多的输出类别，各层的特征图数量也做了相应的增加，以增加整个网络的识别性能。为了验证改进后的LeNet?5.3的性能，收集了大量真实列车车厢图片，经过车号定位和分割之后，将单个的数字字符或者大写字母字符图像尺寸依次归一化为32×32，分别建立训练图像库和测试图像库。

由于LeNet?5.1各层的特征图数量多，因此该网络涉及到的可训练参数也大大增加，这也意味着需要更多的数据样本用于网络训练。若训练集和测试集规模依然采用跟前面实验中一样的各400幅，训练过程中的误分类率曲线如图6所示，图6中的曲线变化非常不稳定，波动较大。测试MCR达到最低点后又突然升高，不能获得稳定的分类结果，训练过程无法收敛。

网络训练过程中无法收敛的主要原因在于相比网络中过多的需要训练确定的权值，数据集规模过小，已然不能满足学习的要求。从特征图角度来看，网络无法通过不充足的训练样本学习到稳定而有效的特征图组合，从而导致了网络不收敛。要解决这个问题需要加大测试样本的数量。

为了训练和测试LeNet?5.3，对数据集进行了扩充：训练图像库包含字符图像4 000幅，测试图像库包含字符图像2 000幅。训练过程中的误分类率曲线如图7所示。从图7中可以看出，经过32次迭代之后网络趋于收敛，并且达到了较好的识别率。

4 结语

本文针对货运列车车号识别的难题，提出了基于卷积神经网络LeNet?5改进后的识别方法，主要对卷积神经网络中各层特征图数量及大小进行了改进。且与传统的BP网络进行了比较，从实验结果可以看出，改进后的卷积神经网络无论在鲁棒性还是识别率以及识别速度上都优于BP网络，可以很好地胜任列车车号识别任务。

参考文献

[1] 宋敏.铁路车辆车号自动识别系统的研究和开发[D].天津：河北工业大学，2011：1?5.

[2] LU S， CHEN B M， KO C C. Perspective rectification of document images using fuzzy set and morphological operations [J]. Image and vision computing， 2005， 23（5）： 541?553.

[3] SHAH P， KARAMCHANDANI S， NADKAR T， et al. OCR?based chassis?number recognition using artificial neural networks [C]// Proceedings of 2009 IEEE International Conference on Vehicular Electronics and Safety （ICVES）. [S.l.]： IEEE， 2009： 31?34.

[4] CHEN D， BOURLARD H， THIRAN J P. Text identification in complex background using SVM [C]// Proceedings of 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. [S.l.]： IEEE， 2001： 621?626.

[5] LECUN Y， BOTTOU L， BENGIO Y， et al. Gradient?based learning applied to document recognition [J]. Proceedings of the IEEE， 1998， 86（11）： 2278?2324.

[6] LECUN Y A， BOTTOU L， ORR G B， et al. Efficient backprop [M]// Anon. Neural networks： tricks of the trade. Berlin： Springer Berlin Heidelberg， 1998： 9?50.

第2篇：卷积神经网络的主要思想范文

关键词：PCA算法；人脸识别；五级并行PCA模型；权重计算；均值滤波

中图分类号：TP311 文献标识码：A 文章编号：1009-3044（2016）19-0147-02

Research on Face Recognition System Based on Parallel PCA Algorithm

ZHAO Ya-peng

（College of Information Science and Engineering， Shandong University of Science and Technology， Qingdao 266590， China ）

Abstract：In order to solve the problem of fast and accurate face recognition， a face recognition method based on parallel PCA algorithm is proposed. Using principal component analysis （PCA） method can reduce the dimension of features， easy to implement， training time is short， the design and implementation of a parallel algorithm for PCA， first of all according to the whole image to extract the 4 part of face images， then the whole image and 4 partial images at the same time by the same structure of the PCA model of learning， face feature vector extraction， the Euclidean distance for matching calculation of the test images and training images， finally through the test image with the five level parallel PCA model identification results are weighted decision， in order to achieve face recognition. Using the image data of the ORL face database ， the simulation results in Matlab show that the method has a great degree of improvement in accuracy， the recognition speed is relatively fast， with a high degree of robustness.

Key words：PCA algorithm；Face recognition；Five level parallel PCA model；Weight calculation；Mean filter

1 概述

随着智能终端设备（手机、Pad、门禁等）的不断发展，身份识别已经成为我们日常生活的重要组成部分，身份验证技术被广泛应用于各个领域，特别是人们对于个人隐私信息的保护，使得身份识别再次成为关注的焦点。人脸识别作为身份识别的重要手段之一，因其具有识别率高、采集性强、接受性高等特点，在身份识别的各类方法中具有独特的优势，成为了目前比较热门的研究领域。

目前，卷积神经网络（Convolutional Neural Networks）是图像识别领域最重要的研究热点，而且在语音识别领域也取得了不错的效果，但是卷积神经网络的整个训练过程比较费时，而且实现相对复杂，而基于PCA算法的人脸识别技术因其自身存在的许多缺陷，一直没有被广泛应用，但该方法实现简单、学习速度较快，因此，本文主要研究改进的并行PCA算法，以弥补传统PCA算法在人脸识别领域的不足。

本文提出的基于并行PCA算法的人脸识别技术，首先对原始图像进行预处理，如灰度归一化和中值滤波等操作，以消除图像噪声、光照等因素造成的影响，使得特征提取更加准确可靠。然后，通过5级并行PCA模型获取数据的不同特征矩阵，然后将训练图像和测试图像分别进行子空间的投影，利用欧氏径向基函数（Euclidean Radial Basis Function）进行人脸的匹配，最后根据训练得到的权值向量进行加权决策。本文通过ORL人脸数据库的仿真实验证明，该算法的效果明显好于PCA算法。

2 并行PCA算法

PCA（Principal Component Analysis）即主成分分析技术，PCA是基于K-L变换的统计学分析方法，是多元分析中常用的方法，其基本思想是将高维数据投影到低维空间，主要过程在于特征值的计算和矩阵的降维。将PCA应用于人脸识别时，首先将图像转化成矩阵向量，然后进行矩阵的奇异值分解（Singular Value Decomposition），将高维向量通过计算得到的特征向量矩阵投影到低维的向量空间，从而减少数据的计算量。

2.1 基于并行PCA算法的人脸识别流程

本文中提出的并行PCA算法，正是基于上述的PCA算法，通过建立5级的PCA算法模型同时进行数据特征的学习，使得最终的人脸识别准确率得到进一步的提高，具体的人脸识别流程如图1所示。

2.2 并行PCA算法的实现的步骤

2.2.1 人脸图像的预处理

首先，需要把ORL人脸数据数据库的所有训练图像大小进行归一化，并转化为像素矩阵，矩阵大小记为，为矩阵的行数，为矩阵的列数。之后利用均值滤波和灰度归一化进行图像的去噪处理，以消除光线等问题对图像造成的影响，以方便后期的特征提取等操作。

2.2.2 人脸图像的PCA降维

根据PCA的原理，可以将每一张图像看成是一个高维的向量，所有的图像可以看成是这个高维空间中的一点，PCA要做的就是找出另外一个尽可能多的反应图像特征的低维空间。

假如样本由n张大小为p*q的人脸图像组成，那么每一张图像可以保存为一列向量，向量维数是p*q，真个样本可以看成是一个行数为n，列数为p*q的矩阵记为矩阵A。

根据上述过程，首先求出矩阵A的协方差矩阵，然后求出协方差矩阵的特征值，选取前m个最大的特征值，然后求出对应的特征向量，组成一个特征矩阵。通常所说的“特征脸”就是这些特征向量，而特种功能矩阵就是“特征脸”空间或者说子空间。然后可以将每一张图片投影到该子空间，得到了每一张图像的投影矩阵（l*m）。

2.2.3 人脸图像的识别

对于待识别的图像，也可以看成是一列向量，投影到子空间得到一个投影矩阵，然后一一求出这个投影矩阵与样本图像投影矩阵最相似的。然而有可能该人脸不是人脸库中的，所以最相似的人脸也不一定是同一个人脸，还需要设置一个阈值来判断待识别人脸是否是人脸库中的。

人脸识别部分正是基于上述的PCA算法，在本文所提出的并行PCA模型中，是由5级的PCA模型同时进行人脸识别这一操作，最后根据训练得到的权值向量进行决策，通过使用多个PCA模型，从而使得整个识别过程的准确率得到进一步的提升。

3 系统设计及实现

3.1 系统总体设计

本文中所提出的基于并行PCA算法的人脸识别系统，包括人脸图像采集模块、图像预处理模块、识别模块。人脸图像采集模块主要是采集训练图像数据和测试图像数据，并由原始图像提取出4幅与之对应的部分图像；图像预处理模块主要就是进行图像归一化和图像的去噪工作，图像的归一化包括大小归一化和灰度归一化，可以使用比较常见的直方图均衡化等技术，而图像的去噪可以使用中值滤波技术，以去除比较常见的高斯噪声等；人脸识别模块是基于5级相互独立的PCA模型进行特征值的学习和比对，而且通过训练得到的权值向量进行最终的是脸识别决策。整个系统的实现是基于Matlab进行仿真实验的，实验数据来自剑桥大学AT&T实验室创建的ORL人脸数据库。

3.2系统功能模块实现

3.2.1人脸图像采集实现

图像采集模块主要就是将存储在本地的图像文件通过Matlab的imread函数读入矩阵中，以方便后期的PCA操作，其核心语句为Image{t}=imread（[[filepath，FilDir（ii）.name]，'＼'，ImDir{ii}（jj）.name]）；

使用上述语句即可读入训练数据和测试数据文件。

3.2.2 图像预处理模块

该模块的主要任务就是利用中值滤波和直方图均衡化进行图像的去噪工作，以消除不同光照和图像噪声的影响，提高准确率。其核心代码为：

S1=zeros（1，256）；

for i=1：256

for j=1：i

S1（i）=GP（j）+S1（i）；

end

S2=round（（S1*256）+0.5）；

for i=1：256

GPeq（i）=sum（GP（find（S2==i）））；

end

3.2.3 识别模块

图像经过之前的预处理之后，需要将图像矩阵转化为列向量，一幅图像就是一列向量，整个训练图像构成了整个特征空间矩阵，测试图像也会转化为一列向量，之后会利用矩阵之间的运算进行图像的分析计算。识别模块的工作就是根据测试图像和之前所有的训练数据进行对比，查找到与之最相似的图像，实验的结果如图2所示。

4 结论

PCA算法作为传统的人脸识别算法，因其自身存在的许多缺陷而没能发挥较好的作用，但是其自身具有其他算法所不具有的特点，本文设计的并行PCA算法虽然是基于PCA算法，但是借鉴了卷积神经网络的多层结构，而且使用加权操作进行最终人脸识别的决策。基于ORL人脸数据库的测试结果表明，该并行PCA算法的准确率和鲁棒性均得到了进一步的提升，与其他的单独PCA算法具有十分明显的优势。

参考文献：

[1] 张利芳. 基于PCA算法的人脸识别系统研究[D].太原：中北大学，2015.

[2] 杨海燕，蒋新华. 基于并行卷积神经网络的人脸关键点定位方法研究[J]. 计算机应用研究， 2015， 32（8）： 2517-2519.

[3] 杨颖娴. 基于PCA算法和小波变换的人脸识别技术[J]. 微电子与计算机， 2011， 28（1）： 92-94.

[4] 段宝彬，韩立新. 改进的卷积神经网络及在碎纸拼接中的应用[J]. 计算机工程与应用， 2014， 50（9）： 176-181.

第3篇：卷积神经网络的主要思想范文

【关键词】：高速公路防逃人脸识别高清视

中图分类号：U412.36+6 文献标识码：A

人脸识别的分类与概述

人脸识别就是通过计算机提取人脸的特征，并根据这些特征进行身份验证。人脸与人体的其他生物特征(指纹、虹膜等)一样与生俱来，它们所具有的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提；同其他生物特征识别技术相比，人脸识别技术具有操作简单、结果直观、隐蔽性好的优越性。人脸识别一般包括三个步骤：人脸检测、人脸特征提取和人脸的识别与验证。其处理流程如图

输入图像人脸图像人脸特征输出结果

人脸识别的一般步骤

人脸识别方法繁多，早期研究较多的方法有基于几何特征的人脸识别方法和基于模板匹配的人脸识别方法。目前人脸识别方法主要研究及应用的是基于统计的识别方法、基于连接机制的识别方法以及其它一些综合方法。下面是这几类方法的基本介绍：[2]

（1）基于几何特征的人脸识别方法

几何特征矢量是以人脸器官如眼睛、鼻子、嘴巴等的形状和几何关系为基础的特征矢量，其分量通常包括人脸指定两点间距离、曲率、角度等。早期的研究者Brunelli[3]等人采用改进的积分投影法提取出用欧式距离表征的35维人脸特征矢量用于人脸识别。Huang Chung Lin等人[4]采用动态模板[5,6,7]与活动轮廓模型提取出人脸器官的轮廓[8,9,10]。基于几何特征的人脸识别方法有如下优点：符合人类识别人脸的机理，易于理解；对每幅图像只需要存储一个特征矢量，存储量小；对光照变化不敏感。但这种方法同样存在一些问题，如从图像中提取这些特征比较困难；对强烈的表情变化和姿态变化的鲁棒性差等。

（2）基于模板匹配的人脸识别方法

模板匹配大都采用归一化相关，直接计算两幅图之间的匹配程度。最简单的人脸模板就是将人脸看成一个椭圆[10,11]。另一种方法就是将人脸用一组独立的小模板表示，如眼睛模板、嘴巴模板、鼻子模板等，采用弹性模板方法提取这些模板特征[12]。Brunelli等人专门比较了基于几何特征的人脸识别方法和基于模板匹配的人脸识别方法，他们得出的结论是：基于几何特征的人脸识别方法具有识别速度快和内存要求小等优点，但基于模板匹配的识别率要高于基于几何特征的识别率。

（3）基于统计的人脸识别方法

基于统计特征的识别方法包括基于特征脸的方法和基于隐马尔可夫模型的方法。特征脸（Eigenface）方法[13]是从主成分分析导出的一种人脸识别和描述技术。主成分分析实质上是K-L展开的网络递推实现，K-L变换是图像压缩中的一种最优正交变换，其生成矩阵一般为训练样本的总体散布矩阵。特征脸方法就是将包含人脸的图像区域看作是一种随机向量，因此可以采用K-L变换获得其正交K-L基底。对应其中较大特征值的基底具有与人脸相似的形状，因此又称之为特征脸。

隐马尔可夫模型（HMM）是用于描述信号统计特性的一组统计模型。基于人脸从上到下、从左到右的结构特征，Samaria等人[14]首先将1-D HMM和2-D Pseudo HMM用于人脸识别。Kohir等[15]采用1-D HMM将低频DCT系数作为观察矢量获得了好的识别效果。Eickeler等[16]采用2-DPseudo HMM识别DCT压缩的JPEG图像中的人脸图像。Nefian等[17]采用嵌入式HMM识别人脸。

（4）基于连接机制的人脸识别方法（神经网络弹性图匹配）

基于连接机制的识别方法，包括一般的神经网络方法和弹性图匹配(Elastic Graph Matching)方法。神经网络在人脸识别应用中有很长的历史[18]。Demers 等[19]提出采用PCA方法提取人脸图像特征，用自相关神经网络进一步压缩特征，最后采用一个多层处理器来实现人脸识别。Laurence等[20]通过一个多级的SOM实现样本的聚类，将卷积神经网络（CNN）用于人脸识别。Lin等[21]采用基于概率决策的神经网络（PDBNN）方法。最近，径向基函数RBF神经网络因具有逼近性好、空间描述紧凑和训练速度快等特点而被用于人脸识别。Gutta等[22]提出了将RBF与树分类器结合起来进行人脸识别的混合分类器结构，后来他们用RBF神经网络进行了针对部分人脸的识别研究[23]，他们的研究表明利用部分人脸也可以有效地识别人脸。Er等[24]采用PCA进行维数压缩，再用LDA抽取特征，然后基于RBF进行人脸识别。Haddadnia 等[25]基于PZMI（Pseudo Zernike Moment Invariant）特征，并采用混合学习算法的RBF神经网络进行人脸识别。此外，Lucas 等采用连续的n-tuple网络识别人脸。

弹性图匹配方法是一种基于动态链接结构的方法[26]。在人脸图像上放置一组矩形网格节点，每个节点的特征用该节点处的多尺度Gabor幅度特征描述，各节点之间的连接关系用几何距离表示，从而构成基于二维拓扑图的人脸描述。根据两个图像中各节点和连接之间的相似性可以进行人脸识别。Wiskott等[27]将人脸特征上的一些点作为基准点，强调了人脸特征的重要性。他们采用每个基准点存储一串具有代表性的特征矢量，大大减少了系统的存储量。Würtz 等[28]只使用人脸面部的特征，进一步消除了结构中的冗余信息和背景信息，并使用一个多层的分级结构。Grudin等[29]也采用分级结构的弹性图，通过去除了一些冗余节点，形成稀疏的人脸描述结构。Nastar等[30]提出将人脸图像I(x,y)表示为可变形的3D网格表面（x, y, I(x,y)），将人脸匹配问题转换为曲面匹配问题，利用有限元分析的方法进行曲面变形，根据两幅图像之间变形匹配的程度识别人脸。

（5）基于形变模型的方法

基于形变模型的方法是一个受到重视的方法。通过合成新的视觉图像，可以处理姿态变化的问题。Lanitis等[31]通过在人脸特征边沿选择一些稀疏的基准点描述人脸的形状特征，然后将形状变形到所有人脸图像的平均形状，再根据变形后的形状进行纹理（灰度）变形，形成与形状无关的人脸图像。然后分别对形状和灰度进行PCA变换，根据形状和纹理的相关性，用PCA对各自的结果进一步分析，最终得到描述人脸的AAM（Active Appearance Model）模型。通过改变这些参数可得到不同变化的人脸图像，模型参数能够用于人脸识别。Romdhani 等[32]采用激光扫描仪获得人脸的3D数据，分别对一些基准点构成的形状和基准点的灰度（或彩色）完成PCA，得到3D人脸形状和灰度（彩色）基图像，通过变化参数就可获得不同的3D人脸模型。通过施加一些先验约束可以避免合成不真实的人脸图像。利用线性形状和纹理误差，通过3D模型向2D输入图像的自动匹配实现人脸识别。

项目采用的识别算法

人脸自动识别技术经过多年来的研究已经积累了大量研究成果。但是仍然面临很多问题，尤其是在非约束环境下的人脸识别。结合本研究项目及应用环境综合考虑，采用特征脸方法对视屏资料中的司机脸部进行提取识别。

特征脸方法是90年代初期由Turk和Pentland提出算法，具有简单有效的特点, 也称为基于主成分分析（principal component analysis，简称PCA）的人脸识别方法。把人脸图像空间线性投影到一个低维的特征空间。PCA实质上是K-L展开的网络递推实现。K-L变换是图像压缩技术中的一种最优正交变换。人们将它用于统计特征提取。从而形成子空间法模式识别的基础。若将K-L变换用于人脸识别，则需假设人脸处于低维线性空间。由高维图像空间K-L变换后，可得到一组新的正交基，由此可以通过保留部分正交基获得正交K-L基底。如将子空间对应特征值较大的基底按照图像阵列排列，则可以看出这些正交基呈现出人脸的形状。因此这些正交基也称为特征脸，这种人脸的识别方法也叫特征脸法。

特征子脸技术的基本思想是：从统计的观点，寻找人脸图像分布的基本元素，即人脸图像样本集协方差矩阵的特征向量，以此近似地表征人脸图像。这些特征向量称为特征脸（Eigenface）。

利用这些基底的线性组合可以描述、表达和逼近人脸图像，因此可以进行人脸识别与合成。识别过程就是将人脸图像映射到由特征脸张成的子空间上，比较其与已知人脸在特征脸空间中的位置，具体步骤如下：[33]

（1）初始化，获得人脸图像的训练集并计算特征脸，定义为人脸空间；

（2）输入待识别人脸图像，将其映射到特征脸空间，得到一组权值；

（3）通过检查图像与人脸空间的距离判断它是否为人脸；

（4）若为人脸，根据权值模式判断它是否为数据库中的某个人。

1. 计算特征脸

假设人脸图像包含个像素,因此可以用维向量Γ表示。如人脸训练集由幅人脸图像构成,则可以用表示人脸训练集。

其均值为：

（2-1）

每幅图像与均值的差为：

（2-2）

构造人脸训练集的协方差矩阵：

（2-3）

其中。

协方差矩阵的正交分解向量即为人脸空间的基向量，也即特征脸。

一般比较大（通常大于1000），所以对矩阵直接求解特征向量是不可能的，为此引出下列定理：

SVD定理：设是一秩为的维矩阵，则存在两个正交矩阵：

（2-4）

（2-5）

以及对角阵：

（2-6）

满足

其中：为矩阵和的非零特征值，和分别为和对应于的特征矢量。上述分解成为矩阵的奇异值分解（SVD），为的奇异值。

推论：

（2-7）

由上述定理可知：

人脸训练集所包含的图像一般要比图像的像素数小的多，因此可以转求矩阵

（2-8）

的特征向量，M为人脸训练集图像总数。

矩阵的特征向量由差值图像与线性组合得到：

=（2-9）

实际上，m（m

（2-10）

识别

基于特征脸的人脸识别过程由训练阶段和识别阶段两个阶段组成。在训练阶段,每个己知人脸映射由特征脸张成的子空间上,得到m维向量：

（2-11）

距离阈值定义如下：

（2-12）

在识别阶段，首先把待识别的图像映射到特征脸空间，得到向量

（2-13）

与每个人脸集的距离定义为

（2-14）

为了区分人脸和非人脸，还需计算原始图像与其由特征脸空间重建的图像之间的距离：

（2-15）

其中：

（2-16）

采用最小距离法对人脸进行分类，分类规则如下：

（1）若，则输入图像不是人脸图像；

（2）若，则输入图像包含未知人脸；

（3）若，则输入图像为库中的某个人脸。

实际上，特征脸反映了隐含在人脸样本集合内部的信息和人脸的结构关系。将眼睛、面颊、下颌的样本集协方差矩阵的特征向量称为特征眼、特征颌和特征唇，统称特征子脸。特征子脸在相应的图像空间中生成子空间，称为子脸空间。计算出测试图像窗口在子脸空间的投影距离，若窗口图像满足阈值比较条件，则判断其为人脸。

基于特征分析的方法，也就是将人脸基准点的相对比率和其它描述人脸脸部特征的形状参数或类别参数等一起构成识别特征向量，这种基于整体脸的识别不仅保留了人脸部件之间的拓扑关系，而且也保留了各部件本身的信息，而基于部件的识别则是通过提取出局部轮廓信息及灰度信息来设计具体识别算法。现在Eigenface(PCA)算法已经与经典的模板匹配算法一起成为测试人脸识别系统性能的基准算法；而自1991年特征脸技术诞生以来，研究者对其进行了各种各样的实验和理论分析，FERET测试结果也表明，改进的特征脸算法是主流的人脸识别技术，也是具有最好性能的识别方法之一。

该方法是先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等属性，然后再计算出它们的几何特征量，而这些特征量形成一描述该面像的特征向量。其技术的核心实际为"局部人体特征分析"和"图形/神经识别算法。"这种算法是利用人体面部各器官及特征部位的方法。如对应几何关系多数据形成识别参数与数据库中所有的原始参数进行比较、判断与确认。Turk和Pentland提出特征脸的方法，它根据一组人脸训练图像构造主元子空间，由于主元具有脸的形状，也称为特征脸,识别时将测试图像投影到主元子空间上，得到一组投影系数，和各个已知人的人脸图像比较进行识别。

结束语

从目前国情来讲，在一段时间内高速公路收费还会继续存在，某些司机逃费的侥幸心也同样会有。通过带路径识别功能的 RFID 复合卡作为通行卡，利用 RFID 卡的信息对车辆进行跟踪，在不增加硬件投入的情况下，直接可以给车道收费系统提供抓拍高清图像，以及其它报警联动系统提供图像等，可有效解决高速公路冲卡逃费问题，可广泛应用于封闭式管理的公路收费系统。

参考文献：

[1]江艳霞. 视频人脸跟踪识别算法研究. 上海交通大学博士学位论文，2007.

[2]Brunelli R and Poggio T., Feature Recognition: Features Versus Templates. IEEE Transactions on

PAMI, 1993, 15(10):1042 -1052.

[3]李刚. 基于特征脸法的正面人脸识别研究. 国防科学技术大学硕士学位论文，2002.11

[4]JOHN CANNY. A Computational Approach to Edge Detection. IEEE TRANSACTIONS ON PATTERN

ANALYSIS AND MACHINE INTELLIGENCE, VOL.PAMI-8, NO.6, NOVEMBER 1986.

[5]张建飞、陈树越等. 基于支持向量基的交通视频人车识别研究[J]. 电视技术，2011

[6]肖波、樊友平等. 复杂背景下基于运动特征的人面定位[J]. 重庆大学学报，2002

[7] 《中华人民共和国交通部公路联网收费技术要求》，交通部

[8] 《广东省高速公路联网收费系统》，DB44 127-2003，广东省质量技术监督局

[9] 《视频安防监控数字录像设备》,GB 20815-2006

[10]《安全防范工程技术规范》，GB 50348-2004

第4篇：卷积神经网络的主要思想范文

关键字：笔记鉴别；纹理；Gabor

中图分类号：G642

文献标识码：A

文章编号：1672-5913(2008)02-0122-03

1引言

不同的人根据自身的生理特征和后天的学习情况不同，而练就不同的笔迹，正所谓“字如其人”。笔迹正是一种相对稳定的行为特征，因此笔迹可以用来识别个体身份。目前在公安、社会化考试、银行等领域得到日益广泛的应用，其中一个典型应用就是高等教育自学考试考生试卷笔迹真伪鉴定。现在试卷笔迹鉴定工作是通过考试中心文检人员手工比对，这种传统的笔迹鉴别方法，容易引入个人因素，影响鉴定效果的真实性。随着考生人数的增多，这项比对工作相当耗费人力、物力。本文正是基于高自考这样的背景，来研究基于文本独立的离线笔迹鉴别。

目前笔迹鉴别研究方向可以分为在线(on-line)和离线(off-line)两类。进一步细分，离线笔迹鉴别又可分为：文本依存(Text-dependent)和文本独立(Text-independent)

两种。文本依存就是提前规定书写内容，文本独立则对书写内容没有限制。笔迹鉴别的复杂性在于字迹的变化性，其任务就是从所有笔迹样本中提取那些变化最大的特征，然后根据这些特征对测试笔迹样本进行真、伪分类。

另一个问题是，目前分类方法主要有支持向量机、多层神经网络等，由于实际应用中样本数较少，以上方法都不适用，因此本文主要针对训练样本少的实际应用情况讨论文本独立型(Text-independent)书写人识别。通过用Gabor等纹理分析方法提取文字纹理特征，获得了较好的识别效果。

2基于Gabor小波的纹理分析

纹理分析在图像处理、分析和识别中广泛应用，是从图像中提取反映纹理特性的特征。每个人都有自己的书写风格，从整体笔迹图像看，它们含有不同的纹理特征，如笔迹的排版规律(行间、字间排列等)、单个字符的笔划搭配关系都可以看成是一种纹理。从已知的笔迹鉴别方法来看，有不少都采用了纹理分析的思想。将笔迹视为图像纹理，利用纹理分析的方法提取笔迹纹理特征并进行鉴别，是目前研究的热点。

Gabor函数由Dennis Gabor于20世纪40年代提出的，后来被J．Daugman首先用于表征图像，并用于视觉方面的研究。随着计算机的不断发展，成为了非常流行的图像处理方法，这得益于Gabor函数特有的属性及其生物意义。生物学的研究表明Gabor函数可以较准确地描述人脑视觉皮层简单细胞的感受野。如图1所示。

图1视觉皮层简单细胞的感受野与二维Gabor函数的对比

Gabor函数是一个被复正弦函数调制的高斯函数，它是唯一能够达到时频测不准关系下界的函数，能够最好地兼顾信号在时域和频域中的分辨能力。其中，一维Gabor函数如式(1)：

其中m用来控制函数的中心，s为宽度（Gaussian函数的标准偏差），周期为T，函数波形如图2所示。

图2一维Gabor函数波形

二维Gabor函数具有方向选择性和带通性，能够比较精确地提取图像的局部纹理特征。二维Gabor函数如式(2)所示：

3Gabor变换以及笔迹特征获取

本文使用Gabor核函数对笔迹纹理图像进行Gabor变换，提取笔迹特征。给定一幅图像f(x,y)，其Gabor变换定义为：

(4)

根据卷积定理，时域中卷积相当于频域中乘积，故可借助快速傅立叶变换（FFT）。这是由于快速傅立叶变换算法的计算效率要比基本的离散傅立叶变换高出几个数量级，由于FFT的高效率，在许多情况下实现卷积最有效的方法是先计算参与卷积的序列的离散傅立叶变换，然后将它们的变换相乘，最后计算这些变换乘积的逆变换。快速傅立叶变换算法有很多种，目前广为使用的是蝶形算法。对于本文中，进行的是二维傅立叶变换，由于其行列可分性，因此可以先对列进行一维快速傅立叶变换，然后对行进行一维傅立叶变换。特征提取的实现过程入下：

(1) 先根据Gabor核函数的参数，即4个频率和8个相位，依次求出32个Gabor核函数，并对其依次进行二维快速傅立叶变换，将其结果保存到数组；

(2) 对笔迹纹理图像块进行二维快速傅立叶变换，将其结果分别与32个Gabor核函数相乘，并且乘上一个系数；

(3) 对32个相乘结果分别进行二维傅立叶逆变换，这样对于每一个Gabor核函数将对应得到一个Gabor变换系数，该系数为复数，对于每一个笔迹样本就对应得到32个变换系数；

(4) 针对每一变换系数，分别求出模值，然后根据模值求出方差和均值，经实验比较，对于本文文本依存情况，仅选取32维方差要比选取32维均值或者64维方差和均值的混合特征作为笔迹特征，鉴别率要高，效果要好，因此最终特征选用32维变换系数模值的方差。

4分类器的构建

由于人工神经网络、支持向量机等分类器均需要较多样本进行训练，而在实际应用中样本数较少。根据这一事实，并且结合本文提出的训练方法，本文从样本距离角度寻求分类器。从相关文献中了找了8个与距离相关的分类标准，目的是通过实验从中找出适合于本文的分类器。这8个分类标准依次为欧氏距离、普通距离、相似度、特征距离、Canberra距离、Dice系数、Jacquard系数、向量间距离，其数学表达式分别如式4～1所示：

欧氏距离：

以上8个式子中，和分别为特征向量，i=1,2,3,4,5……

实验时选取8个人的样本，其中5个人每人1份，另3个人每人10份样本，共8个人35份笔迹样本，测试结果如表1所示，表中A，B，C分别为三个书写人，每人10份笔迹样本，实验步骤为(以A为例，其它类似)：

(1) 以A的第一份样本为参考样本，经“随机训练”为每个分类器获取阈值；

(2) 以A的第一份样本为参考样本，用获取到的阈值，与A的其它9个样本进行比对，给出测试正确样本数，对于每个分类器分别填入对应表格“本人”处；

(3) 以A的第一份样本为参考样本，用获取到的阈值，与B、C的各5个样本进行比对，给出测试正确样本数，对于每个分类器分别填入对应表格“不同人”处；

(4) 分别统计每个分类器判别正确的样本数。

根据表中各分类器的分类结果，并结合运算量，本文最终选定欧氏距离作为分类器。对于两个样本，其欧氏距离越小，表明两个样本越相似，假设两个样本之间的欧氏距离为d，分类阈值为g，那么如果d

5结论

本文研究内容是文本独立的离线笔迹鉴别，结合课题背景本文给出一种基于纹理的方法。实验时，先采集30人共计108份笔迹样本，然后对这些笔迹样本进行预处理、形成纹理图，使用32个Gabor核函数，进行Gabor变换，把变换后所得系数的方差作为最后的笔迹特征，共32维。最后使用欧氏距离作为分类器，采用本文提出的阈值获取办法进行训练。我们在自己采集的笔迹库上实验，在对28人的56份样本实验中，对于与参考样本出自同一人的笔迹样本的测试，共28份，对于与参考样本不同人的笔迹样本，共140份。

从表2可以看出，针对本文方法，对于与参考样本出自同一人的笔迹样本的测试，共28份，其中被正确鉴别的份数为26，正确接受率为92.9% 。对于与参考样本不同人的笔迹样本，共140份，正确鉴别的份数为126，正确拒绝率为90.0%。达到了较为理想的效果。

Writer Identification Based on Small Amount of Test Samples and TextureAnalyse

Abstract This paper is presented for identification of examination papers handwriting, A kind of algorithm, which is characterized with less training samples and text-independent, is proposed, and it is used of artificial handwriting identification expert knowledge. Finally, experiments show that the correct acceptances rate is 92.9% and the correct rejections rate is 90.0%.

Keywords：handwriting identification, texture, Gabor filter

参考文献

[1] 孙广萍. 身份验证中的签名鉴别技术[J]. 黑龙江通信技术,2003,(1):34-35.

[2] 刘宏,李锦涛,崔国勤. 基于SVM和纹理的笔迹鉴别方法[J]. 计算机辅助设计与图形学学报,2003,15(12):1479-1484.

[3] 许春晔,郭宝兰. 基于Gabor函数的汉字字体识别[J]. 河北大学学报(自然科学报),2001,21(2):167-170.

[4] 边肇祺,张学工. 模式识别[M]. 北京:清华大学出版社,2000.

[5] Andrew R Webb著. 王萍,杨培龙,罗颖昕译. Statistical Pattern Recognition, 2ED[M]. 北京:电子工业出版社,2004.

[6] 陶跃华. 基于向量的相似度计算方案[J]. 云南师范大学学报,2001,21(5):17-19.

[7] 易东,陈庆虎. 基于多分类器组合的笔迹验证[J]. 计算机应用,2006,26(1):172-173.

[8] 刘成林,戴汝为,刘迎建. 简化的Winger分布及其在笔迹鉴别中的应用[J]. 计算机学报,1997,20(11):1018-1024.

第5篇：卷积神经网络的主要思想范文

论文摘要:当点扩展函数未知或不确知的情况下,从观察到的退化图像中恢复原始图像的过程称为图像盲复原。近年来,图像盲复原算法得到了广泛的研究。本文在介绍了盲图像恢复算法的现状的基础上进一步研究其的发展方向。

一、引言

图像恢复是图像处理中的一大领域,有着广泛的应用,正成为当前研究的热点。图像恢复的主要目的是使退化图像经过一定的加工处理,去掉退化因素,以最大的保真度恢复成原来的图像。传统的图像恢复假设图像的降质模型是己知的。而许多情况下,图像的降质模型未知或具有较少的先验知识,必须进行所谓的盲恢复。其重要性和艰巨性而成为一个研究热点。目前所能获取的观测图像是真实图像经过观测系统成像的结果。由于观测系统本身物理特性的限制,同时受观测环境的影响,观测图像和真实图像之间不可避免地存在着偏差和失真,称观测系统对真实图像产生了降质。图像恢复的目的就是根据降质的观测图像分析和计算得出真实图像。

二、图像盲恢复算法的现状

总体来说,图像盲复原方法主要分为以下两类:一是首先利用真实图像的特别特征估计PSF,然后借助估计得到的PSF,采用经典的图像复原方法进行图像的复原。这类方法将PSF的估计与图像的复原过程分为2个不同的过程,因而具有较少计算量的特点;二是PSF辨识和真实图像估计相结合,同时辨识PSF和真实图像。这类算法较为复杂,计算量较大。另外,对于点扩展函数也考虑了空间变化的复杂情况。针对目前的盲复原算法的现状,根据退化模型的特点,重新将算法分为空间不变的单通道盲复原算法、空间不变多通道盲复原算法和空间变化图像盲复原算法3类。

(一)单通道空间不变图像盲复原算法

在这类算法中,最为常用的是参数法和迭代法。

1)参数法。所谓参数法,即模型参数法,就是将PSF和真实图像用某一类模型加以描述,但模型的参数需要进行辨识。在参数法中,典型的有先验模糊辨识法和ARMA参数估计法,前者先辨识PSF的模型参数,后辨识真实图像,属于第1种类型的图像盲复原算法,因而计算量较小;后者同时辨识PSF和真实图像模型参数,属于第2种类型图像盲复原算法。

2)迭代法。所谓的迭代法,不是通过建立模型而是通过算法的迭代过程,加上有关真实图像和PSF的约束来同时辨识PSF和真实图像的方法。迭代法是单通道

图像盲复原算法中应用最广泛的一类算法,它不需建立模型,也不要求PSF为最小相位系统,因而跟实际更为接近。在这类算法中,迭代盲复原算法(IBD),基于非负性和决策域的递归逆滤波器算法(NAR2RIF),基于高阶统计特性的最小

熵算法等最为典型。

(二)多通道二维图像盲复原

多通道二维图像盲复原,这类方法将数字通讯领域应用的一维多通道盲原分离算法扩展到二维情况并用于图像的盲恢复。这类算法中有两种代数方法,一种是先辨识模糊函数,再采用常规的恢复算法进行复原;另一种是直接对逆滤波器进行估计。此类算法的优点在于不需对初始图像进行估计,也不存在稳定性和收敛性问题,对图像以及模糊函数的约束是松弛的,算法具有一般性。但是第1种算法要求采用复原算法具有收敛性;第2种算法对噪声敏感。

(三)空间改变的图像盲复原方法

在许多实际的应用中,模糊往往是空间变化的,但由于处理工作的难度,目前的研究较少,基本有相关转换恢复和直接法两类。

相关转换恢复的基本思想是区域分割,即将整幅图像分为若干局部区域,然后假设在各个局部区域模糊是空间不变的,利用空间不变的图像复原有关算法进行复原。这类方法都是基于窗口的模糊辨识技术,图像的估计取决于窗口的大小,由于模糊参数是连续变化的,在范围较大时空间不变的假设是不成立的,因而模糊的估计精度较差,而且这种方法只能针对部分空间变化的模糊进行处理,缺乏通用性;其次在区域的边上存在振铃现象。

直接法的基本思想是直接对图像进行处理。如采用简化的二维递推卡尔曼滤波器进行图像模型和模糊模型的直接转换方法,其缺点是只能针对有限的模型,而且模型数增加,计算量会显着增大;采用共轭梯度迭代算法,但只见到一个31×31的文本图像处理的结果报道,对于大图像处理效果尚需进一步的研究;将空间变化图像系统建立成马尔苛夫随机模型,对复原过程,采用模拟退火算法进行最大后验估计的方法,这种方法避免了图像的窗口化,并能克服模糊参数不连续性造成的影响,但这种方法只能局限于将模糊过程建立成单参数的马尔苛夫随机模型的情况,而且计算量也较大。

三、图像盲恢复的应用前景

(1)现有算法的改进以及新的算法研究。现有各种算法还存在许多不足,有必要对算法进一步改进。如IBD算法中,如何选择初始条件才能保证算法的收敛;如何选择算法终止条件才能保证恢复的质量;如何选择滤波器中的噪声参数才能减少噪声的影响。又如NAR2RIF算法中,如何进一步解决噪声敏感问题,支持域的确定以及如何将算法扩展到非均匀背景的情况等。提出新的算法更好地解决图像盲复原问题,也是今后研究的热点。

(2)基于非线性退化模型的图像盲复原算法。在实际应用中,严格来讲,所有的退化模型都是非线性的。对模型采用线性化的方法进行近似处理,虽然算法简单,但对非线性严重的情况处理效果并不理想。基于多项式以及神经网络两种参数模型处理非线性信号盲分离算法,算法扩展到二维图像情况需要进一步研究。研究基于非线性退化模型的图像盲复原算法也是下一步研究方向之一。

(3)去噪处理算法研究。加性噪声的存在,使图像的复原问题变成了一个病态问题,而且由于一般假设只知道噪声的统计特性,因此要从退化图像中完全去除噪声是不可能的。另外,由于噪声的存在,恢复的效果并不理想,结合降噪的图像盲恢复的算法研究有很现实的意义,这方面也进行了部分工作。为克服噪声的影响,一般采用先进行降噪,后进行复原;二是将降噪和复原同时进行这两类方法。目前,大多数算法中将噪声描述成高斯噪声进行研究,在实际应用时有较大局限性。对于非高斯情况的研究采用基于噪声的高阶统计特性的去噪算法研究也是很重要的研究方向,也可采用其他类型的方法进行降噪,利用自组织映射的非线性独立组件分析方法进行图像降噪处理算法。

(4)实时处理算法。算法的的复杂性是制约算法应用的一个重要方面。可采用正则化的离散周期Radon变换的方法将二维的卷积转化为一维进行处理,以提高算法的速度;也可采用神经网络的实时处理算法。算法的实时性是算法实际应用的先决条件。

(5)应用研究。算法的应用是推动算法研究的动力。虽然图像盲复原算法在天文学、医学、遥感等方面获得了较大的应用,但将算法应用到一般的工业图像实时检测、机器视觉、网络环境下的图像传输恢复、刑事侦破等方面还有大量的工作要做。

参考文献:

[1]薛梅,杨绿溪.用于含噪二值图像的改进NAS-RIF图像盲复原算[J].数据处理.2006.17.(2).

第6篇：卷积神经网络的主要思想范文

关键词：人脸识别；小波变换；随机森林

中图分类号：TP18 文献标识码：A文章编号：1009-3044(2011)16-3899-02

Face Recognition Based on Wavelet Transform and Random Forest

HU Feng, XING Jie-qing

(Department of Modern Education Technology, Qiongtai Teachers College, Haikou 571100, China)

Abstract: This paper considers the discriminantive information in frequency space of face images. A new feature extraction method is proposed based on Gabor Wavelet Transform and Principle Component Analysis. Not only the frequency information is used, and also the dimensionality is reduced by PCA. Finally, Random Forest is adopted as the classifier. The experiments in the paper valuate the performance of the proposed method on large databases and small databases.

Key words: face recognition; wavelet transform; random forest

生物特征识别日益成为理论界和应用界一个重要且活跃的研究领域。与指纹、掌纹、虹膜、声音等其它人体生物特征相比，人脸识别更加直接、友好，在身份识别、安检监控、视频会议等领域具有广泛的应用前景。主要的人脸识别特征提取方法可以分为两大类，即基于几何模型的局部特征提取方法和基于统计分析的整体特征提取方法。前者将人的眼睛、嘴p鼻子等面部特征点的相对位置p距离p角度作为人脸的特征描述,这种方法的成功性依赖于人脸部位的精确检测，而且对表情等细节变化非常敏感；后者则利用统计策略直接从整个训练图像集合提取统计特征,以其快速、简易和相对稳定性在近年来引起了广泛关注。本文所提出的识别技术在方法分类上属于后者。

本文关注人脸图像的特征提取与分类方法。用于提取人脸统计特征的主要方法有：基于线性子空间的方法，如主成分分析（PCA）[1]、判别分析（LDA）[2]、非负因子分解（NMF）[3]等；基于流形假定的方法，如局部线性嵌入（LLE）[4]、等距映射（IsoMap）[5]、局部线性映射（LLP）[6]等。这些方法大多是基于灰度值空间，而一幅图像的频率空间同样包含了丰富的信息。传统的人脸图像特征提取方法研究常常忽略了频率域的鉴别信息。小波变换恰能够将人脸图像变换到频率空间，并在诸多识别领域得到应用。本文采用Gabor小波变换[7]，得到人脸图像的频率域信息。

用于人脸识别的分类方法主要有：K-临近分类（KNN）、人工神经网络（ANN）、朴素贝叶斯分类器（Naive Bayes）、AdaBoost等。随机森林（Random Forest）是著名的集成学习类分类器。而在人脸识别中应用该方法鲜有报道。本文采用随机森林[8]作为人脸识别分类器，实验结果表明该分类器在人脸图像频率特征分类应用中具有良好的效果。

1 Gabor小波变换

Gabor小波提供了多精度、多通道表现图像空间动频率域特性的机制，较好地反映了生物视觉神经的感受视野。与其他方法相比，Gabor小波方法是一种多分辨率的描述，并且能够较好地解决由于环境变化而引起的图像变化问题，对此已有充分的理论依据并且能够有效地实现，所以采用它来进行人脸的识别可以获得较好的结果。

二维Gabor小波函数定义如下：

这里u，v分别是方向和尺度因子，z=(x,y)，x，y为相应地二维坐标分量，σ为小波滤波器的宽度，通常取σ=2π，给定图像I(z)，做卷积运算Gu,v(z)=I(z)φu,v(z)，这样就可以得到原始图像的Gabor小波表示，通常称为Gabor小波脸。本文选取5个不同的尺度v={0,1,2,3,4}和8个不同的方向u={0,1,2,…,7}，并且令kmax=2π，f=。这样就可以在5个不同的尺度，8个不同的方向上采样。将一幅人脸的全部Gabor特征Gu,v(z)，拉伸成向量，用x表示。经过一系列处理后，人脸图像训练集对应一个多维向量集X={x1,x2,…,xN}。此时，得到的向量维数相当高，本文采用主成分分析法（PCA）对其进行降维操作，提取每个样本向量的主要成分。

2 随机森林

随机森林是由若干二叉树形分类器{h(x,θk),k=1,…,r}组成的集成分类器，其中x是输入向量，{θk}是独立同分布的随机向量，预测时通过简单的多数投票法、或单棵树输出结果的简均得到随机森林的最终输出。该方法结合了Breiman[ ]的Bagging思想和Ho[12,13]引入的属性随机选择方法。用Bagging方法生成有差异的训练样本集，并在Bagging的基础上引入属性随机选择。

作为一种分类算法，随机森林具有如下优点：对于很多数据，具有较高的分类准确率；相对于目前其他的分类算法，随机森林能较好地容忍噪音；利用大数定律可以得到，随机森林作为有监督的学习方法不容易过拟合；建造分类器时，可以通过OOB数据在内部估计模型的泛化误差；对于不平衡的分类资料集来说，它可以平衡误差。自提出以来，随机森林已经成为一种重要的数据分析工具，并被广泛地应用于科学研究的众多领域，包括微阵列数据、定量构效关系建模、核磁共振光谱和土地覆盖等。

具体实现过程如下：

1) 用Bagging方法形成个别训练集，即每个个别训练集都是从原始训练集的n个样品中又放回地抽取n个样品。

2) 对于每个新训练集，用如下过程生成一棵不剪枝的分类树：

3) 重复（1）、（2），直到生成r棵分类树（r足够大）。

4) 对未知类别的样本进行分类时，输出的类别标签有森林中树的多数投票决定，即：

随机森林在Bagging的基础上引入属性的随机选择，更大程度上降低了树之间的相关性，同时建立的单棵不剪枝的分类树能够得到较低的偏差，从而保证了随机森林分类性能。

3 实验结果及分析

本部分利用两个著名的国际人脸数据库Yale及CMU PIE验证本文提出的方法。实验图下岗大小均重置为32×32，核函数采用高斯径向函数。首先对实验图像进行5个

尺度，8个方向的Gabor小波变换，将40幅小波特征脸图像分别按8×8下采样，采样后，每幅特征脸按行优先拉伸成64维的特征向量，将40个特征向量收尾相接，得到64×40=2560维特征向量。

3.1 Yale人脸库上的实验结果

Yale人脸库包含15个人的165幅图像，每人11幅，其中包括在不同光照条件下（如左逆光、右逆光）、不同表情的人脸图像。本次实验每人取6幅图片构成训练集，剩余5幅构成测试集。本次实验每人依次取p=2,4,6,8 幅图片作为训练样本，其余作为测试样本。实验结果如表1所示，括号内为PCA最优投影维数。

3.2 CMU PIE人脸库上的实验结果

CMU PIE 人脸库总共包含了68个人的41368幅人脸图片。单个人的图片考虑到了不同的姿态、光照、表情等变化。由于姿态变化的影响不在本文所提出方法的考虑中，故本文仅从近似正面的人脸图像中，随机选择了每人170幅图片，总共11554幅。这些图片包含了光照及表情的变化，构成原数据集的的一个正向人脸子集。本次实验每人依次取p=30,50,90,110 幅图片作为训练样本，其余作为测试样本。实验结果如表2所示，括号内为PCA最优投影维数。

4 结束语

本文查考了人脸图像频率空间所包含的鉴别信息，采用Gabor小波变换作为抽取频率空间特征的工具。为避免抽取特征维数过高，应用PCA进行降维。最后将随机森林作为分类器引入到人脸识别中。从实验结果可以看出，无论在小规模（Yale）还是大规模（CMU PIE）的人脸库上都取得了较好的识别性能。

参考文献：

[1] Turk M,Pentland A.Face Recognition Using Eigenfaces[J].Proc. IEEE Conf. Computer Vision and Pattern Recognition,1991:586-591, .

[2] Martinez A M,Kak A C.PCA versus LDA[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2001,23(2):228-233.

[3] Lee D D,Seung H S.Learning the parts of objects by non-negative matrix factorization[J].Nature,1999(401):788-791.

[4] Roweis S,Saul L.Nonlinear Dimensionality Reduction by Locally Linear Embedding[J].Science,2000,290(22):2323-2326.

[5] Tenenbaum J,Silva V,Langford J.A Global Geometric Framework for Nonlinear Dimensionality Reduction[J].Science,2000,290(22):2319-2323.

[6] He X,Yan S,Hu Y, et al.Face Recognition Using Laplacianfaces[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2005,27(3):328-340.

[7] Daugma J G.Two-dimensional spectral analysis of cortical receptive field profiles[J].Vision Research,1980,20:847-856.

第7篇：卷积神经网络的主要思想范文

随着各行各业对板带材质量要求的不断提高，轧辊偏心成为影响产品质量的不容忽视的重要因素。厚度控制过程中的轧辊偏心控制技术的开发和研究仍然是板带材轧制所面临的共同课题。我国对轧辊偏心控制问题的研究还不深入，本论文的工作就是试图在这方面做些努力。

本文的研究内容是厚度控制过程的轧辊偏心控制技术，着重探索应用重复控制抑制轧辊偏心的控制方法，从频域和离散域两个方面提出厚度控制系统的重复控制器的设计方案，并对方案在稳定性、稳态特性、过渡过程特性和鲁棒性方面进行理论分析，同时对系统进行仿真研究。本文的主要工作如下：

⑴ 给出了冷轧厚度控制的数学模型和轧件硬度波动前馈补偿的控制模型；对轧辊偏心进行了系统、深入的研究，给出获得偏心信号模型的改进快速傅立叶变换的方法；

⑵ 针对单输入单输出PID厚度控制系统，首先提出了单轧辊偏心扰动重复控制频域设计方案，在重复控制环节中引入一种补偿器，有效提高了系统稳态精度。其次提出了多轧辊偏心扰动重复控制频域设计方案，提出了轧辊偏心的并行重复控制器结构。

⑶ 针对多输入多输出厚度、张力控制系统，首先给出了系统控制对象模型，其次提出了单轧辊偏心重复控制频域设计方案，然后扩展到多轧辊偏心控制系统，并给出了单轧辊偏心扰动和多轧辊偏心扰动时重复控制补偿器的设计方法。

⑷ 针对重复控制对偏心扰动的基波及其谐波抑制效果较好，而对基波和谐波附近频率扰动的抑制较差问题，提出了一种鲁棒重复控制结构，这种结构对轧辊偏心扰动信号的周期不确定性有较强的鲁棒性。

⑸ 因工程中普遍采用数字化设计，对于流量AGC、反馈AGC控制结构及流量AGC、反馈AGC、轧件硬度前馈的控制结构分别提出了单轧辊偏心、双轧辊偏心及多轧辊偏心鲁棒数字重复控制器设计方案。这些设计方案能有效地降低补偿器阶次。

理论分析和仿真结果证明上述提出的系统设计方案的有效性。

Application study on roll eccentricity control on cold rolling AGC system based on repetitive control

Abstract

As the tolerance requirement for the thickness of steel plate and strip products getting tighter and tighter, the roll eccentricity is becoming more and more important factor affecting the product quality. To precisely control the flat rolled products in cold rolling, an investigation on roll eccentricity becomes essential and such research is lacked in our country so far. In this thesis, attention is focused on control of gauge of steel plate and strip in the presence of periodic disturbances such as the eccentricity.

Repetitive control system, known to be effective for periodic disturbance, seems to fit naturally with the eccentricity compensation problem. The roll eccentricity control technologies in cold rolling of flat rolled strip based on repetitive control theory are mainly studied in this dissertation. The key innovations of this paper are summarized as follows:

⑴ The mathematical models of steel plate and strip gauge control are presented. A control scheme of feed forward compensation for material rigidity is put forward. Through theoretical analysis, the characteristics of roll eccentricity are summarized. An modified Fast Fourier Transform algorithm of acquiring roll eccentricity signal is proposed.

⑵ For SISO PID gauge control system, design in the frequency domain based on repetitive controller rejecting single roll eccentricity disturbance is introduced. A compensator is included for the first time in the control scheme. In addition, a control structure of repetitive controllers resisting multi roll eccentricity disturbance is proposed. All the design schemes have been analyzed. Simulations show that proposed schemes are effective.

⑶ For MIMO gauge and tension control system, repetitive control for a single roll eccentricity compensation is first presented.The structure is then extended to the case of multiple roll eccentricity. The design method of compensator of repetitive controllers is introduced. Theoretical analysis and simulation results are presented to demonstrate the effectiveness of the repetitive control structure proposed.

⑷ Repetitive control is useful if periodic disturbances act on a control system. Perfect (asymptotic) disturbance rejection can be achieved if the period is known exactly. For those cases where the roll eccentricity period changes, a robust repetitive controller structure is proposed. It uses a robust repetitive control structure in the feedback configuration, so that small changes of period do not degrade the disturbance rejection properties. The robust repetitive controller shows good result for rejecting eccentricity.

⑸ The digital robust repetitive control schemes compensating single and multiple roll eccentricity are proposed. The design framework can reduce the order of compensator effectively. The gauge adopt the structure of constant volume flow AGC and feedback AGC , avoiding system instability caused by control delay of measurement of height instrument. The material rigidity feedforward is added to the gauge control structure. The theoretical analysis and simulation results on the two gauge control structure show a good performance on the rejection of disturbances such as eccentricity.

摘要 1

Abstract 2

1 绪论 1

1.1 问题的提出 1 1.3 重复控制理论研究现状 12

1.4 本文的主要工作及各部分内容安排 14

1.4.1 主要研究内容 14 2 轧辊偏心问题的理论分析和冷轧板板带厚度控制模型 17

2.1 轧辊偏心问题的理论分析 17

2.1.1 辊身和辊径不同轴的情况 17 2.1.3 偏心信号的采集和处理 20

2.1.4 应用MMFFT方法的偏心控制方案 31

2.2 带钢厚度控制模型 35

2.2.1 带钢冷轧过程的基本方程 35

2.2.2 厚度反馈控制模型 38

2.2.3 前馈控制模型 41

2.3 本章小结 44

3 冷轧SISO板厚控制过程中轧辊偏心的重复控制 45

3.1 单轧辊偏心扰动重复控制系统 45

3.1.1 厚度控制系统结构及组成 45 3.1.3 重复控制环节的设计 54

3.1.4 重复控制和鲁棒PID控制混合设计 58

3.2 双轧辊偏心重复控制系统 61

3.2.1 双轧辊偏心重复控制系统的结构及仿真 61

3.2.2 系统稳定性分析 62

3.3 多轧辊偏心重复控制系统 65

3.3.1 多轧辊偏心重复控制系统的结构及仿真 65

3.3.2 系统稳定性分析 66

3.4 本章小结 67

4 MIMO厚度、张力控制系统的轧辊偏心重复控制 69

4.1 厚度和张力控制系统结构和对象模型 69

4.1.1 过程控制模型 69 4.1.3 厚度、张力及速度控制系统的解耦 75

4.1.4 闭环控制系统仿真 78

4.2 单轧辊偏心扰动重复控制系统 80

4.2.1 系统结构 80

4.2.2 系统穩定性分析 80

4.2.3 系统品质分析 83

4.2.4 系统鲁棒性能分析 84

4.2.5 重复控制器设计 84

4.2.6 系统仿真 85

4.3 多轧辊偏心扰动重复控制系统 86

4.3.1 系统结构 86

4.3.2 系统稳定性分析 87

4.3.3 系统性能分析 88

4.3.4 系统鲁棒性分析 89

4.3.5 系统设计及仿真 90

4.4 本章小结 96

5 周期不确定的轧辊偏心鲁棒重复控制系统 97

5.1 周期不确定轧辊偏心扰动的重复控制原理和结构 97

5.1.1 常规重复器的结构及其对周期不确定扰动抑制分析 97 5.2 周期不确定单轧辊偏心扰动的鲁棒重复控制系统 106

5.2.1 系统稳定性分析 107

5.2.2 系统动态性能 108

5.2.3 系统鲁棒性分析 108

5.2.4 系统仿真 109

5.3 多周期偏心扰动的鲁棒重复控制系统 110

5.3.1 系统的结构及稳定性 110

5.3.2 双轧辊偏心扰动的鲁棒重复控制系统仿真 112

5.4 本章小结 113

6 厚度控制过程的轧辊偏心扰动数字鲁棒重复控制 114

6.1 数字重复控制器抑制扰动信号的原理 115

6.2 单周期(基波)扰动的鲁棒数字重复控制系统 116

6.2.1 系统结构 116

6.2.2 单周期扰动鲁棒重复控制系统的稳定性 119

6.2.3 单周期扰动鲁棒重复控制系统约束条件分析 121

6.2.4 单轧辊偏心(基波)扰动数字鲁棒重复控制系统 124

6.3 基波及二次谐波扰动鲁棒数字重复控制系统 126 6.3.2 数字重复控制器的设计 129

6.3.3 单轧辊偏心扰动(基波及二次谐波)鲁棒数字重复控制系统 129

6.4 多周期扰动鲁棒数字控制系统 131

6.4.1 系统的结构及鲁棒稳定性 131

6.4.2 双轧辊偏心扰动鲁棒数字重复控制系统 134

6.5 本章小结 135

7 总结与展望 136

7.1 本文的工作总结 136

7.2 今后研究展望 136

参考文献 138

在学研究成果 145

致谢 146

绪论

问题的提出冷轧过程中，影响产品厚度精度的因素很多，但大体可分为两大类[3～5]，即轧件工艺参数的变化和轧机状态的变化。轧件工艺参数的变化，主要包括材料的变形抗力和坯料尺寸以及张力、工艺等轧制工作条件的变化。板带材的化学成分和组织的不均匀、焊接时的焊缝等都会造成材料变形抗力的变化，在冷轧时引起出口厚度的波动。热轧钢卷(来料)带来的扰动主要有热轧带厚不匀，这是由于热轧设定模型及AGC控制不良造成的，来料厚度不均匀将使实际压下量产生波动，导致轧制压力和弹跳的变化，进而影响产品厚度精度；热轧卷硬度不匀(变形阻力)，这是由于热轧终轧及卷取温度控制不良造成的。来料厚差将随着冷轧厚度控制逐架减少。但来料硬度确具有重发性，即硬度较大或较小的该段带钢进入每一机架都将产生厚差。冷轧时带钢前后张力的变化、轧制速度的变化及摩擦系数波动等也是造成轧出厚度波动的原因。带钢轧制过程中的张力变化会改变变形区应力状态，从而造成轧制压力的波动和轧出厚度的不均。轧制速度变化主要是通过摩擦系数、轴承油膜厚度来影响轧制压力和实际辊缝，导致轧出厚度的变化。轧机本身的扰动主要包括不同速度和压力条件下油膜轴承的油膜厚度将不同(特别是加减速时油膜厚度的变化)、轧辊偏心、轧机各部分热膨胀、轧辊磨损等。轧辊偏心是高频扰动，会引起板厚周期性波动，影响产品质量。

此外还有工艺等其它原因造成的厚差，属于这类的有：不同轧制乳液以及不同速度条件下轧辊－轧件间轧制摩擦系数的不同(包括加减速时的摩擦系数的波动)；全连续冷连轧或酸洗－冷连轧联合机组在工艺上需要的动态变规格将产生一个楔形过渡段；酸洗焊缝或轧制焊缝通过轧机时造成的厚差。这一类属于非正常状态厚差，不是冷轧AGC所能解决的，是不可避免的。

根据产生带钢厚度偏差的不同原因，可采取相应的厚度调节方式和措施来消除或减少它。目前，按其调节方式概括为[6,7]：

⑴ 调节压下量即改变辊缝；

⑵ 改变带钢在机架前、后张力或一侧的张力，即改变轧件塑性曲线的陡度；

⑶ 改变轧制速度；

⑷ 同时改变轧辊辊缝与带钢张力。

在上述调节方式中，最常用的是调节压下的厚度控制方法[8～10]。调节压下量即调节辊缝有两种不同方式，即：

① 电动杆涡轮带动压下螺丝转动使工作辊之间的相对辊缝产生变化来实现带钢厚度控制的。由于电机、减速机的惯性很大，电机及传动系统的启动、制动时间长，因此，从厚度控制指令发出到轧出预定的带钢厚度其控制时间更长。另外，因需大的电机、减速压下它是通过电机、减速机、蜗机等机电设备，故轧机成本高，而且维修也不方便；为了克服诸多因素对板带材厚度的影响，提高产品的厚度精度，已经开发了和发展了多种厚度控制系统[15～17]，如测厚仪反馈AGC、压力AGC、流量AGC、监控AGC和前馈AGC等。传统AGC在控制精度方面各有其独特的特点，在轧机上得到广泛的应用[18～20]。

⑴ 测厚仪反馈AGC

测厚仪反馈AGC系统是在带钢从轧机轧出后，通过轧机出口测厚仪测出实际轧出厚度值，并将其与给定厚度值比较，得出厚度偏差：

(1.1)

再通过厚度自动控制装置将变换为辊缝调节量的控制信号，输出给压下或推上机构，以消除厚度偏差。用测厚仪信号进行厚度反馈控制时，由于考虑到轧机机构的限制、测厚仪的维护以及为了防止带钢断裂而损坏测厚仪，测厚仪一般装设在离直接产生厚度变化的辊缝有一定距离的地方，这就使检测出的厚度变化量和辊缝控制量不在同一时间发生，所以实际轧出厚度的波动不能得到及时反映。结果整个厚度控制系统的操作都有一定的时间滞后，用下式表示：式中为滞后时间，为轧制速度，是轧辊中心线到测厚仪的距离。由于存在时间滞后，所以这种测厚仪反馈式厚度自动控制系统很难进行稳定控制。因此目前普遍采用利用弹跳方程对变形区出口厚度进行检测，然后进行反馈控制。这将大大减少滞后，但由于弹跳方程精度不高，虽然加上油膜厚度补偿等措施仍不能保证精度。这正是当前推出流量AGC的原因。安装了激光测速仪后可精确实测前滑，因而流量方程精度大为提高，用变形区入口及变形区出口流量相等法，根据入口测厚仪及机架前后激光测厚仪可准确确定变形区出口处的实际厚度，因而提高反馈控制的精度。根据流量变形区入出口流量相等：

(1.3)

式中：分为入出口带钢宽度；分为入出口的速度，分为入出口带钢的厚度。一般情况下，入出口宽度变化不大，因而有：

(1.4)

从而得到出口厚度：

(1.5)

⑵ 间接测厚反馈AGC

为了避免直接测厚仪产生的时间滞后，常采用压力间接测厚反馈AGC系统。即借助于测量某一时刻的轧制压力和空载辊缝，通过弹跳方程计算出此时刻的轧出厚度，亦即：

(1.6)

式中：为轧出厚度，为轧制压力，为预压靠值，为空载辊缝，为轧机刚度系数。利用此测得的厚差进行厚度自动控制就可以克服前述的传递时间滞后，实现稳定的反馈控制，提高产品厚度精度。然而，在计算带钢出口厚度的算式中，是在轧辊轴承处测出的辊缝值，轧辊偏心对实际辊缝的影响在此反映不出来，这就给控制系统带来了误差。假定在某一时刻，偏心对辊缝的实际影响为，那么此时的实际辊缝值为，实际造成的厚度厚度波动值应为(假设该时刻没有其它因素使变化)

(1.7)

但由于此时辊缝仍为，所以由计算得出的厚度波动为：

(1.8)

因和符号相反，显然。这样，就给以作为反馈量的间接测厚AGC系统引入了误差，造成了间接测厚AGC系统调节质量的降低甚至恶化。即当有偏心存在时，实际板厚减少了，但由于这时轧制力增大，间接测厚AGC系统反而认为板厚增加了，因此控制器就越朝着使板厚减少的方向动作，结果使得比没有压力的AGC系统时的板厚精度更为低劣。

由此可见，间接测厚AGC系统克服了时间延迟，是一种实用、有效的厚度自动控制系统。但是，如前所述，间接测厚AGC系统不但不能对偏心有所抑制，而且还会由于轧辊偏心的存在而导致其控制质量的进一步变差。当产品精度要求较高或轧辊偏心较严重时，间接测厚AGC就不可能达到满意的控制效果。所以，在配置有间接测厚AGC系统的轧机上，常常附加一些抑制偏心影响的措施，如设置死区、带通滤波等。这些措施避免了轧辊偏心对间接测厚AGC系统的恶劣影响，却不能消除轧辊偏心对轧出厚度所产生的直接不良影响。

⑶ 前馈AGC

考虑到来料厚差是冷轧带钢产生厚差的重要原因之一，因此冷连轧机一般在第一机架前设有测厚仪，可直接量测来料厚差用于前馈控制，机架间亦设有测厚仪用于下一机架的前馈控制。前馈AGC的原理是根据来料厚度波动信号，再根据轧制速度作适当延时，在波动部分进入机架的同时调节辊缝，以消除厚度偏差。辊缝调节量为：

(1.9)

式中：为轧件塑性系数。

⑷ 张力AGC

冷轧带钢，特别是后面的机架，带钢愈来愈硬，越来越薄，因此塑性变形越来越困难，亦即其值越来越大，因而使压下效率越来越小。

(1.10)

式中：为压下效率，当远远大于时，为了消除一个很小的厚差需移动一个很大的。

采用液压压下后由于其动作快使这一点得到补偿，但对于较硬的钢种，轧制较薄的产品时精调AGC还是借助于张力AGC。当然张力AGC有一定的限制，当张力过大时需移动液压压下使张力回到极限范围内以免拉窄甚至拉断带钢。

⑸ 监控AGC

机架后测厚仪虽存在大滞后但其根本优点是高精度测出成品厚度，因此一般作为监控。监控是通过对测厚仪信号的积分，以实测带钢厚度与设定值比较求得厚差总的趋势(偏厚还是偏薄)。有正有负的偶然性厚差是通过积分(或累加)将相互抵消而得不到反映。如总的趋势偏厚应对机架液压压下给出一个监控值，对其“系统厚差”进行纠正，使带钢出口厚度平均值更接近设定值。为了克服大滞后，一般调整控制回路的增益以免系统不稳定，或者放慢系统的过渡过程时间使其远远大于纯滞后时间，为此在积分环节的增益中引入出口速度。其后果是控制效果减弱，厚度精度降低。克服大滞后的另一种办法是加大监控控制周期，并使控制周期等于纯滞后时间，亦即每次控制后，等到被控的该段带钢来到测厚仪下测出上一次控制效果后再对剩余厚差继续监控，以免控制过头。这样做的后果亦将减弱监控的效果。为此，有些系统设计了“预测器”，通过模型预测出每一次监控效果，继续监控时首先减去“预测”到的效果，使监控系统控制周期可以加快，并且不必担心控制过头而减少控制增益。

即此偏心将使带钢出口厚度产生的波动，这一严重影响是不容忽视的。不仅如此，如前所述，轧辊偏心还会对压力AGC系统产生不良的影响，使其调节质量恶化。所以，要想轧出高精度带钢，必须考虑补偿轧辊偏心影响的措施。采用厚度外环和压力内环的目的亦是为了抑制偏心的影响。轧辊偏心将明显反映在轧制压力信号和测厚仪信号中。对轧制力来说，实测的轧制力信号实际是由给定轧制力(其中包括来料厚度和来料硬度带来的影响)和偏心信号综合组成[1]，考虑到这两部分信号在控制策略上是相反的，因此在未投入偏心补偿时必须通过信号处理将轧制力信号分解成两个部分。从轧制力信号提取出的偏心信息可以用下式表示：

(1.11)

式中：分是幅值、频率和初相角。频率与转速有关，幅值决定偏心大小，而初相角则决定于信号的初始坐标点，为此需在轧辊上设有单脉冲编码器(多脉冲等于将轧辊转角分成多个等分，并以其中一个坐标点作为初始坐标点)。从正弦特性可知，只有两个幅值相等但反相，频率相等并且初始角相同的两个信号相加才能完全互相抵消。否则，频率不同的正弦信号无法相加；幅值不同则无法完全消除偏心影响；初始角对不准则无法抵消，如果差还可能加剧而不是抵消。由于在实施控制时还要考虑液压执行机构惯性问题，采用这种两个完全相反的正弦波抵消的办法实施起来难度较大。

轧辊偏心控制技术的研究情况

轧辊偏心，一般可归纳为两种类型，一种是由辊身和辊颈不同轴度误差所引起的偏差，另一种是由辊身椭圆度(不圆度)引起的偏差，由于轧辊偏心的干扰，辊缝偏差一般可达0.025～0.05mm。轧辊转一周，其干扰变化一次，故轧辊偏心的干扰发生高频周期变化，从而造成成品带钢厚度的波动。轧辊偏心，主要是指支撑辊偏心，因为工作辊直径小，其偏心量只有几个；而支撑辊直径一般为1500mm左右，轧辊磨床加工精度能保证轧辊椭圆度约为，上下辊叠加。随着用户对产品质量要求日益严格，这种轧辊偏心的干扰越来越不能忽视。为了有效抑制偏心干扰，对系统各个部分的快速性和准确性都要求很高，任何部分的误差和时滞都会影响补偿效果，甚至可能使偏心的不良影响加剧。计算机在工业过程控制中的普遍应用和液压压下(推上)装置在轧机上的应用为解决这个问题提供了硬件上的可能性。由于电动机压下装置惯性大，传输效率低(一般)，对周期性高频变化无能为力，一般只能在控制系统中设置“死区”，以避免压下螺丝周期性频繁动作。而液压压下系统惯性小，压下速度和加速度都显著提高(一般，同时具有设备重量轻、有过负荷保护能力等优点。对于消除由轧辊偏心所造成的这种高频变化的周期波动，必须采用这种液压压下(推上)系统。第一类解决办法按其信号检测和模型辨识的在线和离线方式，可分为开环控制和闭环控制。按其信号处理手段可分为简单处理法、各种滤波器法和傅立叶级数法。早期的简单处理方法包括用千分尺直接测定支持辊的移动或间接测定轧辊轴承座的移动，并根据这个测定值调整安装在轧辊上的自整角机输出的正弦波的相位和振幅，按照与支撑辊移动相反的方向实施补偿。滤波器方法是一种常用的偏心信号检测方法。各种滤波器方法都程度不同地存在些问题，不可避免地混进偏心以外的频率成分，而又毫无办法地漏掉了偏心信号中的谐波分量。除了滤波器以外，还有解决偏心控制问题的傅立叶分析法。这一方法一般来说要比滤波器方法的信号处理精度高，补偿效果显著。北京科技大学孙一康教授和他的博士研究生刘淑贞在20世纪90年代初以上海第三冷轧带钢厂的高精度四辊可逆冷轧机为试验背景，配以必要的测量仪表和计算机系统，并利用快速傅立叶变换的偏心控制方案，利用相干时间平均方法的偏心控制方案和复合建模偏心控制方案进行大量的现场实验，取得了满意的实验效果[35～37]。

澳大利亚的E.K.Tech等提出的用于冷轧机的改进的带钢厚度控制器和我国原冶金部自动化院陈振宇教授等提出的冷轧机轧辊偏心自校正调节器则应属于第二类。在消除轧辊偏心影响的同时，也抑制了其它干扰因素对带钢厚度均匀性的影响。Tech方案是根据轧制原理，建立一套包括支持轧辊偏心效应、轧机部件的塑性变形过程和弹性变形形变在内的控制设计模型并估计偏心信号周期。反馈控制器对轧制力、滞回、与轧机有关参数和轧制力调整机构的非线形响应进行补偿。此方法在把偏心分量从厚度计法厚度误差估计中分离出来，通过前馈方法补偿偏心干扰效应的同时，也实现了准确的厚度估计，通过反馈回路完成了综合厚度控制。这一方法在澳大利亚公司的冷轧机的初步现场实现表明，它可使轧辊偏心对轧制力和带钢出口厚度的影响减少30％，使总的厚度精度提高40％。但此方法要求对轧机系统各部分的机理和参数都了解得很清楚，而且对测厚仪的安装位置等也有限制，这对有些轧机而言是难以实现的。

国外对偏心诊断、智能和最优控制的研究较深入和富有成果，主要有：Kugi等提出基于稳定传递函数的因数分解逼近和最小均方算法；Aistleitner K等提出采用神经网络进行偏心辨识的方法；Garcia等提出了采用多处理器实时偏心诊断方法和实时模糊偏心诊断方法；Fechner等提出了神经偏心滤波器，该滤波器用于在线偏心控制时对于变化的偏心周期具有较好的适应性，该方法还用到了递归最小二乘学习算法；Choi 等提出了偏心最优控制方法等。

除此之外，欧美日各大公司的工程专家也提出了多种轧辊偏心的补偿方法，这些方法又可以分为下面三类：

⑴ 被动轧辊偏心控制方法。这类方法不是试图补偿轧辊偏心对轧件厚度的影响，其主要目的是使辊缝控制系统对轧辊偏心引起的厚度干扰影响不敏感，而不需要辊缝按照辊缝偏心函数进行校正，这就排除了厚度变化增大的可能；

⑵ 主动轧辊偏心补偿法。这类方法一般包括轧辊偏心分量检测和随后得出的补偿信号送到辊缝调节器中以补偿轧辊偏心，轧辊偏心分量是从反映主要轧制参数(如轧制力、辊缝、轧件出口厚度以及带钢张力等)的信号中测得的，根据检测信号的不同处理方法，这类方法可分为下面两种：

① 分析法轧辊偏心分量是通过应用数学分析法(例如傅立叶分析法)从检测信号中提取出来；

② 综合法轧辊偏心分量是通过复制轧辊偏心分量得到，信号复制可采用机械法和电量法；

⑶ 预防轧辊偏心控制法。这类方法是在轧制前创造一些条件以便能减小偏心对厚度的影响，而在轧制中不采用任何校正措施。

国外公司典型的偏心补偿方法有：

⑴ 死区法死区法是一种被动偏心控制法，此法通常可消除控制信号中的周期分量；

⑵ 轧制力法轧制力法是一种主动式轧辊偏心方法，把出口厚度的误差信号转换成附加轧制力基准信号；

⑶ 辊缝厚度控制法辊缝厚度控制法是利用安装在轧机工作辊之间的传感器测出轧制过程中的辊缝偏差，由德国Krupp提出的辊缝控制(IGC)系统就由辊缝传感器组成的，它们被装在机架每侧的工作辊辊颈之间，这样，它们不会受到带钢的损坏；

⑷ 前馈控制法已经在轧机辊缝控制中得到广泛的应用，它包括以下三个步骤：

① 在上游机架的前几机架的轧制道次中，分段测出带钢厚度波动；

② 当带钢每一段即将进入末尾即机架轧制辊缝中时，确定所需的厚度修正量；

③ 在末尾几机架中对带钢每一段实施厚度修正。应用这种方法能够补偿包括轧辊偏心在内的各种因素在内的厚度偏差。一般在中间使用张力控制系统主要有两种。第一种是通过调节上游机架的速度进行带钢张力控制，第二是调节下游机架的辊缝进行带钢张力控制。成功采用前馈控制系统控制轧辊偏心的关键在于轧机电机能否使速度调节器获得适当的速度响应特性；

⑸ Newmann法这种方法是由德国穆勒－纽曼公司的Newmann等人提出的，它是利用随支承辊同时旋转的凸轮来模拟轧辊偏心，位移传感器测出凸轮偏心，然后发出电子信号，传送给辊缝调节器。这种方法虽然简单，但没有得到广泛应用。原因是：

① 在机架中安装支承辊之前，显然要仔细测定每一个支承辊偏心幅度和相移；

② 在轧辊偏心测定结束后，每个凸轮和支承辊偏心相移必须一致。由于支承辊偏心明显非正弦变化，所以要把它和凸轮正弦变化对应起来相当困难；

③ 支承辊与凸轮外形的不协调性也是造成轧辊偏心不能得到补偿重要原因；

④ 不能补偿工作辊椭圆度造成的辊缝变化；

⑹ Alsop法以测厚仪原理为基础进行辊缝控制。假设带钢厚度发生波动，使轧制载荷产生低频波动，而轧辊偏心使载荷产生相当高的频率波动，载荷信号的低频分量在任何通道都不会衰减，它将产生正反馈，正反馈大小为：式中：为轧机纵向刚度，另一方面载荷信号的高频分量仅能通过一个通道，就这部分来说，载荷回路中产生负反馈信号，增益大小为，这样回路会产生信号，它被送到辊缝调节器以补偿轧辊偏心；

⑺ Smith 法英国戴维联合仪器公司的Smith提出以测厚仪原理为基础的辊缝控制系统中轧辊偏心补偿法，它的缺点是使用了金属构件类型的整流器，它会产生于控制信号的波幅差不多的噪声信号；

⑻ Howard法英国戴维联合工程公司的Howard提出利用在轧制过程中两个所测定的参数来测定轧辊偏心，第一个参数是安装在轧机每侧的载荷传感器测出轧制力的波动量，第二个参数为即将进入轧机的轧件厚度波动量；

⑼ Shiozaki(盐崎)、Takahashi(高桥)法也称为轧辊偏心傅立叶分析法(FARE)，它是日本的石川岛播磨公司(IHI)Shiozaki、Takahashi提出的，该方法应用了轧辊偏心量ec和轧制力变化量之间的关系：

(1.13)

式中：Q为轧件塑性系数，为轧机纵向刚度。因为轧辊波动量与支承辊旋转一周周期一致，于是可得：

(1.14)

式中：A为偏心量幅值，为支承辊角位置与轧辊零偏心位置之间的相位角。由于轧制力波动包含有许多不同频率的分量，对于一级谐波来说，根据简单傅立叶级数，其变化量表达式为：

(1.15)

式中：B、C为常数。在支承辊旋转一周的时间内，通过测量轧制力的变化量就可以获得A、B、C和，按照预设定的时间间隔对测定的轧制力进行采样，其中T是支承辊旋转一周所需时间，为旋转一周的采样个数。可得：

，，， (1.16)

通过FARE法测出偏心信号通过压力控制回路可以调节辊缝，以便减小或增大偏心补偿载荷，偏心补偿载荷信号将持续累积到轧辊偏心载荷分量在轧制载荷信号中完全消失为止。然后，当再也测不出偏心载荷分量时，FARE输出信号就被存储在存贮器中。随着轧制持续运行，FARE信号不断存储于存储器中，并且持续计算；

⑽ Cook法西屋电气公司的Cook提出的方法是建立在假设轧辊偏心所起的轧制力变化为正弦变化，变化周期等于支承辊旋转周期基础上。假设，轧制力为

(1.17)

式中：为支承辊旋转一周对应的平均轧制力，为轧制力变化的振幅，为支承辊选定零位与平均轧制力对应的支承辊位置之间的夹角，为轧辊角位置。于是得到：

(1.18)

式中：分为上下支承辊对应的补偿信号波幅：

， (1.19)

式中：为轧机纵向刚度。

⑾ Fox法 Cook法的应用局限于双驱动布置的电机，而检测轧辊偏心需花费大量的时间，西屋电气公司的Fox利用上下支承辊之间的差异产生的摇摆现象控制偏心。根据Fox法，在压靠时将轧辊转动但不咬入轧件时测定轧制力，假定轧辊偏心变化量呈正弦变化，此时在一个偏摆周期内，两轧辊轧制力信号分别等于：式中：分为上下支承辊角位置，分为偏心引起的轧制力波动幅度。

⑿ Ichiryu等人的方法日本日立公司的Ichiryu等人提出提出连续测定入口带钢厚度和轧制力，然后使用这些测量值获得出口厚度，根据相关函数，利用统计方法就可以测出轧辊偏心造成的干扰量，然后从控制系统中消除；

⒀ Hayama(叶山)方法该方法已应用在三菱重工研制的自动轧辊偏心控制系统中，这种方法的原理是使用在线和离线方法检测轧辊偏心，然后加权求和。离线法是在压靠条件下利用摇摆现象测定轧辊偏心，在线法是在轧制条件下，通过使一个支承辊相连的脉冲发生器信号和所测的轧制力信号联系起来，进行轧辊偏心检测；

⒁ Yamagui(山口)法日本日立和新日铁公司的山口提出的轧辊偏心方法是通过出口厚度偏差采样测得的从头前转期间的数据计算出轧辊偏心补偿信号；

⒂ Weihrich和Wohld法德国西门子公司的Weihrich和Wohld提出的轧辊偏心的方法是基于测厚仪原理，通过求和放大器用辊缝的输出信号和载荷传感器输出信号来计算板带出口厚度，而求和放大器的输出信号也包含有轧辊偏心成分。利用辊缝值和成正比的信号就可以通过信号混合器产生轧辊偏心总的信号，同时也改变入口处板带厚度变化成分和入口处板带稳定成分，利用高通滤波器，从混合器输出信号中去掉稳定成分；

⒃ Gerber法伯里斯(bliss)公司的Gerber开发了一套自适应数字化偏心补偿(ADEC)系统，该系统利用了声学技术的最新成果，即具有复制信号中的任意选定交变成分的技术；

⒄ Ooi(大井)法日本住友公司的Ooi利用支承辊平衡液压缸的这些机构来控制偏心。这种方法是使带有电动压下结构的轧机无须进行任何显著的的改进就可以实现系统高精度的快速效应。支承辊偏心通过傅立叶分析就可以确定出上下辊操作及驱动侧位置相关的轧辊偏心成分；

⒅ Ginzburg法国际轧钢咨询公司及联合工程公司的Ginzburg提出两种轧辊偏心补偿方法，第一种方法是利用差拍现象，尤其是利用上下支承辊向同一方向发生偏心时轧辊偏心最小的事实；第二种方法是在轧制过程中对轧辊偏心进行连续补偿。

总之，随着对该高质量板带材需求的日益提高，轧辊偏心控制问题得到各国轧钢控制界的普遍重视，各种检测和控制方法相继出现。国外大公司一般在这个领域获得专利，我国在这个领域尚有差距，需要促进对轧辊偏心控制技术问题的理论分析和研究，不断使其走向深入和完善。

重复控制理论研究现状针对周期信号发生器正反馈带来的非平凡问题在如何保证系统稳定问题，Hara等证明，如果对象是正则的且不是严格正则的，系统就能保证稳定[48]。为了克服这种重复控制系统不易稳定的局限性，Hara等1988年提出在重复控制环节中引用低通滤波器来滤掉高频部分，以高频部分牺牲一些特性来实现系统的鲁棒性。因此低通滤波器的选择对于重复控制非常重要，它的引入一方面有利于系统稳定，另一方面，却带来系统的稳态误差，它反映了闭环系统特性和系统鲁棒稳定性间一种折中考虑。1985年和1988年Hara等提出了基于状态空间的设计方法。近来，鲁棒优化控制和结构奇异值方法也用来设计和分析重复控制[49,50]。Peery 和 Ozbay(1993)利用无穷维优化控制原理提出了一种2步法设计优化重复控制器。他们同时提出通过优化重复控制器的滤波器进一步改善系统主要特性的方法。Guvcac(1996)对于连续时间的重复控制系统结构奇异值提出鲁棒稳定和动态特性分析方法，即分别用－1和1代替系统内模的延迟部分估计结构奇异值的下确界和上确界，这样就把原来的无穷维问题化作有穷维问题。可以利用这种结构估计连续时间重复控制系统的稳定性和鲁棒特性。但是，得出结构奇异值的下确界比用1代替时小，上确界又比用－1代替时大。直到延迟足够大这种估计才能得到满意的结果。另外，这种估计还需满足相位要求，因此这种结构不能用来综合。

重复控制器不断被改进，且被数字化[51～54]。为了减小控制器离散化造成的误差，很多研究者关注于用离散化方法直接设计重复控制器。Tomizuka等提出一种针对稳定开环对象的零相位偏差跟踪的重复控制器(Zero Phase Error Tracking Controller)，这种方法特点是滤波器的结构和对象同阶并满足时延。基于相同的补偿器结构，Tsao和Tomizuka(1988，1994)进一步获得使系统鲁棒稳定的内模零相位低通滤波器的方法，给出了和非模型动态的关系，确定了鲁棒稳定的充分条件。这种方法可以用于最小相位和非最小相位系统。Alter 和Tsao推导出基于二维模型匹配算法的重复控制算法，并它应用到线性马达的控制过程。Kim和Tsao(1997)综合前馈、重复和反馈控制方法，实现电液执行器的鲁棒特性控制。Tsao 等把重复控制利用到凸轮机械的非圆旋转。在极点配置方法中，Ledwich 和Bolton提出了LQ(Linear Quadratic)设计方法。Hillerstrom和Sternby(1994)提出了基于标准Bezout辨识的极点配置方法。Bamich 和 Pearson(1991)提出了采样数据提升技术(lifting technology)并将其用于设计最优采样数据重复控制系统。Langari 和Francis(1996)提出基于结构奇异值的采样数据鲁棒控制系统的鲁棒分析方法。

Srinivasan和Shaw提出了频域设计方法[55,56]，并提出了被称作重构谱的频率函数[57,58]，利用它来判定重复控制系统的相对稳定性。如果在没有重复控制环节时闭环系统稳定，则对于频率，是系统稳定的充分条件。设计重复控制的离散时间重构谱的改进方法由Srinivasan和Shaw于1993年提出。基于谐波频率处对象频率响应的系统稳定改进方法在1995年由Sadegh提出。 Hanson(1996年)提出一种序贯重复控制系统。首先利用最优控制设计能增加闭环动态硬度的内环控制器，然后基于零相位偏差跟踪控制设计外环重复控制器以保证跟踪或抑制周期输入。由于这是两步设计(两个控制器分别设计)，所设计的控制器阶次必然高。内环最优控制器的特性将在最大峰值2处被外环重复器降低。Guo提出利用替代基于重复控制零相位跟踪控制中的。选择和做为灵敏度函数进行频率调整，以抑制磁盘驱动伺服控制的二次谐波干扰的抑制。众所周知，基于重复控制的零相位偏差跟踪控制需要是低通滤波器，且频带尽可能宽。因为的选择必须兼顾重复控制特性和稳定鲁棒性，因此灵敏度函数的频率调整受这种因素限制。Li和Tsao成功应用鲁棒重复控制于磁盘伺服控制。

本文的主要工作及各部分内容安排

主要研究内容

由于重复控制对周期性信号具有很好的自学习能力，因此对周期性扰动具有很好的抑制作用。重复控制只需知道扰动信号的周期，对信号的初始状态，如初相角和幅值等没有要求，这样大大简化信号的检测，同时降低了控制难度。重复控制的难点在于对系统稳定性要求较高。国内外将重复控制应用于轧辊偏心控制的文献不多。围绕研究带钢高精度厚度控制的目的，本文以获得厚度精度控制为目标，重点研究厚度控制过程中应用重复控制抑制轧辊偏心扰动。本文主要做两方面的工作。首先针对厚度控制过程中轧辊偏心补偿问题的特点，将先进的的重复控制理论和自动控制理论有机结合应用到这个问题中来，提出控制方案；其次从稳态精度、稳定性和鲁棒性三个方面进行理论分析，对控制方案进行计算机仿真研究。

⑴ 首先提出了单轧辊偏心扰动重复控制抑制的单输入单输出(SISO)厚度控制系统频域设计方案，方案中为了弥补重复控制延迟环节前引入滤波器带来的控制精度问题，提出一种补偿器，给出了补偿器的设计方法。厚度控制采用测厚仪测厚的反馈AGC控制方案，用Smith预估器补偿被控对象滞后，补偿后的广义对象采用常规PID控制。同时还给出了一种将鲁棒PID控制器和重复控制设计结合在一起的混合设计方法。其次提出了多轧辊偏心扰动重复控制补偿的SISO厚度控制系统频域设计方案。对系统的稳定性、鲁棒性和系统动态品质进行了分析，同时对控制方案进行了仿真研究；

⑵ 针对多输入多输出厚度、张力控制系统，首先提出了单轧辊偏心重复控制频域设计方案，然后扩展到多轧辊偏心控制系统。采用逆奈奎斯特方法对被控对象进行解耦。对控制方案进行了理论分析和仿真研究，证明重复控制抑制单周期和多周期偏心扰动的有效性；

⑶ 针对重复控制对偏心扰动的基波及其谐波抑制效果较好，而对基波和谐波附近频率信号扰动的抑制较差，同时轧制过程中因各种原因造成轧辊偏心信号的周期可能波动或者偏心扰动信号不能准确测量或辨识情况，提出了一种鲁棒重复控制结构，从理论上证明了这种鲁棒重复控制较常规重复控制性能优越，对扰动信号的周期波动不敏感，具有很强的鲁棒性。将这种结构用于厚度控制系统，仿真结果证明了这种结构对周期不确定轧辊偏心信号具有很强的抑制能力。

⑷ 因工程中普遍采用数字化设计，分别提出了单轧辊偏心、双轧辊偏心及多轧辊偏心鲁棒数字重复控制器设计方案.这种设计能有效地降低补偿器阶次。厚度控制采用流量AGC和反馈AGC结合的控制结构，避开因测厚仪测厚滞后造成的系统不易稳定的弊端。所有方案都进行了理论分析，同时对所提出的硬度前馈和厚度反馈的控制结构在偏心扰动和硬度扰动下进行了仿真，结果证明这些方案的有效性。

各部分内容安排

全文共分7个部分，每部分的具体内容安排如下：

第一章首先阐述了冷轧板带厚度控制方法和研究现状，指出了抑制轧辊偏心扰动在高精度厚度控制过程中的重要性；其次，综述了国内外轧辊偏心的研究成果及现状。

接着全面介绍了重复控制概念的基本内涵、应用的对象和重复控制理论的研究成果；最后给出了本文的主要研究内容。

第二章首先全面而系统的归纳了轧辊偏心的的特点和性质，在此基础上，给出了获取偏心信号的改进傅立叶方法；其次给出了几种厚度控制模型，提出了硬度波动前馈控制模型。

第三章首先给出了单轧辊偏心扰动重复控制抑制的单输入单输出(SISO)厚度控制系统频域设计方案；其次提出了多轧辊偏心扰动重复控制补偿的SISO厚度控制系统频域设计方案。对系统的稳定性、鲁棒性和系统动态品质进行了分析，同时对控制方案进行了仿真研究。

第四章针对多输入多输出厚度、张力控制系统，首先提出了单轧辊偏心重复控制频域设计方案，然后扩展到多轧辊偏心控制系统。对控制方案进行了理论分析和仿真研究。

第五章针对周期不确定轧辊偏心信号，提出了一种鲁棒重复控制结构，从理论上证明了这种鲁棒重复控制较常规重复控制性能优越，并对其抑制周期不确定轧辊偏心信号进行了仿真。

第六章分别提出了单轧辊偏心、双轧辊偏心及多轧辊偏心鲁棒数字重复控制器设计方案，给出降低补偿器阶次的方法。对所有方案都进行了理论分析和计算机仿真。

第七章对全文工作进行了总结，提出了下一步工作设想。

轧辊偏心问题的理论分析和冷轧板板带厚度控制模型

轧辊偏心问题的理论分析

广义上说，轧辊和轧辊轴承形状的不规则引起辊缝周期性变化称为轧辊偏心。轧辊偏心会导致轧件厚度周期变化，轧辊的偏心可以归纳为两种基本类型。一种是由辊身和辊径的不同轴度引起的偏差所引起的；另一种是由轧辊本身所具有的椭圆度所产生的。而实际情况可能是两者共同作用的结果。

辊身和辊径不同轴的情况

图2.1 辊身和辊径不同轴的情况

如图2.1所示，为辊径的轴心，为辊身的轴心，为辊身的半径，X为与之间的距离。偏心运动轨迹相当于辊身表面可移动点A绕辊径轴线转动，即偏心波形为的轨迹。设支承辊转动的角速度为，，在三角形中，由余弦定理可知：

(2.1)

设t=0时，＝0，=，。由正弦定理得：

(2.2)

从而有：

(2.3)

因而有轧辊偏心运动轨迹的参数方程为：

(2.4)

根据以上参数方程，得轧辊偏心波形如图2.2所示。

图2.2 轧辊偏心波形

图2.3 辊身为椭圆时的示意图

轧辊具有椭圆度的情况

如图2.3 所示，o是轧辊的轴心，是理想辊身的半径，a 和b 分别是实际椭圆截面的长轴和短轴。实际情况可能不是椭圆。偏心波形为椭圆周上可移动点A与理想圆周的径向距离的轨迹，r为A到轧辊轴心线的距离。设辊身转动的角速度为，t=0时，，则有:

(2.5)

又由椭圆方程得：

即

从而

因此有

(2.6)

因而得到轧辊偏心曲线方程为

(2.7)

得到的偏心波形类似于图2.2。

如果两个辊的角速度相同，那么合成的偏心信号仍然是同频率的周波。这是因为周期信号可以分解为一系列的正弦波之和。而两个同频率的正弦波之和仍是正弦波。设和为两个角频率为的正弦波，其中

(2.8)

则合成的波形为

(2.9)

式中：

(2.10)

(2.11)

合成波形的振幅发生变化，相位发生偏移，频率保持不变。轧辊偏心波形一般不是纯粹的正弦曲线，而是包括多次谐波的复杂的周期波。它有以下特点：⑴ 周期性轧辊每转动一周，偏心信号重复出现一次；⑵ 频率和幅值不是固定不变的。当轧制速度变化时，其频率也随之成比例变化。在轧制过程中，由于轧辊的热膨胀和磨损，偏心信号的幅值也会发生缓慢变化；⑶ 偏心信号不仅含有多次谐波，而且还含有各种各样的随机干扰。

偏心信号的采集和处理

轧辊偏心对厚度的影响可以用出口厚度变化的频谱分析来评估，斯太尔克利用快速傅立叶变换(FFT)，从出口厚度数字化信号中分离所有周期分量，并依据所有轧辊转速和尺寸，能够辨别出大部分频谱峰值，通过对频谱选择过滤同时结合反变换FFT技术，每个轧辊对出口厚度变化的影响都能测量出来。从上面分析中，我们知道轧辊偏心信号是包括多次谐波的高频周期波，偏心信号的频率与轧制速度成正比。在生产过程中，由于随机噪声、缓慢变化量等的存在，采集的偏心信号会出现突变、漂移等无规则变化，但总的偏心信息不会突变。轧辊更换以后，它的偏心量就基本上确定了。，并在短时间内不会突变。根据这一特点，在每次换辊以后，在正常轧制状态下，对轧制压力信号进行采集，从中提取偏心成分，建立偏心模型。进而对轧辊的偏心进行补偿。

将采集到的轧制力信号进行A/D转换，然后进行去均值(去掉直流分量)和相干时间平均处理，使噪声干扰得以减弱或消除，提高信噪比；对预处理后的信号进行快速傅立叶变换(FFT)，建立轧辊偏心参数模型。在轧辊上安装一个光码盘，以产生两列脉冲。一列相对轧辊某一固定点，每转一周发出一个脉冲，此脉冲作为采样和控制的初始定位信号；另一列是轧辊每转一周，光码盘发出128个脉冲数列以进行FFT，建立模型。相干时间平均方法适应于周期信号或重复信号，它将各个周期信号和噪声信号同时叠加后加以平均，如果噪声是随机的，则在叠加过程中会相互抵消，而信号是有规律的，叠加平均后幅值不变。必要条件是噪声应具有一定随机性，而信号则具有重复性，且两者互不相干。

设混有噪声的信号为，信号反映系统的某种基本特征。在相同的条件下，具有重复性。噪声为均值为零，方差为的平稳随机信号，且、互不相关。对第i个样本采样M次，然后做相干平均得：

(2.12)

傅立叶变换是在以时间为自变量的信号与以频率为自变量的频谱函数之间的变换关系。傅立叶变换可以辨别出或区分出组成任意波形的一些不同频率的正弦波。快速付立叶变换是建立在离散时间概念上的，它不单纯是对离散时间付立叶变换的近似，而是从离散付立叶变换出发，有一整套自成体系的、离散时间域中的严格的基本定理和数学关系。离散付立叶变换能把一个有限长度序列映射成另一个有限长度序列，因而很适合于数字计算机计算。利用离散付立叶变换的一些代数结构，可以实现高速算法，快速付立叶变换能使离散付立叶变换的计算时间成数量级的缩短。快速付立叶变换的出现使付立叶变换已不仅仅是一种理论概念，而且成为一种技术手段。

⑴ 离散付立叶变换[65 ,66]

当用数字计算机对信号进行频谱分析时，要求信号必须以离散值作为输入，而计算机输出所得的频谱值，自然也是离散的。因此，必须针对各种不同形式信号的具体情况，或者在时域和频域上同时取样，或者在时域上取样，或者在频域上取样。信号在时域上取样导致频域的周期函数，而在频域上取样导致时域的周期函数，最后将使原时间函数和频率函数都成为周期离散的函数。

从严格的数学意义上讲，离散周期序列的付立叶变换是不存在的。但是，如果利用周期函数可能展开为付立叶级数的指数形式并使用冲激序列，则可以把付立叶级数逐项作积分变换，从而在形式上得到付立叶变换对。

设为一周期连续信号，如果以抽样间隔为的抽样率进行抽样，抽样结果为，则可表示为：

(2.13)

设一个周期内的抽样点数为，即到，则

可写成：

于是有：

(2.14)

对进行抽样等于先将它的一个周期抽样成，然后把这一个周期进行延拓。所以有：

(2.15)

式中上的符号表示周期重复，它是离散时间周期冲激序列，是的一个周期内抽样所得的数值；为抽样序号，；为抽样间隔；为的周期；为任意整数。

令，并将展开成付立叶级数

(2.16)

式中：，的单位为，系数可表示为：

(2.17) (2.18)

对式（2.18）进行付立叶变换得：

(2.19)

定义

(2.20)

由于

所以。这里是的个周期，。也就是说的周期为，在每个周期内，。于是，式(2.20)可写成：

(2.21)

上式说明，周期离散时间序列经付立叶变换后在频域中是离散频率的周期序列，这种形式的变换也称为离散付立叶级数变换。在数学上，离散周期序列的付立叶级数变换可简明表示为：

(2.22)

(2.23)

为了方便，令，则式(2.22)和式(2.23)可表示为：

(2.24)

(2.25)

离散付立叶级数变换是周期序列，仍不便于计算机计算，但离散付立叶级数每个周期序列却只有(一个周期内取点个数)个独立的复值，只要知道它的一个周期的内容，其它的内容也就知道了。同时限制式(2.24)中的和式(2.25)中的都只在区间内取值，就得到了一个周期的和一个周期的之间的对应的关系：

(2.26)

(2.27)

这就是有限长序的离散付立叶变换对。

上两式所示的离散付立叶变换对可以看成是连续函数在时域、频域取样所构成的变换，可以看作是连续付立叶变换的近似，是一种很有用的变换方法。然而，当数据有较长的长度时，这种变换的计算量是很大的。分析式(2.26) 和式(2.27)可知，当用直接方法计算DFT时，总运算量及总运算时间近似地比例于，这在很大时，所需的运算量及总算时间近似地比例于，这在很大时，所需的运算量非常可观，要想用DFT方法对信号作实量处理一般是有困难的。

⑵ 快速付立叶变换(FFT)

快速付立叶变换是为减少DFT计算次数的一种快速有效的算法。它使DFT的运算大为简化，运算时间一般可缩短一至二个数量级，其突出的优点在于能够快速高效地和比较精确地完成DFT的计算。

FFT改善DFT运算效率的基本途径是利用DFT中的权函数所固有的两个特性，一个是的对称性，即，另一个是的周期性，即。利用的对称性，可根据正弦和余弦函数的对称性来归并DFT中的某些项，结果可使乘法次数约减少一半。假定是一个高复合数，可利用权系数的周期性，把点DFT进行一系列分解和组合，使整个DFT的计算过程变成一个系列迭代运算过程。因为迭代运算的计算量要比直接计算的计算量少很多，尤其是当很大时，可能成百位甚至成千倍地减少。快速付立叶变换算法正是基于这一基本思想而发展起来的。权系数的周期性是导出FFT算法的一个关键因素，高复合性则是实现FFT算法的一个重要条件。根据不同的分解方法，可以导出多种FFT算法，如按时间抽取的FFT算法，按频率抽取的FFT算法，的高复合性则是实现FFT算法的一个重要条件。根据不同的分解方法，可以导出多种FFT算法，如按时间抽取的FFT算法，按频率抽取的FFT算法，为复合数的FFT算法等。时域抽点算法的迭代过程是基本在每级把输入时间序列分解为两个更短的子序列，频域抽点算法的迭代过程则基于在每级把输出频率序列分解成两个更短的子序列。

以2为基时域抽点FFT算法是最基本最常用的算法，基2算法要求采样点数为2的整数次幂。设有一个点序列，而，首先将按序号之奇偶分解为两个点的子序列，因而得：

(2.28)

如采用下列变量替换：(当为偶数时)，(当为奇数时)，则上式可变为：

(2.29)

又因

所以上式又可改写为：

(2.30)

由于对于均有定义，而及只对有定义，因此，有必要就情况下对2.30作出说明。根据DFT的周期性可得：

(2.31)

考虑到：

则上式可改写为：

(2.32)

经整理后得：

(2.33)

式中：和可分别写成序列和的点DFT。

式(2.33)表明，一个点DFT可分解成两个点DFT，而这两个点DFT又可组合成为一个点DFT，效果是相同的，但是运算量却大不相同。很明显，如果以一次复乘和一次复加称为一次运算，那么，计算两个点DFT约共需运算，此外再加上按式(2.33)组合需要次运算，所以按先分解后组合的方式计算一个点DFT总共约需次运算。当较大(即)时，它的运算量比直接运算点的DFT约可减少一半。

因为是2的幂，所以可进一步将每个点子序列按奇偶号分解为两个点子序列，再令每两个点子序列组合成一个点DFT……。上述分解过程还可继续进行，直到第次分解，每个子序列都只有两点。这样，就把点DFT的运算转化为级组合运算，M级组合就是M级迭代过程。每次迭代要求N/2次复乘和N次复加，M级迭代约需次复乘和次复加。每次迭代要求次复乘和点DFT的迭代运算过程是基于在每级把输入时间序列分解成两个更短的子序列，因此称为时域抽点算法。图2.4 说明了此迭代运算过程。

图 2.4 N点基2 FFT的M级迭代过程

经过FFT变换结果，就可以计算出各次谐波的振幅和相角，从而建立轧辊的偏心模型，其振幅A＝，相角，频率随轧辊速度变化而变化。

偏心模型还必须转换为与采集脉冲对应的离散点的模型，即将带有三个参数的正弦波偏心模型转换成128个脉冲对应的离散点模型。轧辊偏心控制对检测和控制系统的准确性和快速性要求很高，定位定点采样保证了通过数据处理获得的偏心模型的唯一性和准确性。把正弦波的一个周期分成N段，列成表格，用步长DELTA扫过这个表，用序号作为角度参数，查表求出序列的值。假设每两个采样点之间的时间间隔维t，则正弦频率为。当步长不是整数时，采用点可能落在两表值之间，可以采用线性内插法加以修正。

⑶ 基2时域FFT算法的改进(MMFFT)

针对轧辊偏心信号本身及其控制问题的特点，对传统的基2时域FFT算法进行改进(MMFFT)。改进分两部，第一步改进的是取消传统FFT方法对采样持续时间的限制，使快速付立叶变换算法适用于处理轧辊偏心波动这类周期未知或变动的周期信号，同时又能抑制FFT固有的泄漏效应。第二步改进是就偏心控制问题而言，将周期信号中各次正弦波的绝对频率转换为相对频率，从而提高算法在偏心控制中应用的可靠性和实用性。

① 第一步改进(Modlified FFT)

人们对DFT感兴趣主要是因为它是连续付立叶变换的一个近似。近似的准确程度严格说来是被分析波形的一个函数，两个变换之间的差异是因DFT需要对连续时间信号取样和截断而产生的。因而在应用DFT解决实际问题时，常常遇到混叠效应、栅栏效应和泄漏效应等问题。

对一个连续信号x(t)进行数字处理时，要在计算机上进行计算，而计算机的输入只允许是数字信号，所以必须对连续信号x(t)进行抽样，即

(2.34)

式中：为对x(t)抽样所形成的序列。T为抽样间隔，为抽样率，。如果抽样率选得过高，即抽样间隔过小，则一定的时间里抽样点数过多，造成对计算机存贮量的需要过大和计算时间太长。但如果抽样率过低，则在DFT运算中将在频域出现混叠现象，形成频谱失真，使之不能反映原理的信号。这样将使进一步的数字处理失去依据，而且也不能从这个失真的频谱中恢复出信号来。因此，对连续信号的抽样率需大于奈奎斯特频率，即抽样率至少应等于或大于信号所含有的最高频率的两倍，即。

如果x(t)是一个周期信号，它只具有离散频谱，那么，x(t)抽样后进行FFT运算得出的频谱就是它的离散频谱。但是如果x(t)是个非周期函数，它的频谱是连续的，把x(t)的抽样进行DFT运算得到的结果就只能是连续频谱上的若干点。因为这就好象是从栅栏的一边通过缝隙观看另一边的景象一样，所以称这种效应为栅栏效应。如果不附加任何特殊处理，则在两个离散的变换线之间若有一特别大的频谱分量，将无法检测出来。减少栅栏效应的一个方法就是在原记录末端填加一些零值变动时间周期内的点数，并保持记录不变。这实质上是人为地改变了周期，从而在保持原有线连续形式不变的情况下，变更了谱线的位置。这样，原来看不到的频谱分量就能够移动到可见的位置上。

泄漏效应是由于在时域中对信号进行截断而引起的。实际问题中，所遇到的离散时间序列x(nT)可能是非时限的，而处理这个序时时，需要将其限制为有限的N点，即将它截断。这就相当于将序列乘以一个矩形窗口，如果对有限带宽的周期函数抽样后的截断长度并不正好是其周期的整数倍，就会导致离散付立叶变换和连续付立叶变换之间出现显著的差异。这是因为，根据频域卷积定理，时域中的，则频域中与进行卷积。这里，和分别是的付立叶变换，这样将使截断后的频谱不同于它加窗以前的频谱。泄漏效应的产生是由于矩形窗函数的付立叶变换中具有旁瓣亦有一定带宽而引起的。如图2.5所示。为了减少泄漏，应尽量寻找频谱中窗函数，即旁瓣小、主瓣窄的窗函数。或者通过限制采样的持续时间来抑制泄漏效应。

图2.5 矩形窗口的时域与频域图形

卷积神经网络的主要思想精选(九篇)

第1篇：卷积神经网络的主要思想范文

第2篇：卷积神经网络的主要思想范文

第3篇：卷积神经网络的主要思想范文

第4篇：卷积神经网络的主要思想范文

第5篇：卷积神经网络的主要思想范文

第6篇：卷积神经网络的主要思想范文

第7篇：卷积神经网络的主要思想范文

相关文章阅读

精选范文推荐