前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的解码技术论文主题范文,仅供参考,欢迎阅读并收藏。
【关键词】MP3;SOPC;Nios II;硬件实现
1.引言
MP3(MPEG Audio Layer3)是高品质的音频压缩标准,因其在音质,复杂度与压缩比的完美折中,占据着广阔的市场,目前在便携式设备领域深受人们喜爱。而随着消费电子的快速发展,MP3在各种场合的需求越来越多,同时针对MP3解码器的设计也越来越多。其中主要有以下三种方式:①以专用MP3编解码芯片为核心加上必要电路的VLSI实现;②DSP处理器加外部存储器,数模转换等器件实现;③以低速核心处理器(CPU/RISC)与其他硬件加速模块的SOPC设计加上器件实现。而第三种实现方式相对于前两种方式在功耗和性价比方面有着明显的优势,本文是基于SOPC技术来实现MP3解码器的设计,其中MP3文件数据用SD卡来存放[1]。
2.MP3解码流程分析
MP3解码流程如图1所示,解码的主要过程包括同步提取码流(以帧为单位)哈夫曼解码,比例因子解码,反量化,重排列,立体声处理,混叠重建,IMDCT变换,子带综合滤波合成,最后输出原始的PCM数据。
在解码过程中,耗时比较多的主要是IMDCT和子带综合滤波这两部分。在编译后它们占据着相当多的硬件资源,功耗特高,所以在设计时针对这两个计算量大的算法IMDCT,子带综合滤波器做了硬件加速处理,来提高整个系统的性能。在IMDCT算法中有长块和短块,计算时长块输入是18点而短块输入是6点,长短块输入的值都是非2的n次方,所以可以采用Szu Wei Lee快速算法,此算法对输入点数越大的运算,其速度提升就越明显。传统的IMDCT算法,在计算长块时需要的是36*18次乘法和36*17的加法,采用Szu Wei Lee算法后,长块的计算只需要43次乘法和115次加法,程序的运算速度显著提高了。在设计子带综合滤波时,直接计算则需要执行32*64次乘法和31*64次加法,两声道采样率为44.1KHz,乘法运算量为(44100/32)*(64*32+512)*2=7056000次/秒,而系统时钟一般都采用的是50MHz,单个周期内占着整个解码时间的58.2%,严重影响了整个系统解码的速率。所以可以根据余弦函数的对称性,并结合Byeong Gi Lee快速DCT算法来进行改进,改进后子带综合滤波则只需要进行384次乘法和376次加法,大大提升了运算速度[2]。
3.系统的硬件设计
基于Nios II的嵌入式系统主要是由三部分组成:IP库(NiosII软核处理器,Avalon总线,设备接口等),GNUPro软件编译器,SOPC Builder开发工具。本文在硬件设计时使用Altera公司的Cyclone II FPGA芯片,型号为EP2C70F896C6,主要设备包括片外SDRAM存储器、SD卡、音频芯片WM8731、LCD等,其中FPGA芯片完成对各个硬件模块和数据流的控制,片外存储器存放程序数据和执行代码,SD卡存放MP3文件,音频芯片将PCM数据流转换输出,LCD显示系统状态,IP核的复用是SOPC设计的关键[3]。其硬件系统结构如图2所示。
而FPGA内部逻辑设计是以Quartus II为开发环境,以Verilog语言编程实现音频控制,SD卡的读写,液晶显示驱动等功能模块的设计。用SOPC Builder配置并产生NiosII软核处理器以及必要的外设,然后在再通过编译,下载到FPGA的配置芯片中,形成硬件逻辑电路的连接,最后验证系统,从而实现MP3音频文件的输出。除了音频模块、SD卡控制模块、LCD显示驱动模块外其他模块都可以通过SOPC Builder来添加IP核构建。
至于MP3解码算法中的子带综合滤波,IMDCT变换两部分处理起来特耗时,针对这类耗时问题,可以采用软硬件协同处理(软件中耗时较多的部分进行硬件加速后,往往会比原先软件处理时的速度快上好几倍。)来提高整个系统运行的时间。通过这种设计方法,在综合时可以确定系统软件和硬件之间的相互制约关系,从而保证系统的确定性,高效性。
4.SOPC片上系统的实现
在FPGA中搭建SOPC系统时,需要用到如下图3所示的软核处理器和Avalon总线结构和外设接口等,其中,系统时钟c0由外部晶振50MHz倍频后得到的,c1为100MHz外设SDRAM时钟,c2为音频芯片提供的18.51MHz工作时钟。timer用于系统内部时间的产生,time_stamp用于记录指令的运行时间。片外SDRAM存储芯片是作为程序存储器及数据存储器。本系统自定义了AUDIO模块,该模块主要用于与WM8731音频芯片数字接口进行数据传输。
5.实现结果
本文是基于SOPC技术实现MP3解码器的设计,其优势在于系统功能改进的灵活性,即不改变硬件平台的情况下,可以随便的对系统进行增删和优化,降低系统的成本,这是其他方案很难比拟的地方。而本设计是在在DE2-70开发板上实现的,硬件解码系统采用Verilog HDL语言进行描述,经过RTL级仿真和验证后,在Cyclone II EP2C70F896C6器件内资源占用率为8%,总的寄存器为3335个,系统频率可达到72MHz,经过实际测试,本设计达到了预期的效果。但还存在着一些地方不够完善和有待改进,这同时也是以后MP3播放器设计需要改进和研究的重点:
(1)本设计功能比较简单,编译后FPGA芯片资源占用的比较少,可进一步增加其它功能,如图像显示。
(2)如何改进更有效的算法,提高系统运行时间,降低功耗,以达到便携式高性能、低功耗的要求,这是未来MP3设计研究的重点。
参考文献
[1]毛丽萍.MP3音频编解码运算中IMDCT算法研究及其FPGA实现[D].[硕士学位论文].华东师范大学,2007.
关键词:H.264,运动估计,整像素预测
1、引言
H.264是一种高性能的视频编解码技术, 它是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。论文写作,整像素预测。
作为新一代的视频编码标准,它具有很高的数据压缩比率和优异的性能,广泛应用于视频会议、视频点播、高清视频、移动播放器等多个领域。
H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。论文写作,整像素预测。和MPEG-2和MPEG-4ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。论文写作,整像素预测。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。
在H.264的编码芯片结构中,相比帧内,帧间(Inter Prediction)编码的效率高,但是运算复杂度也比较高。帧间编码的核心运算部分是“ME”(motion estimation)即运动估计,占用最多的逻辑与时钟资源。帧间预测的运动估计过程分为整像素运动估计(IME)和分像素运动估计(FME),首先找到整像素的最佳MV,然后再进行分像素的搜索。除了巨大的计算复杂度,编码过程也很长,包括预测,重构和熵编码。
2、运动估计运算
H.264帧间预测是利用已编码视频帧/场和基于块的运动补偿的预测模式。由于引入了1/4像素精度、多种分割预测等先进技术,在获得更高压缩率的同时,其算法复杂度也大大提高,使得帧间预测编码耗时占到整个编码计算时间的50%以上,若采用全软件实现高清图像的实时编解码,明显力不从心,这就要求使用高性能的硬件编解码器来完成高清实时编解码任务,这也是本人研究的主要内容。
编码宏块(16x16象素)可以分割成不同大小的块像数据,例如16x16、16x8、8x16、8x8、8x4、4x8、4x4等七种模式。而“ME”的再对各种宏块分割方式下的每个块象素进行预测运算,然后由后续模块统计和比较出最优的分割方式。
运动估计包括整像素预测(IME)和分像素预测(IME)两部分,这两部分是串行的。每一个宏块,只有在IME 做完之后,找到最佳整像素MV,再进行FME。
在进行IME计算时,首先要计算MVP,对于一个块象素,预测运算就是在参考帧中搜索出最佳匹配(即两者差异最小)的同尺寸块象素作为当前块的参考区域。如果在整个参考帧的范围下进行全面的搜索,固然可以得到最为匹配的区域,但是复杂度太大。事实上,相邻块在参考帧中的匹配区域一般位置比较接近。综合考虑算法复杂度,编码效果,资源使用等方面,帧间预测做了如下处理:首先根据周边块的Mv值预测出当前块的Mv值,即Mvp,然后在Mvp所指参考帧中象素点周边搜索最佳块象素。
MVP的搜索过程如图2所示,假定E为当前的宏块、宏块分割或者亚宏块分割,除了16x8和8x16,MVP为A、B、C的MV的中值;对于16x8分割,上面部分MVP由A预测,下面部分MVP由B预测;对于8x16分割,左面部分MVP由B预测,右面部分MVP由C预测。论文写作,整像素预测。以MVP作为搜索的起点。
图2 MVP 计算
IME在进行当前宏块MB(x)的MVP计算的时候,前面的宏块MB(x-1)包含分像素的MV还未得到,这个时候我们无法得到准确的A,所以我们此时以MB(x-1)的16x16分割搜索时所得到的整像素MV来代替A,并把据此计算得到的MVP作为搜索的起点。
3、IME模块及功能
IME模块的架构如下图所示
图3 IME模块架构图
IME的主要功能是:
(1)数据:把原始和参考YUV从inter_config模块中取出,为PS和FME模块准备预测所需数据;
(2)控制:控制帧间预测的过程
IME的模块划分及各自功能:
Pipe_ctrl:不同分割间的搜索和选择 将不同分割方式的顺序搜索改为并行,用两条水线来实现加速 Pipe0:进行P16x16,P8x16,P4x8 ;Pipe1:进行P8x8,P16x8,P8x4,4x4由两条共同完成(为了减少pipe0的等待时间,把pipe1的部分工作放到pipe0中)
MVp_ctrl:每种分割的具体搜索过程
(1)计算MVp值
(2)控制reg_ctrl模块的数据存取
Reg_ctrl:为相连模块准备数据
(1)为整像素准备数据,传输给PS模块;
(2)为分像素搜索准备数据,传输给FME模块;
(3)为重构准备数据,传输给FME模块
4、与IME模块相关的主要功能模块
图3中与IME工作相关的有两个主要的部分,一个是Inter_config 模块,还有一个是PS模块,它们在系统中起着重要的作用。论文写作,整像素预测。
1. Inter_config模块及功能描述
Inter_config模块,即帧间数据调度模块,其数据传送如图4所示,Inter_config模块有两部分功能:一是为IME服务,把IME所需的数据从DDR取到Sram;二是为Loop Filter服务,把LoopFilter模块的deblock运算所需要的一部分数据从DDR取到Sram以及将deblock运算后的宏块数据存入DDR。
图4 Inter_config模块数据传送
Inter_config模块与IME有关的工作包括:
1)取原始YUV数据,Luma部分直接拉给IME_Reg_o,Chroma部分存入Sram0。
2)为IME准备计算所需的9个宏块的Luma数据,并存入Sram0和Sram1。
3)将这9个宏块的Chroma数据准备到Sram1中,用于Chroma资料拼接之用。
4)接收到IME_ChromaStart_i信号有效后,开始FME运算所需Chroma数据的相关准备工作。包括:①从Sram0中取Chroma的原始YUV送给IME;②从Sram0中取Chroma3x3Mb数据并进行拼接(将每个block对应的2x2像素,向右向下扩展,变成3x3像素)后送给IME。论文写作,整像素预测。
5)把最后一行的5个mv(当前Mb最后一行的block的4个mv及右侧相邻的1个mv)存入Sram0,作为下一宏块行进行Mvp预测所需数据。
2. PS模块功能描述
PS模块,即预测选择模块,本模块主要用于选择当前编码宏块的最佳预测方式,帧内预测还是帧间预测;若是帧间预测还需给出宏块的最佳分割以及分割的最佳MV,除此之外,还需求残差值,用于后面的重建。其主要功能如下:
1)接收IME模块的整像素亮度值,以进行整像素搜索,找出最佳的整像素MV;
2)将两套流水线所得出的cost进行比较,选出最佳partition;
3)接收inter_ctrl模块中IME模块的亚像素亮度值,以进行亚像素搜索,找出最佳的亚像素MV以及cost,并与最佳的整像素MV的cost相比较,选择最佳的MV;
4)将选出的最佳的cost与intra_ctrl中的最佳的cost,比较得出最佳的预测方式,帧间还是帧内;
5)若选出的是帧内,则结束当前宏块的帧间操作,准备下一个宏块的帧间操作;若选出的是帧间,则接收IME或FME的亮度和色度值,进行求残差操作,送给DCT以备后面重建。
5、总结及展望
本文对帧间编码中IME运算所需数据进行探讨和分析,并提出一套架构设计方案,时序和资源使用都比较优化。设计方案在空间上具有较高的并行度,处理能力高,非常适合实现高清视频编码。目前市场上对于H.264的研究开发一般都是基于PC或者DSP解决,很少有基于硬件实现的开发,功能上还不足以实现高清实时信号的编码和解码。本设计能够实现帧间预测的关键部分,在后续的研究中如果能使用H.264标准在帧间预测所带来的高压缩率,如果能将其带来的复杂度的增加限制在可容忍的范围内,支持帧间预测的高清实时视频编解码的芯片实现是非常有意义的,应用前景很广阔。
参考文献
[1]新一代视频压缩编码标准——H.264/AVC 毕厚杰 人民邮电出版社
[2]Iain E.G.Richardson.H.264 and MPEG-4 Video Compression: VideoCoding for Next Generation Multimedia. U.S: Wiley Press, 2003.
[3]Tung-Chien Chen, Chung-JrLian, and Liang-Gee Chen. Hardware Architecture Design of an H.264/AVC VideoCodec. Asia and South Pacific Conference on. Design Automation, 2006.
[4]Renxiang Li, Bing Zeng, and Ming L. Liou. A new three-stepsearch algorithm for block motion estimation. IEEE Trans.Circuits Syst.Video Technol., vol. 4, No. 4,Aug 1994
壹、前言
由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。
贰、WAVELET的历史起源
WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、WAVELET影像压缩简介及基础理论介绍
一、WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。
WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。
二、影像压缩过程
原始图形资料色彩模式转换DCT转换量化器编码器编码结束
三、编码的基本要素有三点
(一)一种压缩/还原的转换可表现在影像上的。
(二)其转换的系数是可以量化的。
(三)其量化的系数是可以用函数编码的。
四、现有WAVELET影像压缩工具主要的部份
(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。
(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种为内插。
(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffat''''slineartimecodinghistogram的基础上。
(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、WAVELET影像压缩未来的发展趋势
一、在其结构上加强完备性。
二、修改程式,使其可以处理不同模式比率的影像。
三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、加强运算的能力,使其可支援更多的影像格式。
五、使用WAVELET转换藉由消除高频率资料增加速率。
六、增加多种的WAVELET。如:离散、零元树等。
七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、增加8X8格的DCT模式,使其能做JPEG的压缩。
九、增加8X8格的DCT模式,使其能重叠。
十、增加trelliscoding。
十一、增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、影像压缩研究的方向
1.输入装置如何捕捉真实的影像而将其数位化。
2.如何将数位化的影像资料转换成利於编码的资料型态。
3.如何控制解码影像的品质。
4.如何选择适当的编码法。
5.人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。
图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献:
1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。
5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。
6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。
7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。
附录:
嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送
目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。
阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(LowpassSubband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。
基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet,简称LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。
LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。“有”版权所
LEZW技术也可以应用於渐进式传送,对於一个渐进式影像传送系统而言,控制其解析度将可以改善重建影像的视觉品质。而常用的渐进式传送方法有使用向量量化器或零元树资料结构编码演算法则。但是向量量化器需要较大的记忆体及对与传送中的错误敏威,而利用EZW技术所设计的渐进式影像传送系统,可以改善这些缺点,所以享有较好的效能。但是它也有缺点就是,应用於渐进式传送时是根据全解析度来做编码及传送,因此在低码率的限制之下时,若用全解析度来显示影像将使得影像模糊不清。所以在低码率传送时的影像以较低的解析度来显示时,则可以使影像的清晰度有所改善。
[关键词] 网络电视 AVS MPEG-4 H.264
Mainstream network television video codec standard comparative study
Abstract: With the development of society, people are gradually rallying point on a network television. Internet TV is an interactive television network, referred to as IPIV. It focuses on the Internet and communications, and multimedia technology, a broadband cable networks, a variety of new network is a kind of interactive technology, is a combination of technology and television networks, not only meet people's demands for cultural and entertainment , but also to meet the broadband cable networks as a medium into the home. Codec standard is the core of the network television standards, codes directly affect the decoding, decoding will have an impact on the STB. The success of industry standards need to determine the support. Although the mainstream network TV video codec standard are many, but the main criteria used in AVS, MPEG-4, H.264 three. Based on the AVS, MPEG-4, H.264 three standard technology, namely to understand the concept, characteristics, and then the AVS and MPEG-4, H.264 comparison between the last of the three comparison and analysis.
Keywords: Network TV; AVS; MPEG-4; H.264
网络电视利用的是高效的视频压缩技术,在网络电视视频所传输的宽带达到786kbit/s,它的收视率就会与DVD的水平相近。视频编解码技术的形成加快了网络电视的发展,它能够支持独自对内容的编码与解码。利用多种编码的工具,进一步对编码图像处理,在同样的比特率中取得高质量的图像。并可以支持较高分辨率的活动图像。可以运用到交互式的准点播与点播视频中或者是数字广播电视中,还可以配置宽带通信网。
一、AVS、MPEG-4、H.264的概念
1、AVS
AVS是我国创新技术与部分公开技术的自主标准,也是第二代的信源编码标准。视频初始的数据与信源编码的压缩问题是信源编码技术最迫切需要解决的问题,所以也被称之为数字音视频编解码技术。它是数字信息在传输与存储,以及播放等过程中的前提,是视频产业的标准。其中AVS标准有五个主要的技术标准,系统和视频,以及音频和数字版权的管理,还有一个支撑的标准是一致性测标准。
AVS视频编码技术的重要技术有:量化和熵编码技术、帧内预测和特殊性的帧间预测、环路滤波器和和8×8的整数变换等。
2、H.264
H.264主要是由1TU-T与ISO/IEC的视频和活动图像编码的专家组加上视频组一起开发的视频编码标准。H.264视频编码标准有基本和主体,以及扩展三个子集。专门为视频会议所设计的是基本的子集,它能够提供差错隐消技术,即使是在容易出错的网络上,也可以得到很好的视频效果。它还可以支持低延时的编解码,而主体与扩展子集适合在电视的应用中。H.264与传统的标准相同,是一种DPCMJ/II变换编码中的混合编码,满足不同速率和解析度、传输的需求。
3、MPEG-4
MPEG-4是交互式多媒体通信的标准,而是一种面向对象的压缩。它主要是利用对象编码,融合了数字电视与互联网,以及交互图形学等技术。它将视频与音频结合考虑,不同的编码在不同的主体中使用,然后在解码处并成新的组合。因为MPEG-4对传输速率的要求很低,所以只能使用较窄的宽带,用来显示在少量数据中取得最好的图像。在相同的情况下,编码的易难度与图像质量是MPEG-2的1.5到3倍。对不同对象进行编码后,再对其解码,并组成所需的视频与音频。MPEG-4使用了第一代的视频编码技术,其中有运动补偿和变换编码、熵编码和运动估计,以及量化。并且提出了新的重要技术包括视频编码分等级性和视频对象提取的技术,以及VOP视频编码技术等。
二、AVS与H.264、MPEG-4间的比较
1、AVS与H.264间的比较
通过实验对其AVS与H.264间性能进行比较。实验中,采用RM5.0a与JM6.1e作为两者的编码器,其序列有:720p与1080i。AVS视频编解码标准与H.264成增益的趋势,其性能基本上是一样的,因为AVS视频标准只支持自适应的编码,所以在性能的差距上平均有0.5dB。如下图所示:
2、AVS与MPEG-4间的比较
MPEG-4时所制定的第四代标准,与之前的标准相比,差别在于对对象编码的思想不同。MPEG-4进行编码的时候,是将图像分一部分在时间与空间中进行编码,通过传输后进行解码,然后组成所需的图像。对不同的图像对象采取不同的编码,促进不同数据间的结合。提出了新的重要技术包括视频编码分等级性和视频对象提取的技术,以及VOP视频编码技术等。它根据自身的优点:低码高质量,被广泛应用。MPEG-4标准拥有AVS标准,与以往的MPEG-2相比,MPEG-4与AVS编码率是MPEG-2的1.4与2到3倍。
三、AVS、MPEG-4、H.264特点间的差异
1、AVS的特点
AVS标准的主要特点是它拥有高的编解码效率和较低的专利收费、较快的速度和较低的宽带占有率,以及容易实现的难度程度。
2、MPEG-4的特点
MPEG-4在使用了第一代的视频编码技术运动补偿和变换编码、熵编码和运动估计,以及量化外。还开发了新的重要技术:视频编码分等级性和视频对象提取的技术,以及VOP视频编码技术等。MPEG-4标准主要的特点有三种,第一种是它具有高效的传输及存储的功能。第二种是它在内容上提供了多媒体的数据访问工具,并且还支持在视觉内容中的交互。第三种是它的压缩率很高,主要用的是ObjectBased进行的解压缩,使压缩比的性能指标增加,其压缩的被数达到450,分辨率由320×240的输入可达到1280×1024的输入。
3、H.264的特点
H.264标准的最大特点是它的数据压缩的比率非常高,在相同的图像质量下,H.264标准的压缩比可以达到MPEG-4标准的1.5到2倍之多。H.264标准中的压缩技术使用户数据下载的时间与流量间的收费得到了节省。同时在高压缩比的时候,它还具有很高质量的流畅图像。它与MPEG-4相比较,其最大的特点有四种,第一种是它将视频中的帧分离开来,组成像素块,使视频帧间的编码处理能够达到块的级别。第二种是它使用的方式是空间冗余,其主要是对原有的视频帧块进行预测和转换,以及优化与变长编码。第三种是视频连续帧间的不同块,将实施临时存放的方式,存放后只需要对其改变的部分编码,此算法的完成是通过运动的预测和补偿满足的。在一些特殊的块中,块的运动向量则由对已经编码的帧进行搜索,预测其主块。第四种是利用多出的空间冗余技术将视频帧所遗留的块编码。
四、比较与分析
AVS、MPEG-4、H.264间拥有各自不同的优缺点。AVS编码率是MPEG-2的2到3倍,H.264编码的效率与AVS效率一样,所以在取得高效率编码的时候,AVS标准算法的难易程度要比H.264标准的低,其解码的难易程度只相当与H.264的70%,所以导致硬件与软件所实现的成本都要低于H.264。因为MPEG-4标准算法的难易程度要低,所以其编码的效率也要低。H.264标准的压缩比可以达到MPEG-4标准的1.5到2倍之多,因此在相同的图像中,H.264的传输码流要比MPEG-4平均节省39%。
总而言之,网络电视视频编解码主流标准之间具有各自不同的优缺点,在应用的时候,对视频编解码主流标准的选择还要结合实际的因素,根据各自不同的需要进行选择。在网络电视的产业情况中,H.264标准占据了市场的主要位置,它的技术与适应性得到了运营商和提供商们的支持。而AVS标准的技术也是较为先进的,它低廉特点也对运营商们产生吸引力。因此,日后网络电视的发展逐渐推动了网络电视视频编解码主流标准技术的发展。
参 考 文 献
[1]王利娟;孙亚军;王璞;胡青松;;基于MPEG4压缩的数字视频监控系统的设计及应用[A];第十三届全国煤矿自动化学术年会、中国煤炭学会自动化专业委员会学术会议论文集[C];2003年
关键词:智能大厦,监控系统,建设
智能大厦监控系统不同于一般的室外环境的监控。首先,大厦内部的监控布线要结构话,其次,要考虑系统的:技术先进性;方便灵活性;实用;高效;运行成本低性;经济性等特点。论文大全。所有视频监控点在方案设计初期要全部考虑在内,尽量避免以后增加监控点的现象。本文主要对该系统中的门禁系统、防盗报警系统、闭路电视监视系统和停车场管理系统等的设置进行研究。
1.门禁系统
1.1门禁机(读卡器)的设置
根据需要在门外设置(含房间、楼梯间、通道等)距地1.2~1.3m选型一般为感应卡式,根据重要性可选指纹型或瞌孔型门禁机,可双面门禁,也可单面门禁(室内设出门按钮)。
1.2从控制器
门禁机和门禁主机的连接设备,根据需要从控制器可连一、二、四、八个门禁机。从控制器电源设备选定:AC220V50Hz/DC12V,l-5A。
1.3主控制器
主控制器由计算机硬件和软件组成,安装于中央控制室。其中包含各种控制扩展板,遥控程序设置器,机上显示板,数据存储转移模块等。
1.4巡更系统读卡器
读卡器(读头)就是门禁机(巡更开关)。此部分可纳入门禁系统一并设置。
1.5电梯门禁系统
在部分电梯设置读卡器,持有效卡可前往相关楼层。
1.6特别说明
(1)智能大厦可实行-卡通门禁管理,还可进入-卡通消费系统。
(2)门禁系统应能在火灾时自动开启相应的门。可利用火灾联控装置来完成此功能。
2.防盗报警系统
防盗报警系统就是用探测器对建筑物内外重点区域、重要地点布防,在探测到非法入侵者时,信号传输到报警控制器:声光报警,显示地址,有关值班人员接到报警后,根据情况采取措施,以控制事态的发展。防盗报警系统除上述报警功能外,尚有联动功能。诸如:开启报警现场灯光(含红外灯)、联动音视频矩阵控制器、开启报警现场摄像机进行严视,电视矩阵控制器一系列联控:使监视器显示图像、录像机录像、多媒体控制器自动或人工操作等等这一切都可对报警现场进行声音、图像等进行复核,从而确定报警的性质(非法入侵、火灾、故障等),以采取有效措施。
2.1各种探测器的设置
根据需要把防盗双鉴探测器、被动红外束射探测器、玻璃破碎探测器、各种开关等布置于大厦出入口、楼梯间、电梯厅、需要防护的门窗、重要办公室、重要机房等场所。按照不同的布设环境选择不同报警器和安装方式(如壁挂、吸顶)。
2.2声音复核装置的设置
在需要声音复核的场所设置微型监听器(电子监听器),一般采取壁挂方式距地2m左右,监听器与音频矩阵箱间线路多为二芯屏蔽对绞线,如RVVP2×0.5mm2。在控制中心设有音频矩阵箱,该箱与视频切换/控制主机间采用RS485接口,采用对绞线RVVP2×0.5mm2连接。
2.3报警控制中心设置
在小容量系统(路数≤64):通常按分区设置八路报警接口箱,八台箱使回路可达64个。报警头与报警接口箱间,通常为3芯屏蔽线,RVVP3×0.5mm2。报警接口箱与视频切换/控制主机间采用RS-485串行接口,对绞线RVVP2×0.5mm2。
当系统≥64回路时,有两种解决方案:
其一:选择大容量系统,该系统配置128路报警输入卡,系统容纳8~16台报警输入卡,则容量可达2048路报警。如还不够,可多系统组合。
其二:采用门禁/报警管理系统。系统参数:持卡人数65000;门禁机16320;报警防区(路数)130560;报警输出130560;本地打印机225台;报警状态屏1020个;且支持计算机间加密传输技术……。各设备间连接方式为RS-232/RS一485接口,对绞屏蔽线RVVP2×0.5mm2。
3.闭路电视监视系统的设置
在保安系统中越来越多的应用电视监控系统。它使管理人员在控制室便能看到大厦内外重要地点情况,给保安系统提供视觉效果,为消防、楼内各机电设备的运行及人员活动提供了监视手段。
3.1摄像机的设置
根据不同环境选定不同摄像机以及不同的安装方式,如摄像机是黑白的还是彩色的,镜头配置的选择,焦距多大范围,自动调焦、光圈、聚焦是手动调节,固定焦距,摄像和镜头尺寸的配合,是否设置云台,安装方式的确定,是否选择球型、半球型摄像机(尺寸的确定),在大厅和电梯轿厢内选择广角镜头,摄像机防护罩的选取、照明灯具的选取等都随功能的不同而异。
摄像机(含镜头)的控制:由控制器解码器完成。解码器因功能不同而种类很多,但都是在接收矩阵主机传来的信号后去遥控云台,镜头和辅助设备的动作。解码器与矩阵/控制主机间的连接有二种方式:“C',型(同轴控制)和“D型"(对绞线控制)。前面已述及,同轴控制“C?quot;因设备造价高昂而应用较少。对绞线控制“D型",即RS485方式可控距离达3km。且这种方式可用于光纤、微波以及其它传送方式。
特别提示:保安监控系统的线路因现场设备安装位置一般是在走廊、大厅和房间的上部,有的紧贴吊顶,而且同轴电缆和对绞线也较便宜L运行管理独立,所以一般不宜与大厦综合布线电缆合用。当然其它数据、图像的传输就另当别论了。
3.2中央控制室的设置
为了保安工作的方便,一般中央控制室随保卫部门设于大厦首层。其设备主要包括:视频矩阵切换/控制主机,报警接口箱,音频矩阵箱,字符发生器,录像机,主控键盘,副控键盘,音视频监视设备,多媒体终端以及电源设备等。
视频矩阵切换/控制主机,目前有各种输入/输出规格,如8×2,8×4,16×6,96×8,还有视频96人/8出,音频96入/8出一64路报警8控制键盘等。论文大全。特大型系统有视频4096入/4096出一报警2048路,32台键盘的切换/控制主机。在设计和安装实施中,根据需要留有余量,设置规模,选定设备。论文大全。
视频主控制器根据报警系统输入信号,完成云台控制,摄像机移动控制,灯光控制,镜头的控制,以及联动音视频监视器、录像机等等。门禁系统通过网关接人主机形成防盗报警、电视监控、出入口控制三合一的集成系统。借助于多媒体技术一声、图并茂的信息传播能力与计算机的交互性相结合的技术,使智能大厦的保安系统智能化,从而确保大厦的安全。
4.停车场管理系统
一般的智能大厦地下室均设有停车场,对停车场进行自动化管理是必要的,停车场管理系统的功能大致有:出、人口控制、泊车位导向、摄录车辆外形、特征、牌号、记时收费。其中车牌影像识别系统具有保安功能,它可防止偷车事件发生。当用户人场取票或使用月票、储值票时,电脑会通过人口处的摄像机,将车型、车牌号码的彩像记录,同时也记录下该入场票或月票、储值票的编号。当用户离场付费或验票时,电脑会自动将该车编号票证持有者拥有的车辆的车牌、车型等与在入场时留下的录像的车牌、车型等同时显示在显示屏和闭路电视监视器上,工作人员确认后,自动开启闸门放行,同时这些图像存入计算机硬盘备查。
以上设备有机结合,一般将音视频监视器设于“电视墙"”,其余集中设于控制台上。控制室的面积由系统规模确定,电源可靠,能温湿度控制,地面设防静电活动地板。
随着网络技术的不断深入,视频监控技术只有沿着网络化、智能化的方向发展,才能满足智能建筑等对视频监控高稳定性,高可靠性和便于安装维护的要求。
参考文献:
[1]贺建权.数字化视频监控系统集成工程设计[D].湖南大学, 2007.
[2]林亮.厦门软件园二期智能化系统建设探讨[J].安防科技,2008, (12):56-58.
关键词:识别和跟踪,Netfilter防火墙框架,深度包检测技术,协议分析
1.引言
非法语音业务的出现,不仅挤占了正常带宽,导致语音业务收入大幅度降低,同时通信质量也得不到有效保证,影响了用户的利益。基于上述原因,语音系统的信息过滤与分析就具有十分重要的意义,迫切需要一种能有效识别应用和跟踪的方案。本系统是根据网络正常行为而进行设计的,可有效监测到语音信号的通信,在保障网络安全上起到了重要的作用。论文参考网。
2. 系统开发平台
此系统是在Linux操作系统下进行开发,主要用到Linux2.6内核版本[1]操作系统本身所带的Netfilter防火墙框架[2]。由于Linux操作系统具有稳定、灵活的特点以及其提供的优秀防火墙框架,用户可以根据自己的实际需要,将防火墙设计的一般理论和方法与自己系统的具体情况相结合,设计出新的可实用的安全防护系统。
3. 采用方法
在众多的网络安全技术中,防火墙使用最为广泛,其中最为关键的技术包括数据包的捕获、数据包的过滤、历史记录的存储。随着技术的发展和要求的提高,防火墙在被大众接受的同时也显露出不足。近几年来,深度包检测技术和协议分析技术的出现使得网络分析更加准确、有效。
3.1深度包检测技术
深度包检测技术[3]是包过滤技术的深入,所谓深度是和普通的报文解析技术比较而言的,普通报文检测仅能分析出数据包中简单的信息,而它除了对前面的层次进行分析外,还增加了应用层分析,能够识别各种应用及其内容,具有漏检率低、防御能力强的特点。
3.2协议分析技术
协议分析技术[4]需要对每一种协议(主要是应用层协议)编写一段协议检测的代码,例如HTTP协议分析模块主要对HTTP进行解码分析,并检测对WEB服务器的攻击。虽然不同的协议有不同的分析代码,但它们都遵照相同的检测思路——将报文分解成域,然后对每一个域进行检查,与预期的值进行比较,若有异常则发出警报。
下面通过一个具体的例子阐述基于协议分析的系统是如何进行入侵检测的,假设系统要检测一个HTTP协议包中是否包含/hidden/admin/,如果存在则认为是一次入侵攻击,检测过程如下:
(1)解码IP包头文件,确定IP包有效负载所包含的协议;
(2)如果是TCP包,则解码TCP头文件,寻找TCP的目的端口;
(3)如果端口为80,即这是一个HTTP协议包,则根据HTTP协议规则分析HTTP包中所有的成分,从中提取出URL路径;
(4)对URL路径进行处理,避免路径欺骗;
(5)查找是否存在与 “/hidden/admin/”一致的路径,如果存在则向系统发出警报。
从上面可以看出,运用字符串特征识别,就能很准确地判断出数据包是否满足我们所设定的条件,如果是,则按照预先设定的规则进行处理。
4. 系统研究及设计
识别和跟踪系统的设计主要分成三部分,首先是对语音类应用的协议进行分析,归纳出协议中的特征字,编写出能识别该协议的正则表达式[5],使用Netfilter中的L7-filter模块,运用正则表达式对协议进行识别,并通过数据包过滤情况进行验证;使用iptables的ULOG日志记录、MySql数据库,通过监测数据流的状态,对应用行为的过程进行跟踪;通过分析数据库中的日志记录,可以对应用行为进行统计和控制。论文参考网。
4.1语音聊天识别模块设计
语音聊天时会在数据包中表现出一些特定的规则,这些规则可以由正则表达式进行描述。安装L7-filter并编译内核[6],使用iptables工具进行添加、删除、编辑过滤规则,利用规则操作数据包并将过滤包的详细信息记录到系统日志文件中,日志记录在/var/log/messenges中。由于该框架运行在服务器网关,服务器需要对流经系统的所有数据包进行检测,这样将规则定义在PREROUTING链上最为合适,识别模块的流程如图1所示:
图1 语音聊天识别模块设计流程
我们以语音聊天工具qq为例,具体的实现命令如下:
iptables–F //清空所有链表
iptables –tmangle –I PREROUTING –m layer7 –l7proto qqtalk -j LOG --log–prefix“qqtalk” //允许符合正则表达式qqtalk的数据包进入系统并在日志文件中以“qqtalk” 标识
iptables –tmangle –L –v //查看数据包匹配情况
日志文件messages中记录了iptables匹配数据包的结果,通过查看日志文件,可以清楚的看到所匹配数据包的记录情况。
4.2语音聊天跟踪模块设计
协议跟踪就是跟踪应用中关键事件动作的发生,通过数据库显示出来,Netfilter本身自带了五个链用于存储规则,但我们可以创建新的单独链对各种协议进行处理,这样做可以更具有针对性,而且也不复杂。我们以语音聊天工具qq为例,新建一条qqtalk规则链的命令为:
iptables –Nqqtalkchain
将匹配qqtalk正则表达式的数据包转发到新建的qqtalkchain规则链:
iptables –IFORWARD –m layer7 –l7proto qqtalk –j qqtalkchain
研究应用通信过程可以看到,在关键事件发生时,一般都伴随着某些特征字的出现,例如qq发起语音聊天时出现的“INVITE”,取消时出现的“CANCEL”等,这就需要用到iptables中的string模块,使用字符串匹配的命令为:
iptables –tmangle –m string -algo kmp --string “CANCEL” -j ULOG --ulog –prefix “cancel”
5. 实验环境搭建及测试
5.1实验环境搭建
本实验将语音类应用识别与跟踪系统部署在双网卡服务器上,该主机用eth0作为外部网络接口,与学校网络相连;用eth1作为本地局域网的网关地址。客户机运行语音聊天软件和抓包软件Wireshark。服务器和客户机的环境配置见表1:
表1 测试环境配置
关键词:视频转码;音视频资源共享系统;FFmpeg;Mencode
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)08-1928-03
1 概述
2 FFmpeg和Mencoder简介
FFmpeg是一个在Linux下开发出来的一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序,但它可以在包括Windows在内的大多数操作系统中编译。这个项目是由Fabrice Bellard发起的,现在由Michael Niedermayer主持。它包括了目前领先的音/视频编码库libavcodec,支持 MPEG、DivX、MPEG4、AC3、DV、FLV等40多种编码,AVI、MPEG、OGG、ASF等90多种解码,可以轻易地实现多种视频格式之间的相互转换。
Mencoder是Mplayer自带的编码工具(Mplayer是Linux下的播放器,开源,支持几乎所有视频格式的播放,现在有windows和Mac版本)。Mencoder支持几乎所有格式的视频转换,可以将任意格式转换到任意格式,转换格式可以说非常强大。
3 视频格式说明
在音视频资源共享系统中,当主程序检测到用户有新上传的视频后,等待进入到视频转码流程,由主程序调用FFmpeg.exe或者Mencoder.exe完成对视频的转码并将转码后的视频保存在相应的目录下,同时,截取视频文件的某一帧作为视频的缩略图保存到对应的图像文件,等待进程结束,根据转码原理,由于参数的设计,转码后的音视频会比原来的视频小,并且在一定的范围内,因此根据原音视频资源和转码后的音视频资源进行比较,来判断转码是否成功,如果转码后的音视频过小,表示转码未成功,标记并返还主程序;如果转码成功,将转码后的视频路径和图像路径保存到数据库,至此,完成对视频的转码流程。
4.2 具体控制流程
1)对用户上传的音视频,数据库存储的主要的视频信息包括:名称,转码前存储路径,转码后的存储路径,大小,音视频截图路径,音视频状态标志位(报告转码中,审核中,转码成功,转码未成功,审核通过,审核未通过)。当用户上传成功后,改变数据库的状态标志位为转码中,进入视频转码子系统。
2)对于音视频转码的处理,有两种处理方式,一种是多进程,一种是多线程。
5 结论
在音视频资源共享系统中,视频转码是该系统的重要组成部分,对于提高网络视频的传播效率,有很大的帮助。使用FFmpeg和Mencoder相结合的转码方案,不仅可以实现对各种编码格式的视频的转换,而且可以生产视频的截图和压缩,方便用户的浏览。系统完成后,转码效率高,系统运行稳定。
参考文献:
[1] 杨丽军.FFmpeg在媒体资产管理系统的应用[J].现代电子技术,2011(8):147-148.
论文摘要:儿童元语言意识和阅读的发展关系一直是心理学家所共同关注的一个重要问题。从元语言及元语言意识的概念含义入手,着重介绍并讨论了语音意识和句法意识对儿童阅读理解能力的影响,从而对研究儿童的元语言的重要性有进一步的认识和了解。
近几十年来,元语言意识在儿童词阅读发展中的重要作用是心理语言学研究中最重要的发现之一,对其研究具有重要的理论意义和实践意义。下文将以元语言和元语言意识的概念含义为基础,着重分析探讨元语言意识中的语音意识和句法意识对儿童阅读的影响,在现有研究的基础上得出一些有益于儿童早期英语教育的结论。
一、元语言及元语言意识
所谓的元语言(metalanguage)是指有关语言的语言,是人类语言的一个普遍现象。它既是语言学家必不可少的描写工具,以其专业性和技术性而被称为是语言学家的“行话”(jargon);同时,它又是普通人指称和谈论语言的一种必须手段,因而元语言有双重性。在儿童的语言教学中,需要培养的基本语言能力有以下两种:一是理解语言并使用语言表达思想,进行交流;二是描述并理解自己所学和所用的语言。第二种层次的能力就是我们所说的元语言能力。
近年来,认知科学领域的心理学家和语言学家都开始更多关注语言使用者的“元语言意识”(metalinguistic awareness)。元语言意识是指个体思考和反思语言的特征和运作的能力。具有元语言意识的人,能够有效地认识和思考语言的本质和功能。从事双语教育研究的学者发现对使用双语的儿童来说,具有较强的“元语言意识”已经成为他们一个独特的优势,因其具有“思考自己的语言、理解词汇的意义、甚至给这些词汇下定义”的能力。元语言意识包括四种一般的类型:语音意识、词素意识、句法意识和语用意识。在儿童读写能力发展的不同阶段具有不同影响,其中尤以语音意识和句法意识在儿童早期阅读中的影响最为突出。
二、语音意识的发展对儿童阅读的影响
语音意识是指操纵和控制语音表征的能力,包括音位意识、音节意识和音节内单元的意识,是对任意一种语音单元的意识。语音意识与个体早期的阅读有着非常密切的关系,大多数关于儿童语音意识发展的研究都是从语音意识对阅读能力的影响这一视角进行的。
阅读是一种高水平信息加工的过程。其中,词汇通达是基础性环节。在词汇通达中,语音解码起着非常重要的作用。所谓语音解码就是将书面的言语符号转换为语音表征系统的过程。在阅读过程中,语音解码过程存在两种机制,一种是词汇机制,它依赖对整个词或词素读音的直接通达自动寻址语音(addressed phonology);另一种是非词汇机制或称为正字法机制,读者在阅读过程可以应用从正字法到语音的联系将书面词语的拼写一一转换并合成相应的语音表征,这样得到的语音也被称为合成语音。在拼音文字系统的阅读中,一定的语音意识水平对于儿童发现形和音之间的对应规则,利用非词汇机制进行语音解码是十分必要的。语音意识可以使儿童进行有效的语音分解和合成,建立起书面语和口语的对应关系,确认不熟悉的单词以提高单词识别的速度和自动化的程度,从而提高阅读能力。
同时,shankweiler等学者通过对阅读不良儿童进行大量研究,提出了“语音限制假说”。该假说认为,阅读不良的儿童的主要问题是在语音加工方面存在缺陷,而且语音加工的缺陷会产生“瓶颈”效应,进一步影响其他语言加工过程的进行。因为语言加工的信息是从语音加工单方向上到达句法和语义加工系统,而工作记忆则充当了这个信息加工过程的中转站。当语音加工能力不足时,语音加工中的缺陷就制约了整个信息的正常加工,从而阻止了信息向更高级的加工水平进行传递。“语音加工缺陷理论”试图将阅读困难儿童的复杂原因归结为语音加工缺陷的结果。因此,根据该理论,语音意识对阅读应该具有基础性决定的作用。另外,gottardo等人对112名三年级儿童语音意识、句法意识、工作记忆以及单词再认、假词拼读和阅读理解能力进行了考察,结果表明在语音意识和工作记忆被控制的条件下,句法意识对单词再认、假词拼写、阅读理解都不具预测作用,该结论也进一步证实了“语音缺陷假说”。
由此我们不难得出:语音意识是阅读能力习得的先决条件,语音加工是阅读速度和阅读效率的重要预测指标。但语音意识对阅读理解的促进作用有两个先决条件:首先,儿童在学习阅读前已经具备一定的口语能力,大量的口语表征已经形成,而且词汇的语音表征和相应的语义联系已经建立。其次,儿童在阅读中能有意识地利用非词汇机制对不熟悉的单词进行语音解码,并能够根据解码的语音确认不熟悉单词的意义,从而提高阅读能力。
三、句法意识的发展对儿童阅读的影响
句法意识是指个体反思句子内在语法结构的能力,也称为语法敏感性。layton 等人将句法意识的发展分为四个水平:(1)获得默许的句法规则的知识水平;(2)获得自动的修补策略;(3)知道句法规则的存在并能够识别出来;(4)把句法知识反应在语言中或相关的任务上。前面两个水平都是句法上升到意识水平之前必经的准备阶段,第三个水平开始才进入了句法意识时期。这样一种划分可以使我们更清楚句法意识的范畴,同时也为测量句法意识提供了一个指标。
句法意识与阅读之间有着密切的关系。语言学家进行的研究发现以下两点:第一,阅读优秀儿童的测试成绩明显高于不良阅读者;第二,被试儿童在学习阅读前的句法意识测试成绩对以后的阅读成绩有预测作用。流利的阅读不仅需要理解单个词汇的意思,同时还需要在句子和篇章水平上将这些词汇进行整合,这就离不开句法分析。句法分析是辨别句子结构,理解句子意义的有效手段,而句法分析能力的高低在很大程度上取决于句法意识的发展水平。一定的句法意识发展水平不仅可以减少句法分析的步骤,提高心理表征的速度,还能澄清模糊的知识来提高阅读理解能力。
在此基础上,tunmer等学者的研究进一步证明,句法意识在控制了语音意识之后仍能解释词的解码能力中的变异。他们认为,句法意识对阅读成绩的影响可能通过下列两种方式进行:第一种是句法意识使得读者能更有效地监控他们正在进行的理解过程。儿童的句法意识越高,这种理解监控过程就越有效。第二种方式可能是,句法意识帮助儿童获得语音编码的技巧。首先,儿童要获得形素—音素的对应关系(grapheme-phoneme correspondence)的知识需要经历较长的时间,初级的读者不会记住他们遇到的所有不熟悉的词语。在获得所有形素—音素对应的知识前,句法意识较好的儿童,能够反映句子的结构特征,然后利用有关句子语境限制的知识,再结合不完整的正字法和语音信息来认识那些不熟悉的词汇,也就完成了他们在阅读中对单词的解码。其次,使用语境信息的能力可以帮助初学者发现一些拼写模式有多于一个以上的发音。例如,字母系列ough 在 cough,rough,dough 里面分别有不同的读音;当遇到这样一个包含同形异义拼写模式的不熟悉单词时,那些具有语法意识知识的被试能够产生不同的发音,直到有一个读音与听到过的单词的发音匹配。由此可以看出,句法意识与阅读的成绩可能存在着直接的因果联系。儿童的句法意识和语音意识可能处于相互促进且相互制约的平衡中,而提高儿童的句法意识能够在对语音意识起到促进作用的同时提高整体阅读能力。
综上所述,元语言意识的发展对提高儿童阅读能力有着积极的影响,它们之间的关系可归纳为以下几个方面:第一,元语言意识中的语音意识和句法意识以及其他认知因素一起作用影响阅读能力的发展。第二,语音意识和句法意识通过不同的途径影响儿童阅读能力的发展,即语音意识影响字词解码进而影响阅读理解,而句法意识更多地通过有意识的句法分析而直接影响上下文语境信息的加工。第三,儿童的元语言能力和阅读能力都有一个发展的过程,它们之间的关系也很有可能处于一种动态的发展中。因此,进行儿童元语言意识与阅读能力发展影响的研究,既可以丰富已有的研究理论框架,又可以考察已有的研究结果是否具有普遍性,同时为阅读教学、阅读障碍纠正等提供理论上的指导和帮助。
参考文献:
[1]bowey j a.phonological awareness and learning in novice readers and nonreaders[j].journal of experimental child psychology,1994.
[2]cummins j.bilingualism and the development of metalinguistic awareness[j].journal of cross-cultural psychology,1991.
[3]gombert j e.metalinguistic development[m].chicago: university of chicago press,1993.
[4]丁朝蓬,彭聃龄.汉语儿童英语语音意识与拼写[j].心理学报,1998,(3).
[5]董燕萍.心理语言学与外语教学[m].北京:外语教学与研究出版社,2005.
[6]封宗信.元语言与外语教学[j].外语与外语教学,2005,(6).
[7]姜涛,彭聃龄.汉语儿童的语音意识特点及阅读能力高低读者的差异[j].心理学报,1999,(1).
【论文关键词】计算机网络 电话通信电话终端设计思路
【论文摘要】电话通信作为主要的通信技术,目前得到人们的广泛应用,在社会发展过程中起到了举足轻重的作用。随着社会经济的不断发展,人们对电话通信技术的要求也逐渐提高,比如信号的稳定性,通话质量要求的提升,以及数据量的不断增加,都使得电话通信技术的发展面临重大挑战。计算机网络电话通信技术的发展,很大程度上改善了电话通信技术的效果,促进了电话通信技术的快速发展。本文就点算计网络电话通信系统的电话终端进行探究,指出了网络电话通信技术设计思路以及电话终端实现方法。
计算机网络电话通信技术,是传统电话通信技术的革新和延续,即利用先进的计算机网络技术,实现信号的传输和接收,较传统电话通信来说,计算机网络电话通信技术的信息传播速度更快,数据量传输量更大。网络资源利用率也大大提高,具有非常大的使用价值和推广空间,目前,计算机网络电话通信技术越来越受到人们的关注和欢迎。
1计算机网络电话通信系统的设计思路
计算机网络电话通信技术,是借助计算机网络技术实现的一种新型信号信号传播模式。通过USB接口,将电话电话终端与网络设备相连接,并在电话终端连接上用户电话,实现网络语音及数据的接收和传播,最终实现网络电话通信功能。一般来说,电话终端设备由脉冲脉冲编码调制(PCM)技术实现,所谓脉冲编码调制(PCM)技术,就是一种能够模拟通信信号的数字化变化方式,相较于其他信号通信技术而言,脉冲编码调制(PCM)技术的信道利用率更高、数据损失更小、通信效果也更好,是一种较为理想的调制技术。
为实现电话终端的PCM码流,往往需要借助USB数据接口,能够有效将计算机设备同电话终端进行连接,实现通话信号的告诉传输,从而快速传递到计算机节点当中。USB接口的有效利用,实现了计算机外设同计算机设备的有效连接,实现了将计算机外的数据信息有效的导入计算机网络当中,从而解决了传输问题,确保了计算机网络电话通信技术的有效实现,USB技术同PCM技术的有效结合,促进了计算机网络电话通信技术的有效实现。
1.1电话终端的硬件实现
计算机网络电话通信技术,需要电话终端硬件来实现最后的数据解码和通话活动,电话终端硬件是计算机网络电话通信系统的重要组成部分。
1.2单片机控制电路
单片机控制电路是计算机网络电话通信系统中电话终端硬件的一部分,是电话终端设备的电路核心,主要由存储电路、CPU、输入接口以及输出接口电路四部分组成,单片机控制电路实现了对电话信号控制音的发生,实现电话信号的输送,并能够对DTMF的双音多频进行有效的控制,从而完成对电路的接受,并能够有效控制USB接口,读取用户在电路中的通话状态,以及对系统参数的读取。
1.3用户电路
用户电路,是一种厚膜集成电路,由MITEL工作研制,能够为用户提供稳定的26mA恒流馈电,用以验证网络电话用户的电话使用状态、电话的拨号脉冲等等数据,从而确保网络电话的正常使用效果。用户电路是确保网络电话终端通过效果的重要组成单元,目前能够有效支持2-4线的交换,属于计算机网络电话系统的基础模拟接口。
1.4编解码电路
编解码电路也是计算机网络电话通信系统的重要组成部分,其中PCM编解码电路是该电路系统中的重要功能单元,该系统主要组成单元有数据接收滤波器、数据发送滤波器、基准电压源、输入电路、输出电路、逻辑控制单元以及PCM编解码电路等等,用以对数据信号的编解码,确保网络通信信号的有效性。
1.5电话终端的软件实现
电话终端数据通信的实现,不光需要硬件的支持,同样需要软件的支持,终端软件功能的实现,才能够使终端硬件发挥应有的作用,从而达到信息的传输、信号的编解码,最终实现计算机网络电话通信系统的正常运作。
2终端主程序
网络电话终端的出程序,主要工作目标是实现计算机电话通信系统的初始化,包括了单片机定时器、时钟。USB等设备的复位即初始化,对于网络电话终端的使用具有非常重要的意义。一般来说,网络电话主程序软件应用过程中,遵循“先进先出”的原则,即在程序中设置队列性任务表,按照先后顺序履行相关工作任务要求。电话终端主程序其实一种无限循环的数据查询系统,不断更新和制定查询任务表内容,并获知需要处理的相关任务,并以此进行相关任务的实现。在主程序运行过程中检测到了需要执行的相关任务,就会根据程序中已经安排好的子程序序列,进行任务工作的处理和解决,逐一进行任务标准的处理。主程序主要采用“先进先出”的工作原理,如果任务的子程序到最后的工作单元,并实行重复循环。
2.1中断服务程序
中断服务程序,就是实现信号传输的开启和关闭,一般采用的是计数的形式,其定时器由0开始,最大值为65535,并且以16.384Mhz的脉冲进行计数,持续时间约为4ms,如果电话终端设备采用AMBE芯片,则每个接收即发送数据包的周期更变为20ms;当终端服务程序的计数达到5120次之后,就能够实现20ms的数据终端,完成数据包的接收机发送工作。
2.2任务子程序
任务子程序,主要负责对电话终端设备的摘机及断机实现判断,根据用户的主叫和被叫等不同信号接收形式,完成相应的操作及工作的执行。当电话终端设备处于主叫摘机状态时,电话终端设备将会向AMBE程序发送拨号音控制数据;当电话终端设备处于摘机状态时,子程序将会向USB接口发送被叫的应答信号,从而判断电话终端的相关状态。
2.3电话终端设备的工作过程
当通话数据传输到电话终端设备时,用户做出摘机动作,然后USB接口就会向计算机网络传输摘机信号,同时,计算机电话通信网络就会向主叫发送拨号音,并做出信息传输反应,使用户电话重点设备接收数据信号并进行语音通话。当网络电话系统呼叫本电话终端的相关用户时,计算机网络技术就会直接做出内部处理,接通被叫用户;如果呼叫的是其他其他电话终端的用户,则计算机网络电话通信系统就会直接栓送被叫用户号码,并等待对方的应答。当USB接口发回信息表明用户电话终端被叫忙信号时,计算机网络电话系统机会发送语音提示信息告知用户被叫用户繁忙并发送忙音。
如果是外部用户对本网络电话终端用户进行呼叫时,USB接口接收到被叫信号后就会进行数据解码,并进行合理的分析,,如果用户繁忙,USB接口就会向计算机网络电话通信系统反馈相关信息,并向呼叫用户反馈机主繁忙的信息,并发出电话忙音。如果机主处于离开状态,即用户闲时,USB接口就会向向用户发出相关提示信息,以及用户振铃提示,以提示用户进行电话信息的接收。当被叫用户听到振铃并做出摘机反应后,USB接口就会向计算机网络电话通信系统反馈相关信息,并随机开展数据信息的传送,网络电话终端就会开启语音传送功能。
3总结
计算机网络电话通信技术应用,是传统电话通信技术的一种革新和延续,能够有效提高电话数据的传输效率和传输速度,使电话通讯信号更加清晰,是未来电话通信技术的发展发展方向。在计算机哦电话通信系统当中,电话终端无需购买其他电话网络设备,经过USB接口同计算机设备向连接,很有效避免了繁琐的电话线路,使电话通信技术设备的成本大大降低,优化了计算机网络的使用效率,对于社会发展以及社会效益的增长都具有非常积极的意义。因此,我们要重视对计算机网络电话通信技术的推广和应用,以先进的网络电话通信技术来逐渐替代传统电话通信技术,确保电话传输系统的稳定性,从而促进网络通信技术的快速发展。
参考文献
[1]董磊.论网络电话类证据.中国政法大学, 2011
[2]郭峰江.网络电话服务质量保证机制的研究.华中科技大学,2011
[3]李正贤.韩国网络电话进入中国的营销战略研究.对外经济贸易大学,2009
[4]邓勇全. PC-PC的IP电话(网络电话)设计.华中师范大学,2009