基于MPEG-4视频图像压缩处理的研究与应用

来源:百度文库 编辑:神马文学网 时间:2024/04/29 06:56:20

基于MPEG-4视频图像压缩处理的研究与应用

作者:仲丛久、张芝贤、关宗安   单位:沈阳航空工业学院电子信息工程学院  转载:仪器仪表学报  发布时间:2009-01-05

1、引言

数字技术的发展带动了整个社会的不断进步,但数字化技术的发展同时也带来了“信息爆炸”。为了使信息更为方便的进行传输和存储,根据信息之间的相关性,去除信息冗余,对信息数据进行压缩,那是十分必要的。[1,2]

为此,人们采用由轮廓、纹理定义的“区域”来表征视觉数据,这些区域对应的是对象或对象的一部分。这种方法缩短了实际技术系统与人眼的视觉系统之间的距离,人眼视觉特性会强化某些视觉数据,而忽略某些对视觉效果无关紧要的信息。采样、量化后得到的原始数据必须力求变换成符合人眼视觉特性的表征方式,一旦得到了这些区域,接下来就是将属于同一视觉对象的各个区域连接起来。这种表征方式不仅可以实现对视频数据的高效压缩,也为实现基于对象、区域的一些新功能铺平了道路。这种视频编码的概念已被广泛接受,并且已经成为新的图像/视频编码标准——MPEG-4的基础。

2、编码结构

在基于对象的视频编码中,编码的基本单元是对象,基于对象的编码主要是针对纹理、形状、运动这三种信息的编码技术。图1所示的是可以对任意形状的视频对象进行编码的通用框架。从图1中可以看出,编码框架中主要包括三个关键模块,即形状、运动和纹理编码模块。[2]

 图1 基于对象的信息编码通用框架
总的说来,基于对象的视频编码过程可以分三步进行:

⑴ 从原始视频流中采用全自动、半自动、人工等方法分割出视频对象。

⑵ 对视频对象进行编码,对不同视频对象的运动信息、形状信息和纹理信息分配不同的码字。

⑶ 对各个视频对象的码流进行复合。

3、结构与语法

MPEG-4标准中定义的中心概念是AV对象(audio-visualobject),这一概念是基于对象表征方法的基础。MPEG-4的编码机制是基于1616像素宏块来设计的,不仅可以与现有的标准兼容,还便于对编码进行更好的扩展。

MPEG-4的视频码流提供了对视频场景的分层描述,如图2所示。

分层的每一级都可以通过码流中被称为初始码的特殊码值进行访问。用来描述场景的分层级为:

⒈ 视频对象序列(VS,video objectsequence):完整的MPEG-4场景,可以包括任何二维或三维自然和合成对象以及它们的增强层。

⒉ 视频对象(VO,video object ):一个视频对象对应着场景中的一个特定对象,可以是任意形状的对象,也可以是一个矩形帧。

⒊ 视频对象层(VOL,video object layer):根据应用的具体要求,每一个视频对象都可以用分级或不分级的方式进行编码,用视频对象层来表征。VOL提供了对可分级编码的支持。一个视频对象可以用空间或时间分级来编码,分辨率可以从粗糙到精细,译码端可以根据可用带宽、计算功率、用户需求等参数获得期望的分辨率。视频对象层包括:基本层和增强层。基本层可以有多个,每一层表示一种分辨率。

⒋ 视频对象平面组(GOV, group of video object planes):GOV可以提供对码流的随机访问点,GOV是任选的。

⒌ 视频对象平面(VOP,video object plane):一个VOP是对一个视频对象的时间采样,包括视频对象的运动参数、形状信息和纹理数据,对VOP编码就是针对某一时刻该帧画面VO的形状、运动、纹理等信息进行编码[3,4]。

图2 MPEG-4的视频码流逻辑结构图
4、压缩系统应用设计

本系统通过MAP-CA为核心的处理器设计一个视频频压缩系统的原理框图如图3所示。

MAP-CA宽带信号处理器(BSP)。主要包含一个超长指令字处理器内核(The VLIW core)、一个可编程位流协处理器(TheVLx)、视频滤波协处理器、显示刷新控制器和丰富的数字I/O接口等。MAP-CA支持各种用软件实现的视频、图像以及信号的压缩和解压缩,这种软件实现的算法相对硬件实现有很大的优越性,升级非常方便。

MAP-CA的硬件接口包括视频输入输出接口、音频输入输出接口、PCI总线接口、SDRAM接口、显示控制器接口、I2C接口、ROM控制器接口和标准的在线可编程JTAG接口等。

由于MAP-CA的强大功能,使其特别适合应用于多媒体信号处理的各种产品当中,如机顶盒、数字电视、视频会议系统、医用图像产品、数字视频编辑设备和办公自动化产品等。此外,由于多媒体信号处理的核心工作都是基于MAP-CA/BSP-15的软件平台,因此我们可以方便地通过增加、删除或者增强一些功能模块来对我们的最终系统进行改进,具有高度的针对性、灵活性,所以MAP-CA/BSP-15是多媒体信号处理应用的一个现成有效的解决方案。

系统的设计目标:以MAP-CA为核心处理器设计一个视频压缩处理系统,该系统可插在标准PCI槽上,作为视频压缩卡,配以相应的软件可实时处理视频信号:采集、压缩、存盘及读盘、解压、输出等。

实现的系统将输入的模拟视频信号经过视频编码器进行模数转换和数据格式处理后,得到标准的ITU-RBT.656格式的数字视频流送给MAP-CA处理,实现视频的MPEG-4压缩处理。还可将压缩后的数据解码,并转换为ITU-RBT.656格式输出的视频信号通过视频编码器进行数模转换和格式变换,变成符合国际标准的NTSC/PAL制式的S-VIDEO电视信号的输出。另外系统外接2MB的FLASH ROM存储器作为系统的启动电路和非易失存储器;还接有64MB的PC133SDRAM内存,作为系统程序运行和变量存储的空间;通过PCI桥与PC机的PCI插槽直接相连,传送到内存中,不占用CPU资源。[5,6]

图3 视频压缩系统的原理框图
5、软件开发介绍

MAP-CA可以完全用C语言编程,不需要任何低级语言。为此,Equator技术公司提供了一套名叫iMMediaTools的软件开发包,其中包括一个优化的并行C语言编译器、FIRtree媒体本质扩展C语言、汇编器、连接器、源代码调试器、两个虚拟机仿真器和分类的库函数。

MAP-CA开发系统包括带有FIRtree媒体本质扩展 C语言的iMedialC编译器。FIRtree是专门的单指令多数据流形式的高速媒体处理扩展语言。这个C编译器运用了大量的优化和全局配置技术,把涉及硬件的操作留给编译器完成转换,从而使编程人员不需要使用费时费力的汇编语言就可以完全发挥硬件的全部性能。

6、结论

本系统支持MPEG-4、I帧、IP帧等多种压缩格式,压缩质量可调。在+/-256H,+/-256V的广泛范围内,可以半帧的精度进行四倍运动估计。在极低码率下传输,画面质量仍能取得满意的效果。系统支持定码流压缩和动态码流压缩。前者在场景活动变化剧烈的情况下存储容量不变,图像质量下降。后者质量不变,而自动调节码流。支持可变位速率自适应记录方式,通过动态侦测场景变化,自适应调整码流。通过灵活的码率控制方式,可以自由设定定带宽和定码流的录像和传输方式。带宽和码流任意可调。系统的具体技术指标如表1所示

表1 可实现技术指标
参考文献

[1] 刘毓敏,数字视音频技术与应用 [M],北京:电子工业出版社,2003,18~22
[2] 田栋,低速率视频传输关键技术的研究 [D],北京:北京工业大学,2001,8~12
[3] Zhong Yu ,Automatic caption localization in compressed video [J],IEEE Transcation on pattern anlysis and machine in telligence , 2000 ,22(4):385~392
[4] 李 枫,宋 彦,戴礼荣,王任华,远程多媒体监控系统的软硬件开发 [J],电子技术应用,2000,26(12),84~86
[5] S.Karthikeyan , A.Tamminneedi and E.K.F.lee.Design of Low-VoltageFront-End Interface for Switched-Opamp Circuits [J] , IEEE 115~119
[6] Mathieu.B,Melchior.P,Oustaloup.A,Ceyral.Ch. FractionalDifferentiation for Edge Detection[J],SignalProcessing,2003,Vol.83:2421~2432