1、基于小波变换和分类矢量量化的图像压缩算法黄晴,张书玲西北大学 数学系,陕西 西安 710069摘要:提出一种用于图像压缩的分类矢量量化算法,该算法在对图像进行多级小波变换后,利用3个方向上各自小波系数之间的相关性,构造符合图像特征的跨频带矢量,依据矢量能量和零树矢量综合判定进行矢量分类,并采用了基于人眼视觉特性的加权均方误差准那么和基于成对最近邻算法(PNN)的LBG算法进行矢量量化,提高了图像的编码效率和重构质量。仿真结果说明,该算法实现简单,在较低的编码率下,可到达较好的压缩效果。关键词:小波变换,跨频带矢量构造,矢量分类,矢量量化中图分类号:TN911.73 文献标识码:A 文章编号:1
2、000-274X(2023)0041-06图像压缩在图像的传输和存储中起着至关重要的作用。小波变换1,2由于具有良好的时-频局部化性能,有效地克服了傅立叶变换在处理非平稳的复杂图像信号时所存在的局限性,因而在图像压缩领域受到了广泛的重视,已出现了许多较为成熟的算法,如EZW编码3,SPIHT编码4等。Shapiro利用零树处理图像小波系数,有效地利用了带间相关性和带内相关性,获得了较高的编码效率。由Shannon信息论理论知道,对于无记忆信源,矢量量化总是优于标量量化。给定码率时,维数任意大的矢量量化可以任意接近率失真下界。由于小波逆变换具有一定的平滑作用,小波变换域内作矢量量化不会出现明显的
3、方块效应,所以具有较好的图像压缩效果。近年来,也出现了一些将小波变换与矢量量化相结合的编码方案5-7,文献8研究说明,使用分类矢量量化可以获得高质量图像。基于以上零树编码和矢量量化的思想,本文提出一种新的图像压缩算法。此算法先对图像进行四级小波变换,得到3个方向上的四级高频子带,再根据3个方向不同频带系数之间的同构特征来构造跨频带矢量,通过对矢量能量和3个方向零树矢量的综合判定将矢量分类,然后再采用基于人眼视觉特性的WMSE准那么和基于成对最近邻算法(PNN)的LBG算法对重要类矢量进行加权矢量量化,以实现图像的数据压缩。1算法原理1.1图像小波分解的特点和跨频带矢量的构造小波变换是一种非平稳
4、信号的分析方法,其根本思想是用一族函数来表示或逼近一个函数,这族函数称为小波函数。实际小波变换中,为了方便,多采用二进小波变换。对空间中的任意函数,它的二进小波变换为(1)其中,而满足。将小波变换一维推广到二维就可用于图像处理。通过水平和垂直滤波,可别离二维小波变换将原始图像分解为水平垂直对角和低频4个子带,其中低频局部可继续进一步分解。图像经小波变换后所得到的系数有特殊性质。在不同尺度的高频子带图像之间存在同构特性,而且3个方向上不同尺度下的小波系数能量大小不同,各方向的侧重不同。在同一方向上,有更强的同构性和相似性,事实上,各方向不同尺度下对应频带的相关性是最强的。为提高矢量量化的编码效率
5、,在构造矢量时,必须充分利用这些相关性。此外,图像的能量主要集中在低频子带,高频子带所占能量较少,且不同分辨率不同高频子带中的分布非常相似,接近Gamma分布或Laplace分布。各高频子带系数大局局部布在零值附近,概率密度分布曲线的中心点和最大值为零。这样,对带内及带间相关性的充分利用和对零值附近小波系数的有效处理,就成为提高图像压缩效率的关键。高性能的矢量量化器必须依照图像小波系数的特性来构造矢量。使用不同子带的系数构成矢量来压缩小波系数,就可以利用不同尺度同方向小波系数的相关性。根据以上分析,本文采用三方向跨频带矢量构造方法9。小波变换将图像分解为4层共13个子带的塔形结构,各方向以树形
6、关系从各子图中取大小为的系数块,按图1所示的方法构成85维矢量。这样构造出来的跨频带矢量能够充分利用小波系数的带间和带内相关性,但同时也带来计算量过大的问题。又在图像的多分辨分解中,分辨率越低的频带,小波系数所包含的图像信息越多,对图像重构更为重要,而分辨率越高的频带所包含的图像信息越少。因此,为降低矢量量化编码的复杂度,对每个85矢量的后64维矢量取均值,使矢量维数大幅度减小为22维。这样就构造出了3个方向小波系数的跨频带矢量。图13个方向跨频带矢量的构造Fig.1 Band-cross vector construction of wavelet parameters1.2小波零树和3个方
7、向跨频带矢量的分类由小波图像的多分辨率解析特点,大量的小波系数分布在零值附近,并且具有明显的方向性,构造出的跨频带矢量也就具有不同的能量和方向特征,通过对矢量进行分类后,用各自独立的码书分别进行量化,可以更有效的利用各子带间的相关性。矢量的能量大小决定了其对于恢复图像质量的奉献程度,矢量能量越大,对恢复图像质量的奉献程度越高,所以能量可以作为矢量重要与否的一个判定准那么。其次,本文按四叉树规那么构造矢量,与零树编码的思想是一致的。零树3是基于小波系数相关性的一种假设:如果在低分辨率高频子带上的小波系数相对于阈值是无意义的或是不重要的,那么位于同方向同空间位置高分辨率子带上的小波系数相对于在统计
8、意义下也是无意义的,把满足这种假设的系数用树状结构表示出来就是零树。零树矢量对恢复图像质量的奉献很小。假设一个零树矢量同时能量满足小于给定的能量阈值,就可以看作非重要类,不再进行量化编码,把其中的每一个分量置为0,并且用一个比特作标记,记为0;而其他矢量均看作重要类,标记为1,进行较大码书尺寸的矢量量化,以减小量化误差。采用能量阈值和零树矢量的双重判断,既充分利用了子带相关性,又有效的保护了图像的重要信息。1.3重要类矢量量化的加权均方误差准那么在图像的塔式小波分解算法中,大尺度下数据在恢复图像时经过滤波的次数要多,因而量化误差对恢复图像的质量将产生较大影响,且影响的空间范围比拟小尺度下的数据
9、要大,因此适合于采用基于人眼视觉特性的WMSE准那么进行最正确矢量的匹配,以提高量化增益。2其中:为矢量维数;为加权系数。文献8利用人眼的视觉特性对灰度图像设计了一种加权量化方案,以减小量化噪声,本文采用文献8中给出的各级子带对应加权系数,如表1所示。表1各级子带加权系数Tab.1 Weight coefficients of subbands子带名HL4LH4HH4HL3LH3HH3HL2LH2HH2HL1LH1HH1加权系数0.7380.7380.5960.5840.5840.4110.3550.3550.2300.1890.1890.1191.4初始码书生成的PNN10算法在矢量量化中用
10、LBG算法11训练码书时,初始码书的设计一般采用分裂算法。在分裂法中,对中间码书的每个码字都要一分为二,然后利用LBG算法形成码字数目是原码书的二倍的新码书。这样设计出的码书其码字均匀或近似均匀地分布在样本空间,而实际信源是非均匀的,容易使得有些码字利用率很低。为此本文采用成对最近邻算法(PNN)10来生成初始码书。PNN算法的步骤为:1令码字数,将全部训练矢量作为码字,即,构成个胞腔,第个胞腔的质心为,所含矢量个数为。2) 计算各对码字与间的失真 3设,那么合并胞腔和,更新码字为,更新为,假设,那么从码书中去掉码字;否那么令,从码书中去掉码字。令。4假设,那么终止;否那么转2,继续合并两个最
11、近的胞腔。2算法实现小波变换编码中,滤波器的选择是个有待研究的问题。为便于在Matlab环境下的处理,本文采用最为简单的Haar小波来作为滤波器,实际上,滤波器的选择对编码效果并没有明显的影响。另外,图像的小波变换级数应根据所期望的压缩比来确定,一般用34级,例如,假设用4级小波分解,那么是原图像大小的,一般对它作有限的无损压缩,再加上其他信息,估计压缩比不会高于。文中对输入图像使用对称延拓方式作4级小波分解。最低分辨率级的低频子带对图像恢复质量影响很大,但数据量又小,所以不进行矢量量化,对其单独处理。利用子带系数之间的相关性,一般采用差分脉冲编码调制(DPCM)加算术编码对其进行压缩,大约能
12、压缩两倍左右。为了能够自适应地确定各阈值,首先对矢量能量和最低分辨率级各高频子带系数作统计分析,依据矢量平均能量确定能量阈值,依据最低分辨率级各方向高频子带系数的幅度均值,确定各方向零树矢量的判定阈值。这样每个方向的矢量均可分为重要类和不重要类两类,再对重要类进行大码书的加权矢量量化。3仿真结果及结论采用4幅的标准图像对系统性能进行模拟实验仿真。实验中所用码书大小为,训练序列大小为,码字22维。3个方向上的重要类矢量分别使用算法进行训练生成码书。表2列出了测试图像的小波系数矢量及最低分辨率子带系数的统计结果,表中矢量平均能量定义为,其中为矢量个数,为矢量维数。仿真结果说明见表3,本算法在未对量
13、化结果进行熵编码时,对测试图像的编码效率已到达0.101 8 bpp每个像素所使用的比特数每个像素所使用的比特数,且恢复图像视觉效果良好。假设再进行熵编码,可进一步提高压缩比。为进一步说明重构图像的主观质量,图3给出测试图像和相应的重建图像。本文基于零树编码和分类矢量量化的思想,通过构造3个方向的跨频带矢量,充分利用了各级子带系数的带间相关性和带内相关性,又通过能量阈值和零树矢量的综表2 测试图像的统计结果图 像矢量平均能量LH4幅值平均HL4幅值平均HH4幅值平均Lena0.339 40.002 9-0.063 3-0.010 2Oldhouse0.270 20.018 70.034 9-0
14、.014 7Goldhill0.211 70.049 4-0.023 5-0.009 4Camera0.405 40.039 4-0.026 2-0.009 4Tab.2 Statistics of test images表3算法性能统计Tab.3 Statistics of the algorithm performance原始图像量化结果 / bpp压缩比 / 倍峰值信噪比 / dBLena0.099 180.709 427.651 0Oldhouse0.084 095.290 430.265 6Goldhill0.101 878.592 127.916 8Camera0.091 587.
15、395 925.572 6 Lena原图 Lena恢复图像 Oldhouse原图 Oldhouse恢复图像 Goldhill原图 Goldhill恢复图像 Camera原图 Camera恢复图像图2仿真结果Fig.2 Simulation result合判定对各个方向上的矢量进行分类,再采用基于人眼视觉特性的WMSE准那么对重要类矢量进行加权矢量量化。仿真结果说明,该算法实现简单,在较低码率下,可到达较好的压缩效果。参考文献:1 MALLAT S G. Multifrequency channel decomposition of images and wavelet modelsJ. IEEE Trans on AS