2022年医学专题—第07讲-规则脉冲激励线性预测编码(1).ppt

资源描述

1、物理层关键技术1,信源编码(bin m),第一页，共四十七页。,移动通信(tng xn)信源编码基本概念,信源编码是利用信源的统计特性，解除信源的相关性，去掉信源多余的冗余信息，达到压缩信源信息率，提高系统效率（有效性）的目的。移动通信的频谱资源十分稀少珍贵，为了提高频谱利用率，需积极开发低速率、高质量信源编码技术，即高效信源编码技术。第二代移动通信主要(zhyo)是语音业务，所以信源编码主要(zhyo)指语音压缩编码。第三代移动通信中的信源编码将不仅包含语音压缩编码，还包含各类图像压缩编码和多媒体数据压缩等方面内容。,第二页，共四十七页。,数据压缩(sh j y su),目的：在保证一定图像

2、（或声音）质量的条件下，以最小的数据率来表达和传送图像或声音信息。数据能够压缩的可能性在于(ziy)：原始数据中存在着大量的冗余信息（时间冗余、空间冗余、统计冗余）；人的视觉和听觉器官都具有某种不敏感性，舍去人的感官所不敏感的信息，对图像或声音质量的影响很小，在某些情况下甚至可以忽略不计。,第三页，共四十七页。,移动通信语音编码技术(jsh)概述,语音编码：移动通信(tng xn)数字化的基础，第1/2 代蜂窝系统的根本区别。语音编码的意义：提高通话质量（数字化+信道编码纠错）；提高频谱利用率（低码率编码）；提高系统容量（低码率，语音激活技术）。移动通信对语音编码的要求：编码速率低，语音质量好

3、；有较强的抗噪声干扰和抗误码的性能；编译码延时小，总延时在65ms 以内；编译码器复杂度低，便于大规模集成化；功耗小，便于应用于手持机。,第四页，共四十七页。,语音编码(bin m)的分类,波形编码将时间域信号直接变换为数字代码，目的是尽可能精确地再现原来的话音波形PCM、M参量编码(声源编码)将信源信号在正交变换域提取特征参量，并将其变换为数字代码线性预测编码LPC混合编码波形编码+参量编码数字语音信号中既有语音特征参量又有部分波形编码波形编码质量最高，其质量几乎与压缩处理之前相同，适用于公用骨干(固定)通信(tng xn)网。参量编码质量最差，仅适合于特殊通信(tng xn)系统，比如军事

4、与保密通信(tng xn)系统。混和编码质量介于两者之间，目前主要用于移动通信(tng xn)网。,第五页，共四十七页。,用于移动(ydng)通信的语音编码,第六页，共四十七页。,信息率-失真(sh zhn)理论 information rate-distortion theory,研究在限定失真下为了恢复(huf)信源符号所必需的信息率，简称率失真理论。率失真理论就是用以计算不同类型的信源在各种失真限度下所需的最小信息率。率失真函数-计算率失真函数是率失真理论的中心问题。率失真函数只指出限失真条件下所必需的最小信息率。从理论上讲，尚应能证明实际存在一种编码方法，用这样的信息率就能实现限失真的

5、要求。,第七页，共四十七页。,限失真信源编码(bin m)定理,限失真信源编码定理：只要信源符号序列长度N足够大，当每个符号的信息率大于R(D)，必存在(cnzi)一种编码方法，其平均失真可无限逼近D；反之，若信息率小于R(D)，则任何编码的平均失真必将大于D。利用信息论中连续(模拟)有记忆信源的信息率-失真R(D)函数理论可以分析波形编码的性能。,第八页，共四十七页。,波形编码(bin m)的性能估计,信息率-失真R(D)为：D：最大允许失真，2：方差，相关系数广义平稳(pngwn)遍历马氏链信源且有上式的计算结果如下表所示,第九页，共四十七页。,波形编码(bin m)的性能估计,由上述分析

6、结果可以得到如下结论：当语音质量达到进入公网要求(yoqi)标准时，即2/D26dB,其K=3.4 倍。若进一步考虑实际语音分布与主观因素的影响(因为正态分布R(D)其压缩倍数可以进一步增大，取K=4(保守值)这时语音速率可以从未压缩的PCM 64Kbps降至1/4速率的16Kbps。目前已实用化的DPCM为32Kbps。,第十页，共四十七页。,参量(cnling)编码的性能估计,语音可以采用各种不同形式的参量来表达。为了分析方便，采用最基本的参量“音素”。以英语音素为例进行分析。英语中共有音素27=128 28=256。按照通常讲话速率，每秒大约平均发送10个音素。由信息量计算公式，对于等概

7、率(gil)事件有：I=log2N，N为总组合数，则：最后可计算出压缩比K为：,第十一页，共四十七页。,混合(hnh)编码的性能估计,显然混合编码的理论压缩比是介于上述两类编码之间，且与语音质量需求有关。若要求混合编码偏重于个性特征，则其压缩比靠近(kojn)波形编码的压缩比值，若要求混和编码偏重于共性，则其压缩比靠近(kojn)于参量编码。,第十二页，共四十七页。,移动(ydng)通信中的语音编码,高质量的混合编码是移动通信中的优选方案(fng n)。移动通信频谱资源有限，低码率、高压缩比至关重要；加入公用网信噪比又不能太低。决定混合编码的4 个主要参量：比特率、质量、复杂度和处理时延。比特

8、率：度量信源压缩率和通信系统性的主要指标；话音质量：国际流行的MOS 法，5 级评分制；复杂度：指完成语音编码所需的加法、乘法的运算次数，一般可用MIPS 表示；处理时延：复杂度高处理时延大。,第十三页，共四十七页。,数据(shj)比特率(bps),数据比特率越低压缩倍数就越大，可通信的话路数也就越多，移动通信系统也就越有效。数据比特率降低，语音质量也随之相应降低，为了补偿质量的下降，可采用提高设备硬件复杂度和算法软件复杂度的办法。降低比特速率另一种有效方法是采用可变速率的自适应传输(chun sh)，它可以大大降低语音的平均传送率。还可以进一步采用语音激活技术，充分利用至少3/8的有效空隙，

9、可获得大致约2.67dB的有效增益。,14,第十四页，共四十七页。,语音(yyn)质量,度量方法不外乎客观与主观两个角度：客观度量可以采用信噪比、误码率、误帧率，相对而言简单、可行。主观度量是由人耳主观特性来判断，比客观度量复杂。目前国际上常采用的主观评判(pngpn)方法称为MOS方法。,15,第十五页，共四十七页。,复杂度与处理(chl)时延,语音编码硬件复杂度取决于DSP处理能力，而软件复杂度则主要体现在算法复杂度上。算法复杂度增大，也会带来更长的运算时间和更大的处理时延。如下所示，我们给出几种已知低数据比特率语音编码的上述四个参数与性能比较(bjio)表格。,16,第十六页，共四十七页

10、。,语音压缩(y su)编码原理,波形编码的基本原理自适应差分脉冲编码调制(ADPCM)是建立在差分脉冲编码调制(DPCM)的基础上，而DPCM又是建立在脉冲编码调制(PCM)的基础上。PCM可分为三个基本步骤：取样、量化与编码。DPCM不直接传送PCM数字化信号，而改为传送其取样值与预测值(通过前面样点值经线性预测求得的)的差值，并将其量化、编码后传送。ADPCM与DPCM原理一样，主要差别在于ADPCM中的量化器和预测器引入了自适应控制机制。同时在译码器中多加上一个同步编码调整器，其作用是为了在同步级联时不产生(chnshng)误差积累。,17,第十七页，共四十七页。,ADPCM波形(b

11、 xn)编码,ADPCM是利用样本与样本之间的高度相关性和量化阶自适应来压缩数据的一种波形编码技术。该算法利用了语音信号样点间的相关性，并针对语音信号的非平稳特点，使用了自适应预测和自适应量化，在32kbps/8kHz速率上能够给出网络等级话音质量。ADPCM标准是一个代码转换系统,它使用ADPCM转换技术实现64Kb/s A律或u律PCM(脉冲编码调制(tiozh)速率和32Kb/s速率之间的相互转换。应用：WAV，MP3，G.721等,第十八页，共四十七页。,ADPCM基本(jbn)思想,利用自适应改变量化阶的大小,即使用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值,使用过去的样

12、本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是(zn sh)最小。ADPCM记录的量化值不是每个采样点的幅值,而是该点的幅值与前一个采样点幅值之差。IMA ADPCM算法对量化步长的调整使用了简单的查表方法，对于一个输入的PCM值X(n)，将其与前一时刻的X(n-1)预测值做差值得到d(n)，然后根据当前的量化步长对d(n)进行编码，再用此样点的编码值调整量化步长，同时还要得到当前样点的预测值供下一样点编码使用。,第十九页，共四十七页。,ADPCM编码(bin m)原理,第二十页，共四十七页。,ADPCM编码(bin m)原理,32Kbps ADPCM编码(bin m)原

13、理如下图所示,21,第二十一页，共四十七页。,ADPCM编码(bin m)原理,第二十二页，共四十七页。,ADPCM解码(jim)原理,32Kbps ADPCM译码原理(yunl)如下图所示,23,第二十三页，共四十七页。,参量(cnling)编码的基本原理,参量编码不直接传送语音波形，而是传送产生、激励语音波形的基本参量。根据语音产生机理(j l)，采用下列物理模型：,24,第二十四页，共四十七页。,反映(fnyng)语言特征的主要参数,基音频率与基金周期：声带振动频率、周期共振峰频率：声道的谐振频率语音强度(qingd)：浊音/清音判决浊音：有声音英语元音、汉语韵母清音：无声音英语多数辅音

14、、汉语多数声母时变滤波器的参数,第二十五页，共四十七页。,线性预测(yc)编码LPC,分帧处理(chl)：1020ms语音分析：基音提取浊音/清音判决，基音周期提取短时线性分析线性滤波器系数OR格型网络参数，以及增益线性预测分析：一个语音抽样能够用过去若干个语音抽样的线性组合逼近，使在有限时间内的实际语音抽样与线性预测抽样之间的差值平方最小均方预测误差最小。估计模型参数的基础：最小均方误差准则。,第二十六页，共四十七页。,LPC的基本原理,典型参量编码的线性预测(yc)LPC方案如图所示为了降低LPC的码率，提高稳定性，可采用以下两种方法：采用一类反射系数格形算法采用矢量量化技术,27,第二十

15、七页，共四十七页。,混合(hnh)编码的基本原理,混合编码是介于波形编码与参量编码之间的一种编码方法，兼有参量编码低速率与波形编码的高质量的优点。实现混合编码的基本思想是以参量编码原理，特别是以LPC原理为基础，保留参量编码低速率的优点，并适当的吸收波形编码中能部分反映波形个性特征的因素。重点改善自然度性能。改进LPC主要从三方面入手：改进语音生成(shn chn)物理模型、激励源结构和合成滤波器结构，提高语音质量；改进参量量化和传输方法，进一步压缩传输速率；采用自适应技术，进一步解决系统与信源和信道之间的统计匹配。,28,第二十八页，共四十七页。,移动(ydng)通信中的语音编码,本节将结合

16、第二代(2G)的GSM与IS-95系统以及第三代(3G)的WCDMA和CDMA2000等不同系统所采用的语音编码具体方案，着重从原理上来阐述移动通信中的语音编码。GSM系统的RPE-LTP声码器采用等间隔，相位与幅度优化的规则脉冲作为激励源，以便使合成后的波形更接近原始信号。该方案结合长期预测以消除信号的冗余度，降低编码速率，同时其算法较简单，计算量适中(shzhng)且易于硬件实现。,29,第二十九页，共四十七页。,30,GSM系统(xtng)的RPE-LTP声码器原理,REP-LTP编码器包括下列五个部分(b fen)：预处理，线性预测分析，短时分析滤波，长时预测以及规则脉冲激励编码，其编码器原理如图所示。,第三十页，共四十七页。,GSM 语音编码(bin m)框图,第三十一页，共四十七页。,预处理,除去输入信号中的直流分量，并进行高频分量预加重(jizhng)。组成：偏移补偿和预加重偏移补偿：陷波滤波器高频分量的预加重：采用一阶FIR 滤波器。目的是更好地进行LPC 分析。,第三十二页，共四十七页。,LPC 分析(fnx),主要(zhyo)目的是提取LPC 参数。分帧：语音信号

展开阅读全文