Compare Plans

2021-08-25

线性预测合成分析编码原理

 
4.1.1 结构原理
G.728、G.729和G.723.1都属于同一类声码器,称之为线性预测合成分析(I.PAS-LinearPredicfionAnalysis-by-Synthesis)编码器,其原理结构如图4.1所示。
声码器结构
图4.1  IPAS声码器的原理结构
       激励生成器产生的激励信号经线性预测器后得到重构的话音信号s(i),线性预测器模拟声道特性,加强激励信号的某些频率域,减弱另一些频率域,体现了话音的短时相关性。激励信号则体现了话音的长时相关性,输入线性预测器的激励信号是量化后的增益和基音信号。由千卧化误差的影响,重构信号和输入信号S(i)之间必然存在有限的差值e(i),称之为残差信号(residualsignal),最小化过程的日的就是调整激励信号,使残差的方差为最小,由此构成确定激励信号的闭环回路。为了减小量化比特,提高编码效率,激励生成器输出的是残差信号估值,而不是原信号估值。从频域上来说,最小化过程使激励信号晕化噪声的能量集中在预测滤波器的低谷部分,从而使雇化噪声呈现平坦的类似白噪声的功率频谱。
       经过最小化过程确定的激励信号星化值就是声码器的输出,接收端的解码器根据此信号和同样的线性预测器恢复原来的话音信号(实际上图4.1.1难框部分所示闭环回路的下半部分就是解码器的结构,因此该结构的编码器己内含解码器。在话音编码中,常称编码过程为语音分析,它的功能是将话音转换为适于计算机存储和网络中传输的数字形式;称解码过程为语音合成,它的功能是将数字形式的话音数据重新转换为可供人类使用的信号形式。按这样的术语来解释,反馈回路中的线性预测器是用来重建信号的,又称为预测合成器,整个编码器是通过内含的语音合成来完成语音分析过程的,所以称之为合成分析器。
       由于声道的形状和大小是随音素而变化的,因此预测合成器是一个线性时变系统,其滤波器系数需定期更新。因此,LPAS的闭环回路实际上包含两层反馈控制。内层是线性预测滤波器的自适应控制,其过程和ADPCM相同,系数更新周期为一个帧长,典型值为10~30ms。外层是激励信号的优化,由于基音周期小于帧长,因此其更新周期较短,典型值为5~l0ms。LPAS的关键技术是如何确定和量化激励信号。
       残差激励信号的量化有多种方法,它是不同LPAS系统的主要差别所在。一种广为使用的方法称之为多脉冲激励(MPE-multi-pulseexcitation)编码,该方法用于比特率为l0kbit/s左右的话音编码器,其复杂度适中,有良好的话音质量。与此类似的一种方法称为规则脉冲激励(RPE-regularpulseexcitation)编码,该方法限定激励脉冲的位置,复杂度较低,其比特率及质量和多脉冲编码类似。近年来得到广泛使用的方法是码本激励线性预测(CELP-Code-excitedlinear Predic­tion)编码,该方法采用矢量量化技术,用予定义的码本(codebook)激励替代脉冲激励,码本中的每一个向量对应一个量化信号,编码信息转化为码本索引。这种方法具有很高的编码效率,但是复杂度也很 高,由于近年来高速DSP的出现才使这种方法成为实用,并以此为基础演绎出多种低比特率声码器标准。
4.1.2功能结构改进
        图4.2为实际采用的改进结构,它增加了两个功能。
1.误差加权滤波器
        前已述及,通过最小化残差信号方差的判据确定的量化误差具 有平坦的噪音频谱,但是实际上人的听觉系统对于不同频段噪声的 感觉是不一样的。众所周知,如果有一个强信号存在,一个本来可以听到的话音可能会被掩没成为不可闻信号,这一感觉效应称为掩蔽  (masking)。误差加权滤波器的作用就是对残差信号进行频谱掩蔽,也就是按照话音信号频谱的峰值来整形量化噪声,使得量化噪声的 能量集中在原信号的高能区域。插入加权滤波器后,编码器参数将 根据感觉加权均方差准则选取,由此得到的量化噪声也许会增加,但是对于人的听觉系统来说可感的噪声却降低了,可以有效地提高LPAS编码器的性能。
       与此类似,在解码器的输出端也可加入一个自适应后置滤波器,以进一步降低可感噪声,特别是低能量频率区域的噪声。其原理和编码器中的误差加权滤波器相似,具体实现可为短时相关滤波器和长时相关滤波器的组合。短时滤波器根据收到的预测合成器系数修改重建信号的频谱包络,长时滤波器参数则由收到的激励信号数据导出。
2.输入信号预处理
        其目的也是修正误差判据,使其更加符合人类听觉系统的感觉特性,以便降低编码参数的比特率。对于最小均方差判据来说,原信号和重构信母之间微小的时延差,即相位不匹配会造成很大的失配误差,但是实际上这类误差是感觉不到的,即使时延差随时间缓慢变化,人类听觉系统对此也不敏感。输入信号予处理的作用就是对信号进行简单的时延处理或较为复杂的时间变换处理,以掩蔽相位误差。它可以有效地提高基音预测的编码效率。
声码器改进结构
图4.2 LPAS声码器改进结构

联系我们

028-83110277

IP电话机视频电话机供应商

手机:

成都世讯电科信息技术有限公司

成都世讯电科信息技术有限公司是一家多媒体融合通信解决方案及运营服务提供商,公司专注于为广大用户提供简单高效的通信产品和真正符合行业用户需求的行业应用解决方案,让用户享受到个性化、私密性强又具开放性、兼容性强又易于管理的高科技服务,帮助用户实现办公及运营通信的现代化与网络信息化。

公司拥专注于IP多媒体解决方案的应用与实施,有IP多媒体通信系统(IPBX)、IP多媒体通信平台定制与搭建(运营、对讲广播、门禁、调度、音视频会议及与视频监控交互式应用等)、IP电话机、视频电话机、项目租赁、云通信及系统集成等服务。

电话:028-83110277

Q Q:86313858