Compare Plans

2021-08-26

G.729 声码器

4.6.1  G.729性能特点
       G.729是8khit/s的LPAS声码器,线性预测采用前馈型前向自适应技术,并使用予视提高合成模型的精度。预测器系数根据当前 帧和部分下一帧话音数据进行更新,因此算法时延相对G.728较长。其帧长取为l0ms,由2 个子帧组成,予视5ms,加上处理时间和传输时间,设计的单向系统时延为35ms。由于采用的是前馈型自适应技术,因此除了传送激励信号(包括波形和增益)外,还需传送预测器系数。为『降低比特率,线性预测系数、激励信号波形、激励增益都采用矢星屈化,并利用了多级量化和分割量化技术。激励信号码本则采用高效的共辄结构代数码本,因此G.729编码称为CS-ACELP。
       ITU-T制订G.729标准的主要应用目标是第一代数字蜂窝系统,因为日美系统均为8kbit/s左右,GSM系统为13khit/s。同时还想在已有的64、32、16kbit/s标准基础上增加一个8kbit/s比特率编码,以构成4 个完整的标准系列。由千要应用千移动系统,因此复杂度比G.728低,为中等复杂度算法,但是所需RAM容量比G.728多一半,原因是帧长时间加大了。
       为了进一步降低复杂度,G.729标准又制订了一个附件A,称之为G.729A,它的复杂度较G.729降低一半,主要原因是激励码本的搜索进一步简化,同时后置滤波器也有简化。其代价是在某些操作条件下性能稍有下降。G.729A的设计应用是话音数据同传数字系统(DSVlD---DigitalSimultaneousVoiceandData),由于内含的V.34Modem已有较大时延,因此要求话音编码的复杂度不能太高。G.729A与G.729比特流兼容,即DSVD编码器分析所得的信号可由G.729解码器重建,反之亦然。G.729A标准在IP网络电话中得到了广泛应用。另外,最近的G.729附件还包含了静音抑制处理。
       话音质量是一个比较复杂的性能,也难以用精确的标准来衡量。表4.1从与G.726比较的角度给出了G.729的话音质量指标。
表4.1G.729话音质量指标
话音质量指标
话音质量指标
 
编码器结构
图4.9  G.729编码器结构
4.6.2  G.729编码器
       G.729编码器如图4.9所示。模拟话音信号经话带滤波器后,按8kHz频率抽样并转换成16bit线性PCM信号,这就是图中编码器的输人话音信号。该信号首先经预处理器,完成2个功能。一是信号定标,就是将信号幅度减半,以减小DSP定点实现时的数据上溢概率。二是高通滤波,阻止不希望的低频分量,采用2阶极/零点滤波器,截止频率为l40Hz。
       根据预处理后的输入信号进行线性预测分析,得到线性预测系数,即线性预测编码(LPC)信息,利用该系数即可构造合成滤波器。激励信号经合成滤波器后生成重构信号,与输入信号相减后得残差 信号。该残差信号经误差加权滤波器处理,根据听觉感受改变频谱,反馈回控制回路,根据使加权残差均方差最小的原则确定激励信号 及其增益。误差加权滤波器也是根据预测分析所得的LPC信息构造的。
       基音分析模块通过自相关分析推得基音周期,据此信息搜索自适应码本,确定最佳自适应码本矢量。然后再搜索固定码本,根据最小化加权均方差(MSE)的准则确定最佳固定码本矢量。最后再确定二个码本矢量的增益。
      上述过程确定的线性预测编码信息(线谱频率)、自适应码本矢量、固定码本矢量和矢量增益构成完整的G.729声码器编码参数。所有这些参数均以码本索引的形式发往接收端。
下面简要说明主要模块的功能原理。
1.线性预测分析和量化
       短时相关分析采用IO阶线性预测(LP)滤波器。LP分析每帧(l0ms)进行1次,采用不对称窗口,计算窗口内话音信号自相关系数,然后用杜宾递推算法求得LP系数。该系数再变换为线谱对(15P)频域参数,供量化和子帧内插,内插求得的15P参数再转换为LP滤波器系数,用以建立每个子帧的合成滤波器和误差加权滤波器,分析采用5ms予视,因此要用到当前帧80个抽样信号和下一帧40个抽样信号。
      分析求得LP系数后,根据式(4.11)和(4.12)式转换成线谱对,
      式中取N=10。如前述,P(z)和Q(z)的根都在单位圆上,让其实部和虚部分别为:
       
       其中。ωi就是线谱频率(LSF),其取值范围为0<ωi<π。现对ωi进行量化。为了提高量化精度,先用滑动平均(MA-MovingAverage)预测法预测当前帧的LSF,然后对LSF的计算值和预测值之差进行量化。算法采用2级矢量量化。
       第1级:10维矢量量化,码本C1 ,共含128个矢量。其索引记为Ll,为7bit。
       第2级:10bit矢量量化,采用2段分割矢量量化实现。分割为2个S维码本C2和C3,各包含32个矢量。其索引分别为L2和L3,各为5bit。C2和C3分别量化前5个ωi,和后5个ωi。
       每个码本按照最小化MSE搜索,各个LSF量化系数由选定的2级码本矢量之和确定:
     
       算法规定用2个MA预测法进行预测,重复以上步骤,从中取最优值。因此用参数L0指示选定的是哪个MA预测法,L0为1bit。
       为了防止由此构成的LP合成滤波器的共振峰太陡,确定的系数需重新安排,使相邻系数至少保持一个最小间距。ωi的量化值确定后,尚需按下列步骤校核滤波器的稳定性:
校核稳定性
       LSP系数植化,内插完成后,再转换成LP系数ai,供合成滤波器和误差加权滤波器使用。
2.开环基音分析
        为了降低自适应码本搜索的计算量,先通过开环分析大致估算基音周期,记为Top自适应码本就限定在Top附近进行搜索。开环分析每l0ms进行一次,分析方法是计算加权话音信号归一化自相关系数,其最大值对应的就是基音周期。周期范围设定为20- 143个抽样,即2.5-18ms,对应基音频率为55Hz~400Hz。计算时分为三个时延段:
i=1:80-143抽样周期,最大值R(t1  )
i=2:40- 79抽样周期,最大值R(t2 )
i = 3:20-39抽样周期,最大值R(t3 )
   取最大的R(ti)对应的时延为基音周期。如果有二个最大值相同,则优选低时延值,以避免选到基音周期的倍数。
3.加权合成滤波器的特征量计算
       包括两个量值的计算。一是滤波器的冲激脉冲响应h(n),二是目标信号X(n)。这两个量值按子帧计算,其结果供该子帧自适应码本和固定码本搜索时计算误差方差使用。目标信号的通常计算 方法是加权话音信号减去加权合成滤波器的零输入响应,即4.3.2节所述的G.729采用计算残差信号经加权合成滤波器响应的等效算法。
4.自适应码本搜索
     自适应码本参数包括时延和增益,它是实现长时相关滤波的一种有效方法。码本搜索每子帧进行一次。搜索方法是在一定的码本范围内,按最小化残差均方差的准测确定最佳码本矢量,计算判据即为式(4.25)式。
5.固定码本搜索
       固定码本搜索的目的是在自适应码本搜索确定的预测激励的   基础上,再附加增量激励,使残差进一步减小。固定码本基于代数码本结构,采用交织单脉冲排列(ISPP--InterleavedSinglePulsePennn­talion)设计。每个码本矢量包含4个非零单位脉冲,每个脉冲可有幅值+1或-l,允许的脉冲位置如表4.2所示。
表4.2固定码本矢量中的脉冲位置
脉冲位置
 
6.参数编码比特分配
根据以上分析,可得G.729  声码器参数编码的比特分配如表4.3所示。其中,线谱对参数决定合成滤波器的系数,每帧更新一次;其余参数决定激励信号,每子帧更新一次。总比特数为每帧   (10ms)80bit,即编码比特率为8kbit/s。
表4.3G.729参数编码比特分配
参 数 码 字 子 帧 l 子 帧 2 每帧小计
线谱对( LSP) U0,Ll ,L2 ,L3     18
自适应码本时延 Pl,P2, 8 5 13
时延码字奇偶校(第1子帧) P0 1   l
固定码本脉冲位置 Cl,C2 13 13 26
固定码本脉冲符号 SI,S2 4 4 8
第 1 级增益码本索引 GAi,GA2 3 3 6
第 2 级增益码本索引 GBi,GB2 4 4 8
总计       80
 
4.6.3   G.729解码器
l.解码器结构和功能
 
G729解码器结构
图4.10  G.729解码器结构
G.729解码器的结构如图4.10所示。其解码过程基本上是编码的逆过程。
 该重构信号还需经后置滤波器处理,其原理和G.728相同。在自适应后置滤波器之后还级联一个高通滤波器和一个将信号幅度扩大一倍的定标电路,和编码器的预处理器相对应。
2.帧丢失处理
如果解码器检测到一帧编码器参数丢失时,将启动帧丢失处理过程。其原则是根据以前收到的信息重建当前帧,用类似特性的激励替代丢失的激励,其能量应逐渐衰减。
其实现方法是根据长期相关预测增益对话音帧进行分类,该增益是长期相关后置滤波器分析的中间结果。如果lOms帧中至少有1个子帧的预测增益大于3dB,则为周期性帧,否则为非周期性帧。丢失帧重构继承前面帧的类型。
如果上次重构帧是周期性的,则本帧也认为是周期性的。此时只用自适应码本,固定码本的贡献置零。基音时延基千上一帧基音周期的整数部分,以后逐帧时延加1,增益逐帧衰减。
如果上次重构信号是非周期性的,则本帧也认为是非周期性帧,自适应码本贡献置零。固定码本矢量生成采用随机数选择码本索引和符号索引。固定码本索引由随机数的低13位比特确定,符号索引由随机数的低4位确定,码本增益逐帧衰减。
 

联系我们

028-83110277

IP电话机视频电话机供应商

手机:

成都世讯电科信息技术有限公司

成都世讯电科信息技术有限公司是一家多媒体融合通信解决方案及运营服务提供商,公司专注于为广大用户提供简单高效的通信产品和真正符合行业用户需求的行业应用解决方案,让用户享受到个性化、私密性强又具开放性、兼容性强又易于管理的高科技服务,帮助用户实现办公及运营通信的现代化与网络信息化。

公司拥专注于IP多媒体解决方案的应用与实施,有IP多媒体通信系统(IPBX)、IP多媒体通信平台定制与搭建(运营、对讲广播、门禁、调度、音视频会议及与视频监控交互式应用等)、IP电话机、视频电话机、项目租赁、云通信及系统集成等服务。

电话:028-83110277

Q Q:86313858