您的当前位置：首页一种改进谱减法语音增强算法的研究

一种改进谱减法语音增强算法的研究

来源：保捱科技网

２０１６年第８期（总第１６４期）

信息通信

INFORMATION&COMMUNICATIONS

２０１６

（Ｓｕｍ．Ｎｏ１６４）

一种改进谱减法语音增强算法的研究

符成山

（装甲兵工程学院信息工程系，北京100072）

摘要：语音增强是语音处理中常用的手段，在传播语音信号的同时噪声信号也随之添加进来，为了得到纯净的语

音信号，我们对带噪信号进行语音增强，我们一般使用谱减法进行语音增强，但面对变化较大的噪声效果不理想。文章提出了一种改进的谱减语音增强方法，通过实验仿真表明，该方法有效地解决了噪声变化大情况下的语音增强。

关键词：谱减法；自适应；语音增强中图分类号：TN912文献标识码：A

文章编号：1673-1131（2016）08-0129-02

1概述

语音增强的一个主要目标是从带噪信号中提取出纯净的中p是幂指数。P=1时是幅度谱减法，P原始语音，改进语音的质量，减少背景噪声的同时提高语音带噪语音的幅度谱通过FFT计算得到，的质量。由于宽带噪声无论从时域还是从频域上看均与语对噪声谱进行估计，然后从带噪语音幅度谱中减去噪声幅度

音信号重叠在一起，实践中语音增强的难点是宽带噪声的抑谱，最后通过对该差分谱进行逆傅立叶变换制和消除。谱减法是最早被提出的去噪算法之一。它的基位）来生成增强的语音信号。

本原理是假设噪声是加性噪声，通过从带噪语音谱中减去噪2谱减法用于语音增强的改进及具体实现

声谱的估计，就可以得到纯净的语音信号谱。在不存在目标

信号的期间，可以对噪声谱进行估计和更新。但是谱减法虽2.1噪声谱估计

然简单但是有很多缺点，由于谱减法对噪声估计比较简单，进行谱减法的关键是对噪声谱的估计，会出现错误，进而导致了语音失真的现象，使得语音可懂度可以谱减法语音增强，噪声估计一般比较简单，下降。

开始的非语音帧进行噪声估计。但是由于实际噪声都是时变

1.1幅度谱减法基本原理

的，所以噪声必须根据实际情况而改变。进行语音活动检测（VoiceActivityDetection语音信号是短时平稳的，一般语音信号在处理之前先要

是语音帧还是非语音帧，如果是语音帧，对其进行分帧加窗处理。假如设某帧纯净语音信号为x(n)，噪强；如果是非语音帧，更新噪声谱估计。本文采用基于谱熵的声信号为d(n)，带噪语音为y(n)由纯净语音信号和噪声信号组进行语音活动检测。语音活动检测后，当检测到非语音帧后就成，即：y(n)=x(n)+d(n)，噪声信号的FFT为D(

，我们可以将Y

=|Y（y(

要对噪声估计进行更新，

)

为幅度谱，

）是带噪信号的相位谱。噪声谱D

(

)=|D(

是未知的，可以通过无语音活动时的平均幅度谱的估计

来代替。根据相位不会对语音可懂度超

应取较大的值。

成影响，只是可能在一定程度上影响语音质量。我们使用带噪

2.2谱减法存在问题及改进

语音相位

）来代替噪声相位）。带噪语音经过谱减后得噪声谱的估计可以通过无语音得到，由于对噪声信号的

到的纯净语音频谱的估计为

。

估计不准确，当从带噪语音谱中减去噪声谱估计时，1.2功率谱减法基本原理

残留一些隆起的部分或谱峰，有些谱峰是宽带的频率范围)幅度谱减法可以扩展到功率谱领域，为了得到带噪语音

，而有些谱峰带宽很窄，看起来像是频谱上的一个脉的功率谱，我们将y()相乘。带噪语音功率冲。通过对噪声谱的过减处理，实现减少宽带谱峰的幅度，谱：

时候可以完全消除。其技术具体形式：

其中|D()・D（

）・D（

应该随每一帧变化，是关于信噪比

的公式。

谱减法由于谱估计的大范围变化以及增益函数的不同

d(n)具体零均值，并且与纯

导致音乐噪声。针对谱估计的大范围变化，净信号x(n)不相关，则

为更小的子帧以得到更低分辨率的频谱。续平均以减少频谱波动。针对增益函数的不同使用自适应

平均，在时间上对增益函数做平滑。此外为避免因使用零相位增益函数导致的非因果滤波问题，，其

得到功率谱减法。

没有语音的时候可以利用语音VAD）来判断该帧频谱中会(包含较宽的有将分析帧划分子帧频谱通过连１２９

=2（使用带噪语音相得到噪声谱估计就这是需要对语音信号，则进行谱减法语音增在增益函数中引入

信息通信线性相位。

使用改进谱减法进行语音增强实现框图如下：

图1

输入信号被划分为具有L个样本长度的帧，然后进一步划分为M（M辨率的增益函数形式如下：，其中k

为减法因子(k=0.7)，

为通过无语音段估计得到的噪声

幅度谱。为了减少增益函数的波动，按照下式做时间平均：

，其中

表示

平滑后的第帧增益函数，ai是自适应平滑参数。自适应平滑

参数ai通过谱差异测度

其中，

差异测度可以粗略评估信号谱相对于背景噪声的变化。较小的差异值表示相对平稳的背景噪声环境，大的差异值则表示有语音存在或者背景噪声正快速变化，

=0.8）。

在对增益函数自适应平均后，将线性相位施加于增益函数以

产生因果滤波器。在对增益函数应用线性相位后，

，

其中为点插值增益函数，

１３０

符成山：一种改进谱减法语音增强算法的研究

，其中x(n)是原始语音信

号，y(n)是输出语音信号，N是帧长，M是帧的总数。

分段信噪比是计算一小段时间内语音信号与噪声的平均功率比，由于语音信号是一种缓慢的短时平稳信号，所以采用分段信噪比表征语音质量更接近主观值。表1是对不同信噪比，以及不同噪声用三种不同方法增强效果对比，图

1给出其时域波形图。从实验中可以看出，维纳滤波方法的消噪能力优于传统的谱减法，改进谱减的语音增强方法的消噪能力优于维纳滤波法，尤其当输入数据加大时，改进谱减法不仅数据效果好，而且可以消除非线性噪声，提高语音的可懂度。

表1在不同信噪比以及不同噪声环境下信噪比

图2时域波形图

4结语

文章介绍了一种新的语音去噪方法，并将改进的谱减

法应用到语音增强技术中。仿真结果表明，该方法比传统的谱减法和维纳滤波法的语音增强效果要好，在主观和客观的听觉上都有明显的改进，能够改善语音质量，有很好的应用前景。参考文献：[1]洪晓芬.基于谱减法的改进语音增强[J].计算机工程与设

计,2007,28（22）：5453-5454,5477.[2]徐耀华,郭英,范海宁.语音增强：使用burg谱先验信噪比

估计消除“音乐噪声”[J].信号处理,2009(25):141-146．[3]

易克初,田斌,付强.语音信号处理[M].北京:国防工业出版

社,2010.

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文