2016年第8期(总第164期)
信息通信
INFORMATION&COMMUNICATIONS
2016
(Sum.No164)
一种改进谱减法语音增强算法的研究
符成山
(装甲兵工程学院信息工程系,北京100072)
摘要:语音增强是语音处理中常用的手段,在传播语音信号的同时噪声信号也随之添加进来,为了得到纯净的语
音信号,我们对带噪信号进行语音增强,我们一般使用谱减法进行语音增强,但面对变化较大的噪声效果不理想。文章提出了一种改进的谱减语音增强方法,通过实验仿真表明,该方法有效地解决了噪声变化大情况下的语音增强。
关键词:谱减法;自适应;语音增强中图分类号:TN912文献标识码:A
文章编号:1673-1131(2016)08-0129-02
1概述
语音增强的一个主要目标是从带噪信号中提取出纯净的中p是幂指数。P=1时是幅度谱减法,P原始语音,改进语音的质量,减少背景噪声的同时提高语音带噪语音的幅度谱通过FFT计算得到,的质量。由于宽带噪声无论从时域还是从频域上看均与语对噪声谱进行估计,然后从带噪语音幅度谱中减去噪声幅度
音信号重叠在一起,实践中语音增强的难点是宽带噪声的抑谱,最后通过对该差分谱进行逆傅立叶变换制和消除。谱减法是最早被提出的去噪算法之一。它的基位)来生成增强的语音信号。
本原理是假设噪声是加性噪声,通过从带噪语音谱中减去噪2谱减法用于语音增强的改进及具体实现
声谱的估计,就可以得到纯净的语音信号谱。在不存在目标
信号的期间,可以对噪声谱进行估计和更新。但是谱减法虽2.1噪声谱估计
然简单但是有很多缺点,由于谱减法对噪声估计比较简单,进行谱减法的关键是对噪声谱的估计,会出现错误,进而导致了语音失真的现象,使得语音可懂度可以谱减法语音增强,噪声估计一般比较简单,下降。
开始的非语音帧进行噪声估计。但是由于实际噪声都是时变
1.1幅度谱减法基本原理
的,所以噪声必须根据实际情况而改变。进行语音活动检测(VoiceActivityDetection语音信号是短时平稳的,一般语音信号在处理之前先要
是语音帧还是非语音帧,如果是语音帧,对其进行分帧加窗处理。假如设某帧纯净语音信号为x(n),噪强;如果是非语音帧,更新噪声谱估计。本文采用基于谱熵的声信号为d(n),带噪语音为y(n)由纯净语音信号和噪声信号组进行语音活动检测。语音活动检测后,当检测到非语音帧后就成,即:y(n)=x(n)+d(n),噪声信号的FFT为D(
,我们可以将Y
=|Y(y(
要对噪声估计进行更新,
)
为幅度谱,
)是带噪信号的相位谱。噪声谱D
(
)=|D(
d(
)|
是未知的,可以通过无语音活动时的平均幅度谱的估计
来代替。根据相位不会对语音可懂度超
应取较大的值。
成影响,只是可能在一定程度上影响语音质量。我们使用带噪
2.2谱减法存在问题及改进
语音相位
)来代替噪声相位)。带噪语音经过谱减后得噪声谱的估计可以通过无语音得到,由于对噪声信号的
到的纯净语音频谱的估计为
。
估计不准确,当从带噪语音谱中减去噪声谱估计时,1.2功率谱减法基本原理
残留一些隆起的部分或谱峰,有些谱峰是宽带的频率范围)幅度谱减法可以扩展到功率谱领域,为了得到带噪语音
,而有些谱峰带宽很窄,看起来像是频谱上的一个脉的功率谱,我们将y()相乘。带噪语音功率冲。通过对噪声谱的过减处理,实现减少宽带谱峰的幅度,谱:
时候可以完全消除。其技术具体形式:
其中|D()・D(
*
)・D(
应该随每一帧变化,是关于信噪比
的公式。
谱减法由于谱估计的大范围变化以及增益函数的不同
d(n)具体零均值,并且与纯
导致音乐噪声。针对谱估计的大范围变化,净信号x(n)不相关,则
为更小的子帧以得到更低分辨率的频谱。续平均以减少频谱波动。针对增益函数的不同使用自适应
平均,在时间上对增益函数做平滑。此外为避免因使用零相位增益函数导致的非因果滤波问题,,其
得到功率谱减法。
没有语音的时候可以利用语音VAD)来判断该帧频谱中会(包含较宽的有将分析帧划分子帧频谱通过连129
=2(使用带噪语音相得到噪声谱估计就这是需要对语音信号,则进行谱减法语音增在增益函数中引入
信息通信线性相位。
使用改进谱减法进行语音增强实现框图如下:
图1
输入信号被划分为具有L个样本长度的帧,然后进一步划分为M(M辨率的增益函数形式如下:,其中k为减法因子(k=0.7),
为通过无语音段估计得到的噪声
幅度谱。为了减少增益函数的波动,按照下式做时间平均:
,其中
表示
平滑后的第帧增益函数,ai是自适应平滑参数。自适应平滑
参数ai通过谱差异测度
其中,
差异测度可以粗略评估信号谱相对于背景噪声的变化。较小的差异值表示相对平稳的背景噪声环境,大的差异值则表示有语音存在或者背景噪声正快速变化,
=0.8)。
在对增益函数自适应平均后,将线性相位施加于增益函数以
产生因果滤波器。在对增益函数应用线性相位后,
,
其中为点插值增益函数,
130
符成山:一种改进谱减法语音增强算法的研究
,其中x(n)是原始语音信
号,y(n)是输出语音信号,N是帧长,M是帧的总数。
分段信噪比是计算一小段时间内语音信号与噪声的平均功率比,由于语音信号是一种缓慢的短时平稳信号,所以采用分段信噪比表征语音质量更接近主观值。表1是对不同信噪比,以及不同噪声用三种不同方法增强效果对比,图
1给出其时域波形图。从实验中可以看出,维纳滤波方法的消噪能力优于传统的谱减法,改进谱减的语音增强方法的消噪能力优于维纳滤波法,尤其当输入数据加大时,改进谱减法不仅数据效果好,而且可以消除非线性噪声,提高语音的可懂度。
表1在不同信噪比以及不同噪声环境下信噪比
图2时域波形图
4结语
文章介绍了一种新的语音去噪方法,并将改进的谱减
法应用到语音增强技术中。仿真结果表明,该方法比传统的谱减法和维纳滤波法的语音增强效果要好,在主观和客观的听觉上都有明显的改进,能够改善语音质量,有很好的应用前景。参考文献:[1]洪晓芬.基于谱减法的改进语音增强[J].计算机工程与设
计,2007,28(22):5453-5454,5477.[2]徐耀华,郭英,范海宁.语音增强:使用burg谱先验信噪比
估计消除“音乐噪声”[J].信号处理,2009(25):141-146.[3]
易克初,田斌,付强.语音信号处理[M].北京:国防工业出版
社,2010.