|
语音信号前端处理技术研究 文主要研究了低信噪比下的语音端点检测和语音增强。端点检测和语音增强都是语音信号的前端处理,其准确性在很大程度上影响了后续语音处理如语音编码和语音识别的效果。有效的端点检测不仅能使处理时间减到最少,而且能排除无声段的噪声干扰。语音增强则从含噪信号中提取干净的语音信号,提高语音信号的信噪比。 关于低信噪比下的语音端点检测和语音增强,本文的主要工作如下: 1.研究了基于短时能量和短时平均过零率的端点检测方法,对能量阈值的设定提出了改进,利用无声段能量的平均值代替了最小值,并着重探讨了此方法在不同噪声环境下的检测效果。 2.研究了基于频带方差的端点检测法,利用语音段和噪声段频谱特性的差异来检测语音的起始和结束点,并在实现过程中剔除了无声段中某些帧的频带方差的突变,避免了因话筒震动等原因引起的脉冲干扰。 3.研究了基于短时信息熵的端点检测方法,利用语音段信息熵高于无声段的特点,进行语音起始点和结束点的判定,并讨论了实现过程中门限阈值的设定和剔除无声段中某些帧的熵值突变的问题。 4.利用以上三种方法,对20个数字和字母的汉语发音以及一些汉语短句,测试了它们在纯净语音、加不同信噪比白噪声和Babble噪声情况下的检测效果。结果表明,在安静环境下,短时能量过零率法和信息熵方法的检测结果比频带方差法准确;但在噪声较大的情况下,频带方差法特别是信息熵法的检测效果要远远优于短时能量和过零率法。 5.针对谱相减方法中忽略了含噪信号随时间的变化和在不同频段下的噪声对语音信号影响的问题,提出了两种改进算法:对每一帧含噪信号根据其噪声平稳度的不同动态调整谱相减算法的系数;以及根据每一帧语音信号的听觉掩蔽阈值动态调整各个关键频段的谱相减参数,从而更加准确的逼近实际噪声,使谱相减之后的结果更趋近纯净语音信号。与常用谱相减算法的对比实验证明,改进算法能有效消除音乐噪声,在很大程度上提高了信噪比。相比之下,基于听觉掩蔽模型的谱相减算法以人耳的听觉系统特性作为研究的基础,其增强结果在可懂度上也有了一定的提高,这为解决信噪比与可懂度的矛盾提供了一种新思路。 盲信号分离技术是信号处理中用于阵列处理和数据分析的一种新的技术,在源信号和混合过程未知的情况下,从混合信号中分理处源信号。盲信号分离技术可以广泛应用于无线通讯、医学信号处理、语音图像处理以及雷达信号处理等多个应用领域,已成为信号处理领域的一个研究热点。 本文对语音信号盲分离技术理论及其应用问题进行了研究,主要工作如下。 首先对信号盲分离问题的研究历史以及研究现状进行回顾论述,给出了信号盲分离问题的数学描述,包括盲分离问题的数学模型、保证盲分离问题可解的基本假设条件、信号盲分离问题中常用的数学原理和方法以及现有的信号盲分离主要算法等。 盲信号分离分为线性混合和非线性混合。在线性混合中,又包括两大类:一类是基于瞬时混合模式,一类是基于卷积混合模式。在实际环境中,很多信号与语音信号一样,都是以卷积混合的模式存在。而卷积混合盲分离算法,在很大程度上都是基于瞬时混合盲分离算法的改进。因此,本文首先给出了瞬时混合情况下,语音信号盲分离的算法,并进行了计算机仿真,证实了算法的有效性。 而后,本文重点研究了卷积混合语音信号的盲处理方法。现有的大部分盲分离算法都是建立在高阶统计量的基础上的,因为只有高阶统计量才能使输出信号是相互独立的。而二阶统计量只能使得输出信号互不相关。但二阶统计量可以实现非平稳信号和有色信号的盲分离。本文综合考虑了语音信号即是非平稳信号又是有色信号的特点,把传统的针对非平稳信号的盲分离算法与针对有色信号的盲分离算法结合起来,给出了针对语音信号的的盲分离算法,并用实验证明了在对语音信号进行盲分离时,此算法是非常有效的。 最后,根据本文的算法特性,对算法作了详细地分析,并且与现有的一些较成熟的算法进行了对比,证实本算法在对语音信号盲分离处理中具有较好的性能。本文所做的工作对语音处理具有普遍的意义。多媒体中控系统,会议中控系统,中控系统,中央控制系统,智能中控系统,多媒体会议系统-明控科技
|