一种基于小波阈值优化的会议场景非平稳噪声消除方法与流程

专利2025-05-23  6


本发明涉及噪声消除,具体是一种基于小波阈值优化的会议场景非平稳噪声消除方法。


背景技术:

1、小波阈值降噪是语音降噪领域中一种常用的信号处理技术,利用小波变换将语音信号分解为不同尺度的子带,然后根据每个子带的能量大小与一定阈值进行比较,将能量较小的子带视为噪声,并将其抑制或滤除,从而实现降噪效果。

2、在会议场景中,存在各种噪声,可能包括环境噪声(例如空调声、电扇声)、回声、移动设备的干扰声、其他与会者的说话声等等。这些噪声会较为严重地干扰到会议的语音信号质量,导致语音信号的可理解性下降,使得与会者难以准确听到以及理解会议内容,从而影响会议的效果。

3、如何提高会议音频质量,提升会议效果,是一直在研究的课题。当前挑战之一在于非平稳噪声的消除,非平稳噪声指的是在时间和频率上均具有变化的噪声,这种噪声在会议场景中非常常见。由于非平稳噪声的特点,传统线性滤波方法难以有效消除。

4、尽管小波阈值降噪在非平稳噪声消除方面具有显著优势,但仍然存在一些挑战。阈值的选择对降噪效果至关重要,过低的阈值会导致语音信号的失真,过高的阈值则可能无法有效地抑制非平稳噪声,传统阈值选择方法并不能很好地适用于真实场景下的语音噪声消除。关于阈值选择方法的确定,部分文献提出了解决方案。

5、donoho首先提出小波分解降噪的方法,在此基础上引入了硬阈值函数与软阈值函数,为后续研究打下基础;此外,donoho还提出基于stein无偏风险估计(sure)准则的阈值估计公式,该方法成为了众多降噪技术的基础。在此基础上,研究人员探索了各种方法来自适应估计小波降噪的最佳阈值。

6、在众多方法中,自适应阈值估计(ate)方法的效果较佳,具有一定的泛用性。近年来,群体智能优化算法已被用来优化基于sure公式的阈值选择过程。受到sure无偏估计原理的启发,很多研究分别使用蚁群优化、粒子群优化和鱼群算法来获得小波降噪的最佳阈值。然而,这些方法基于sure准则,都仅限于处理符合高斯分布的平稳噪声,而现实场景中的噪声具有复杂性,往往难以取得好的效果。

7、除此之外,小波阈值降噪对信号的分解和重构过程需要大量的计算资源,因此在实时处理和低功耗设备上的应用具有一定的挑战性。


技术实现思路

1、针对现有的噪声消除技术针对会议场下的非平稳噪音消除上存在的技术缺陷,本发明提出一种基于小波阈值优化的会议场景非平稳噪声消除方法,能够根据会议场景中的各类噪声信号自适应地估计阈值,并根据估计的阈值进行软阈值噪声处理。

2、一种基于小波阈值优化的会议场景非平稳噪声消除方法,包括以下步骤:

3、步骤1,对原始带噪音频信号进行小波分解;

4、步骤2,设定优化目标函数其中snr、ncc分别为信噪比、相似度系数,α为确保目标函数这两项的维度处于同一区间的加权系数,xden是经过每次迭代的阈值λ筛选后重构的音频信号;

5、步骤3,基于设定的目标函数以及遗传算法,筛选每层小波分解所需的最优阈值;

6、步骤4,根据每层的最优阈值,采用软阈值函数进行小波降噪,获得降噪后的系数,根据降噪后的系数进行重构,得到重构后的降噪信号,软阈值函数为其中wj,k为小波分解后的细节系数,为筛选后的细节系数,λ为筛选所需阈值。

7、进一步的,小波分解采用db4小波基函数。

8、进一步的,遗传算法进行最优阈值筛选的操作如下:

9、初始化包含n个样本的种群,每个样本x的维度为d;

10、计算种群中每个样本x在目标函数f(x)作用下的适应度大小;

11、根据种群中每个样本对应的适应度大小,利用轮盘算法筛选样本进入下一代种群,样本的适配度越大,被选中的概率越高;

12、种群中进行随机交配和突变操作,以扩大算法在样本空间中的随机搜索范围;

13、重复直到达到指定的迭代次数或满足停止准则。

14、本发明的有益效果:

15、1、提升语音清晰度和可理解性:会议场景中的非平稳噪声常常导致语音信息的模糊和混杂,降低了语音的可理解性,通过精确选择最优阈值,本发明能够有效地抑制非平稳噪声,有效地减少噪声干扰,从而显著提高语音的清晰度,使得语音更加清晰可辨,提升了会议的交流效果;

16、2、保留重要语音特征:本发明提出了全新的优化目标函数,充分考虑了语音信号的非平稳特性,与现有方法不同的是,本发明将信号的非平稳特性与优化方法相结合,设计的优化目标函数结合了最大信噪比和最小相似度系数,不仅注重增强语音质量,还重视保留重要的语音特征,在降噪过程中,关键的语音特征(例如说话者的声调、情感等)能够得到更好的保留,保持了语音的自然性和可识别性。

17、3、自适应性和灵活性:本发明所提出的降噪方法具有自适应性,能够适应不同的噪声特征和语音信号,通过遗传算法的优化过程,每个小波分解层都能获得最优的阈值,从而适应不同频率和时域上的噪声变化。

18、4、高效和实时性:遗传算法作为优化手段,具备较高的搜索效率和并行计算能力,本发明能够在实时会议场景中进行语音降噪处理,快速地生成最优阈值组合,实现实时降噪,并提供稳定的性能表现。



技术特征:

1.一种基于小波阈值优化的会议场景非平稳噪声消除方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于小波阈值优化的会议场景非平稳噪声消除方法,其特征在于,小波分解采用db4小波基函数。

3.根据权利要求1所述的基于小波阈值优化的会议场景非平稳噪声消除方法,其特征在于,遗传算法进行最优阈值筛选的操作如下:

4.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现权利要求1-3任意一项所述的基于小波阈值优化的会议场景非平稳噪声消除方法。

5.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序可被处理器执行以实现权利要求1-3任意一项所述的基于小波阈值优化的会议场景非平稳噪声消除方法的各个步骤。


技术总结
本发明公开了一种基于小波阈值优化的会议场景非平稳噪声消除方法,通过采用小波阈值降噪和遗传算法优化阈值选择,实现对非平稳噪声的有效抑制,从而解决会议场景中的非平稳噪声影响语音质量的问题。具体而言,通过小波变换将音频信号分解为不同尺度的近似系数和细节系数,然后利用遗传算法优化阈值选择,以最大化信噪比结合最小化降噪后的信号与原始信号之间的相似度系数作为优化目标函数,最后,应用逆小波变换将处理后的系数重构为降噪后的音频信号,本发明有效地抑制非平稳噪声,有效地减少噪声干扰,从而显著提高语音的清晰度,使得语音更加清晰可辨,提升了会议的交流效果。

技术研发人员:乔宏波
受保护的技术使用者:合肥乾芯科技有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1820198.html

最新回复(0)