一种基于阵列麦克风的降风噪方法及系统与流程

专利2025-08-09  48


本发明涉及麦克风降噪,尤其涉及一种基于阵列麦克风的降风噪方法及系统。


背景技术:

1、风噪是指风流动到麦克风表面,和麦克风摩擦产生的非稳态噪声,所以风噪没有明显的方向性。由于风噪没有明显的方向性,随机性强,且主要能量集中在低频,覆盖了人声基音范围,会严重影响用户通话质量。随着耳机的使用场景越来越多,用户遇到风噪干扰的机会越来越大。比如办公室场景中,空调吹风声,风扇吹风声都会影响用户的使用体验。比如户外场景中,强大的风噪甚至会导致用户无法使用耳机进行通话。而使用传统的单通道语音增强(谱减法,维纳滤波)方法或者多通道语音增强方法(波束形成等空间滤波),都无法有效的进行风噪检测和抑制。另外,最近发展的深度学习方法,由于需要的运算量较大,实时性难以满足,且对于不同场景的鲁棒性还有待提高。


技术实现思路

1、本发明提出一种基于阵列麦克风的降风噪方法及系统,能够有效地判断风噪,并在保留语音信息的前提下抑制风噪,提高用户的通话质量。

2、第一方面,本发明实施例提供一种基于阵列麦克风的降风噪方法,包括:

3、通过阵列麦克风获取声音信号;

4、根据所述声音信号计算所述阵列麦克风对应的复相干系数;

5、根据所述复相干系数,确定所述声音信号的所在场景,所述声音信号的所在场景包括纯风噪场景、纯人声场景或风噪人声混合场景;

6、根据所述复相干系数构建去风噪滤波器;

7、根据所述声音信号的所在场景,使用所述去风噪滤波器进行对应的降风噪处理。

8、本发明实施例提供一种基于阵列麦克风的降风噪方法,根据声音信号计算阵列麦克风对应的复相干系数,进而根据复相干系数判断此时的声音信号的所在场景,针对不同的场景实施不同的降风噪处理手段,使得在抑制风噪的同时还能确保语音的清晰度,避免语音失真,提高用户的通话质量。本发明相对于其他单通道去风噪算法,对风噪的判断更加准确可靠;对风噪的滤除也更加平稳干净;另外相对于其他ai算法,计算量更小,达到同等降噪效果所需的性能开销更小。

9、在一种可能实现的方式中,所述根据所述声音信号计算所述阵列麦克风对应的复相干系数,具体为:

10、从所述阵列麦克风中任意选取第一麦克风和第二麦克风;

11、根据所述第一麦克风的自功率谱密度、所述第二麦克风的自功率谱密度以及所述第一麦克风和第二麦克风的互功率谱密度计算所述第一麦克风和第二麦克风相互之间的复相干系数;

12、计算所述阵列麦克风中每个麦克风与其他麦克风之间的复相干系数并进行求和平均,获得所述阵列麦克风对应的复相干系数。

13、本发明实施例提供一种计算所述阵列麦克风对应的复相干系数的方法,先计算各个麦克风之间的复相干系数,再综合计算整个阵列麦克风的复相干系数。在耳机的使用场景中,由于人声是可以近似为点声源,其传播到阵列麦克风的过程是具有空间性的,但是风噪是一个随机的过程,所以风噪的麦克风间的复相干性低,而目标语音的复相干性相对较高。所以根据麦克风之间的复相干系数,可以判断出语音信号所在的场景,提高对通话场景的识别精度。

14、进一步的,所述根据所述第一麦克风的自功率谱密度、所述第二麦克风的自功率谱密度以及所述第一麦克风和第二麦克风的互功率谱密度计算所述第一麦克风和第二麦克风相互之间的复相干系数,具体公式为:

15、

16、其中,γij(ω,τ)为所述第一麦克风和第二麦克风相互之间的复相干系数,(ω,τ)为所述第一麦克风和第二麦克风的互功率谱密度,和分别为所述第一麦克风和所述第二麦克风的自功率谱密度,xi和xj分别表示所述第一麦克风和所述第二麦克风,ω表示频域单元,τ表示时间帧;

17、所述第一麦克风和第二麦克风的互功率谱密度是通过时间帧间的平滑进行计算:

18、

19、其中,γ是平滑系数,h是共轭转置符号,xi和xj分别表示所述第一麦克风和所述第二麦克风获取的声音信号。

20、进一步的,所述计算所述阵列麦克风中每个麦克风与其他麦克风之间的复相干系数并进行求和平均,获得所述阵列麦克风对应的复相干系数,具体公式为:

21、

22、其中,γ(ω,τ)为所述阵列麦克风对应的复相干系数,n为所述阵列麦克风中麦克风的数量。

23、在一种可能实现的方式中,所述根据所述复相干系数,确定所述声音信号的所在场景,具体为:

24、根据所述声音信号的频率分布,基于预设频率值将所述复相干系数分为低频的复相干系数和中高频的复相干系数;

25、当所述低频的复相干系数小于第一阈值时,则所述声音信号中存在风噪;否则,所述声音信号中不存在风噪;

26、当所述中高频的复相干系数大于第二阈值时,则所述声音信号中存在人声;否则,所述声音信号中不存在人声;

27、结合对所述声音信号中是否存在风噪和人声的判断,确定所述声音信号的所在场景:当所述声音信号中存在风噪且不存在人声时,所述场景为纯风噪场景;当所述声音信号中不存在风噪且存在人声时,所述场景为纯人声场景;当所述声音信号中同时存在风噪和人声时,所述场景为风噪人声混合场景。

28、本发明实施例提供一种根据复相干系数判断声音信号的所在场景的方法,首先基于声音信号的频率分布以及预设的频率值将所述复相干系数分为低频的复相干系数和中高频的复相干系数,这是由于风噪的复相干系数相对语音而言较低,且其能量主要集中在低频,所以将复相干系数分频后可以更准确的识别风噪和语音信号,将声音信号所在场景分为三种场景,针对不同的场景进行不同的风噪处理,更针对性地提高用户的通话质量。

29、在一种可能实现的方式中,所述根据所述声音信号的所在场景,使用所述去风噪滤波器进行对应的降风噪处理,具体为:

30、当所述声音信号的所在场景为所述纯风噪场景时,通过所述去风噪滤波器对所述声音信号进行降风噪处理;

31、当所述声音信号的所在场景为所述纯人声场景时,不进行降风噪处理;

32、当所述声音信号的所在场景为所述风噪人声混合场景时,首先通过预设的波束形成算法对所述声音信号进行固定波束形成处理,然后通过所述去风噪滤波器对进行固定波束形成处理后的声音信号进行降风噪处理。

33、本发明实施例提供了对针三种场景的不同的风噪处理方法,当所述声音信号的所在场景为所述纯风噪场景时,可以直接进行降风噪处理,避免用户收听到无实际内容的杂音;当所述声音信号的所在场景为所述纯人声场景时,不进行降风噪处理,保留人声的真实度和清晰度,同时节约系统性能开销;当所述声音信号的所在场景为所述风噪人声混合场景时,基于波束形成算法区分声音信号中的风噪信号与人声信号,并使用预设的去风噪滤波器对风噪信号进行降风噪处理,而保留人声信号;通过这三种不同的处理方式,在保留语音信息的前提下抑制风噪,提高用户的通话质量。

34、第二方面,相应的,本发明实施例提供一种基于阵列麦克风的降风噪系统,包括获取模块、计算模块、判断模块、构建模块以及降噪模块;

35、其中,所述获取模块用于通过阵列麦克风获取声音信号;

36、所述计算模块用于根据所述声音信号计算所述阵列麦克风对应的复相干系数;

37、所述判断模块用于根据所述复相干系数,确定所述声音信号的所在场景,所述声音信号的所在场景包括纯风噪场景、纯人声场景或风噪人声混合场景;

38、所述构建模块用于根据所述复相干系数构建去风噪滤波器;

39、所述降噪模块用于根据所述声音信号的所在场景,使用所述去风噪滤波器进行对应的降风噪处理。

40、在一种可能实现的方式中,所述计算模块根据所述声音信号计算所述阵列麦克风对应的复相干系数,具体为:

41、从所述阵列麦克风中任意选取第一麦克风和第二麦克风;

42、根据所述第一麦克风的自功率谱密度、所述第二麦克风的自功率谱密度以及所述第一麦克风和第二麦克风的互功率谱密度计算所述第一麦克风和第二麦克风相互之间的复相干系数;

43、计算所述阵列麦克风中每个麦克风与其他麦克风之间的复相干系数并进行求和平均,获得所述阵列麦克风对应的复相干系数。

44、进一步的,所述根据所述第一麦克风的自功率谱密度、所述第二麦克风的自功率谱密度以及所述第一麦克风和第二麦克风的互功率谱密度计算所述第一麦克风和第二麦克风相互之间的复相干系数,具体公式为:

45、

46、其中,γij(ω,τ)为所述第一麦克风和第二麦克风相互之间的复相干系数,(ω,τ)为所述第一麦克风和第二麦克风的互功率谱密度,和分别为所述第一麦克风和所述第二麦克风的自功率谱密度,xi和xj分别表示所述第一麦克风和所述第二麦克风,ω表示频域单元,τ表示时间帧;

47、所述第一麦克风和第二麦克风的互功率谱密度是通过时间帧间的平滑进行计算:

48、

49、其中,γ是平滑系数,h是共轭转置符号,xi和xj分别表示所述第一麦克风和所述第二麦克风获取的声音信号。

50、进一步的,所述计算所述阵列麦克风中每个麦克风与其他麦克风之间的复相干系数并进行求和平均,获得所述阵列麦克风对应的复相干系数,具体公式为:

51、

52、其中,γ(ω,τ)为所述阵列麦克风对应的复相干系数,n为所述阵列麦克风中麦克风的数量。

53、在一种可能实现的方式中,所述判断模块根据所述复相干系数,确定所述声音信号的所在场景,具体为:

54、根据所述声音信号的频率分布,基于预设频率值将所述复相干系数分为低频的复相干系数和中高频的复相干系数;

55、当所述低频的复相干系数小于第一阈值时,则所述声音信号中存在风噪;否则,所述声音信号中不存在风噪;

56、当所述中高频的复相干系数大于第二阈值时,则所述声音信号中存在人声;否则,所述声音信号中不存在人声;

57、结合对所述声音信号中是否存在风噪和人声的判断,确定所述声音信号的所在场景:当所述声音信号中存在风噪且不存在人声时,所述场景为纯风噪场景;当所述声音信号中不存在风噪且存在人声时,所述场景为纯人声场景;当所述声音信号中同时存在风噪和人声时,所述场景为风噪人声混合场景。

58、在一种可能实现的方式中,所述降噪模块根据所述声音信号的所在场景,使用所述去风噪滤波器进行对应的降风噪处理,具体为:

59、当所述声音信号的所在场景为所述纯风噪场景时,通过所述去风噪滤波器对所述声音信号进行降风噪处理;

60、当所述声音信号的所在场景为所述纯人声场景时,不进行降风噪处理;

61、当所述声音信号的所在场景为所述风噪人声混合场景时,首先通过预设的波束形成算法对所述声音信号进行固定波束形成处理,然后通过所述去风噪滤波器对进行固定波束形成处理后的声音信号进行降风噪处理。


技术特征:

1.一种基于阵列麦克风的降风噪方法,其特征在于,包括:

2.如权利要求1所述的一种基于阵列麦克风的降风噪方法,其特征在于,所述根据所述声音信号计算所述阵列麦克风对应的复相干系数,具体为:

3.如权利要求2所述的一种基于阵列麦克风的降风噪方法,其特征在于,所述根据所述第一麦克风的自功率谱密度、所述第二麦克风的自功率谱密度以及所述第一麦克风和第二麦克风的互功率谱密度计算所述第一麦克风和第二麦克风相互之间的复相干系数,具体公式为:

4.如权利要求3所述的一种基于阵列麦克风的降风噪方法,其特征在于,所述计算所述阵列麦克风中每个麦克风与其他麦克风之间的复相干系数并进行求和平均,获得所述阵列麦克风对应的复相干系数,具体公式为:

5.如权利要求1所述的一种基于阵列麦克风的降风噪方法,其特征在于,所述根据所述复相干系数,确定所述声音信号的所在场景,具体为:

6.如权利要求1所述的一种基于阵列麦克风的降风噪方法,其特征在于,所述根据所述声音信号的所在场景,使用所述去风噪滤波器进行对应的降风噪处理,具体为:

7.一种基于阵列麦克风的降风噪系统,其特征在于,包括获取模块、计算模块、判断模块、构建模块以及降噪模块;

8.如权利要求7所述的一种基于阵列麦克风的降风噪系统,其特征在于,所述计算模块根据所述声音信号计算所述阵列麦克风对应的复相干系数,具体为:

9.如权利要求7所述的一种基于阵列麦克风的降风噪系统,其特征在于,所述判断模块根据所述复相干系数,确定所述声音信号的所在场景,具体为:

10.如权利要求7所述的一种基于阵列麦克风的降风噪系统,其特征在于,所述降噪模块根据所述声音信号的所在场景,使用所述去风噪滤波器进行对应的降风噪处理,具体为:


技术总结
本发明提供了一种基于阵列麦克风的降风噪方法及系统,所述方法包括:通过阵列麦克风获取声音信号;根据所述声音信号计算所述阵列麦克风对应的复相干系数;根据所述复相干系数,确定所述声音信号的所在场景,所述声音信号的所在场景包括纯风噪场景、纯人声场景或风噪人声混合场景;根据所述复相干系数构建去风噪滤波器;根据所述声音信号的所在场景,使用所述去风噪滤波器进行对应的降风噪处理。本发明所提出的一种基于阵列麦克风的降风噪方法及系统,能够有效地判断风噪,并在保留语音信息的前提下抑制风噪,提高用户的通话质量。

技术研发人员:邱志豪
受保护的技术使用者:厦门亿联网络技术股份有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1823714.html

最新回复(0)