本发明涉及音频处理,更具体的说是涉及一种适用于麦克风矩阵的定向收音系统。
背景技术:
1、麦克风是一种常见的声音输入设备,通过声波转换为电信号,并传输给其他设备进行处理,其包括声波的捕捉、声波的转换和电信号的传输,声波通过感应器的振动被捕捉,然后转换为电信号,最后通过有线或无线方式传输给其他设备进行处理。
2、现有公告号为cn217741870u的中国专利公开了一种矩阵式多麦克风收发装置,包括收发器,所述收发器的外侧卡接有多个夹块,每个所述夹块通过一个连接机构连接有一个固定圆块,所述固定圆块的中部开设有通孔,所述固定圆块的下方设置有固定罩.所述固定罩的底部套接有吸盘,所述吸盘顶部的中心处固定连接有螺纹杆,所述螺纹杆依次穿过固定罩和通孔的一端与限位环的内部螺纹连接,所述夹块可由固定夹和分别与固定夹两端固定连接的两个弧形片构成。
3、上述现有技术中虽然公开了通过多麦克风进行矩阵分布,实现对声音的矩阵式收集并处理,但是现有技术中的矩阵式麦克风是通过多个麦克风进行收集,单个的麦克风容易出现杂音对麦克风的影响,并且对声音的收集容易出现不定向收集造成的杂音干扰,对此本发明提供一种能够进行定向收音的矩阵式麦克风定向收音系统进行定向集束收音。
技术实现思路
1、针对现有技术存在的不足,本发明的目的在于提供一种适用于麦克风矩阵的定向收音系统,具有通过矩阵设置的麦克风进行定向收音并通过算法过滤其他杂音,达到定向集束收音的效果。
2、为实现上述目的,本发明提供了如下技术方案:
3、一种适用于麦克风矩阵的定向收音系统,包括收音控制系统,所述收音控制系统配置于处理器内,所述处理器设置于收音板中,所述收音板包括基板和盖板,所述盖板用于封盖基板,所述盖板上形成有采集孔,所述采集孔呈矩阵阵列设置,所述采集孔中设置有麦克风单元,所述麦克风单元用于采集音频数据,所述收音控制系统内配置有定向收音的收音运维方法,所述收音运维方法包括以下步骤:
4、s1:通过麦克风单元采集收音板周边环境的音频数据,对需要采集的目标音频和需要过滤的噪音音频进行收集采样,并构建系统级的音频过滤模型;
5、s2:确定系统级音频过滤模型中的噪音音频及运维模型;
6、s3:改进并行多智体深度网络以改进运维模型,并以精度损失提高整体音频过滤模型的伸缩性,以使在复杂的多元音频环境下的对音频数据进行定向收音。
7、作为本发明的进一步改进,所述步骤s2还包括以下步骤:
8、s2.1:对音频过滤模型进行搭建;
9、s2.2:对系统级顺序噪音进行优化;
10、s2.3:引入所述具有per的双层深度q网络;
11、s2.4:多智能体强化学习的因式分解。
12、作为本发明的进一步改进,所述音频过滤模型搭建的过程包括:
13、s2.1.1:引入有限时间半马尔科夫决策过程,用以描述所述收音控制系统设备的噪音;所述收音控制系统状态信息通过被所述麦克风单元监测而确定后,所述收音控制系统的qos损失可由最大流量算法计算得出,为初始系统状态下当前最大流量容量与最大流量容量的差值;
14、s2.1.2:基于所述系统状态信息,所述智能体在t时刻为组件i∈[1,n]从“无动作(n)”和“恢复收集状态(r)”两个运维操作中选择一个实行,由所述收音控制系统状态确定系统级操作,以定义系统级状态转移概率;
15、s2.1.3:引入加权求和公式方法将所述收音控制系统整体噪音的多目标函数转化为单目标函数。
16、作为本发明的进一步改进,所述系统级顺序维护进行优化时,所述智能体根据所述收音控制系统状态来确定行动决策,以最小化所述收音控制系统在其生命周期的全部贴现噪音,通过不断选择使得所述贴现噪音的最小值的最优决策来更新q值。
17、作为本发明的进一步改进,引入迭代方程,以所述迭代方程更新最小化q值,并引入了两个参数化的深度q网络来近似q值,所述深度q网络包括在线网络和目标网络,引入优先级经验回放方法,并通过时间差异误差来评估经验前后预期q值之间的差异。
18、作为本发明的进一步改进,所述在线网络和所述目标网络分别用于行动选择和q值评估,且所述目标网络的参数每隔α步长就会更新为所述在线网络的参数
19、并通过结合计算损失函数值和梯度下降更新所述在线网络参数。
20、作为本发明的进一步改进,使用所述具有per的双层深度q网络算法进行q值计算时,引入社区检测算法,将多个所述智能体分配给由总噪音函数分解出的分散噪音函数,并使所述智能体同步在多个处理单元中探索不同超参值下的所述分散成本最小化策略,称为并行多智能体双层深度q网络。
21、作为本发明的进一步改进,所述步骤s3还包括以下步骤:
22、s3.1:引入所述newman-fast算法将所述收音控制系统系统分解为m个所述子系统,并给每个子系统分配一个所述智能体来学习所述子系统的运维策略;
23、s3.2:引入预定义函数,通过多智能体信用分配将所述总噪音函数分解成各所述子系统的所述分散噪音函数,并根据所述预定义函数将所述总成本分配给所述子系统;
24、s3.3:引入并行处理方法,将处理单元分为五组,每组中的所述超参数取值不同并且各自使用ε-贪婪算法同时探索最优分散策略。
25、作为本发明的进一步改进,所述newman-fast算法将所述系统拓扑图中的每个顶点设为一个独立的簇,每次迭代选择产生最大模块度的两个簇进行合并,直至整个网络合并成一个簇;
26、整个合并过程得到自底向上的树图,从所述树图的所有层次划分中选择所述模块度最大的划分作为所述社区检测的结果。
27、作为本发明的进一步改进,所述并行处理超参调优时,在训练一周期后,通过预期生命周期成本来判断基于当前所述超参数值的决策的优越性;
28、在下一周期开始前,所有所述处理单元的所述在线网络参数和所述目标网络参数与上一周期中最优性能表现的所述参数同步,通过同步,接近所述最优策略而未被探索到的策略会被传播到其他所述处理单元。
29、本发明的有益效果:
30、通过对整体收音控制系统进行社区划分,并基于超参数的调整对划分后的子系统中噪音进行确定,由于对整体麦克风单元的矩阵进行了子社区的划分后的噪音确定,从而能够定向对噪音进行剔除,以获得在进行收音时能够获取定向的音频数据,使用半马尔可夫决策过程确定对噪音的运维策略,来评估系统的噪音程度。由于状态和行动空间的数量呈指数级增长,半马尔可夫决策过程存在误差。对此,利用多智能体深度强化学习框架,以克服在复杂且多源音频维数的问题。采用分治策略,通过使用适用于收音控制系统环境的大规模场景的newman-fast算法来进行社区检测,识别多个子系统,每个智能体学习实现相应子系统的噪音运维策略。智能体建立策略以最小化子系统的分散噪音训练策略定期与最佳策略同步,从而改进了噪音提取的主策略,达到提取噪音并剔除以进行定向收音的效果。
1.一种适用于麦克风矩阵的定向收音系统,其特征在于:
2.根据权利要求1所述的一种适用于麦克风矩阵的定向收音系统,其特征在于:所述步骤s2还包括以下步骤:
3.根据权利要求2所述的一种适用于麦克风矩阵的定向收音系统,其特征在于:所述音频过滤模型搭建的过程包括:
4.根据权利要求3所述的一种适用于麦克风矩阵的定向收音系统,其特征在于:所述系统级顺序维护进行优化时,所述智能体根据所述收音控制系统状态来确定行动决策,以最小化所述收音控制系统在其生命周期的全部贴现噪音,通过不断选择使得所述贴现噪音的最小值的最优决策来更新q值。
5.根据权利要求4所述的一种适用于麦克风矩阵的定向收音系统,其特征在于:引入迭代方程,以所述迭代方程更新最小化q值,并引入了两个参数化的深度q网络来近似q值,所述深度q网络包括在线网络和目标网络,引入优先级经验回放方法,并通过时间差异误差来评估经验前后预期q值之间的差异。
6.根据权利要求5所述的一种适用于麦克风矩阵的定向收音系统,其特征在于:所述在线网络和所述目标网络分别用于行动选择和q值评估,且所述目标网络的参数每隔α步长就会更新为所述在线网络的参数θk;
7.根据权利要求6所述的一种适用于麦克风矩阵的定向收音系统,其特征在于:使用所述具有per的双层深度q网络算法进行q值计算时,引入社区检测算法,将多个所述智能体分配给由总噪音函数分解出的分散噪音函数,并使所述智能体同步在多个处理单元中探索不同超参值下的所述分散成本最小化策略,称为并行多智能体双层深度q网络。
8.根据权利要求7所述的一种适用于麦克风矩阵的定向收音系统,其特征在于:所述步骤s3还包括以下步骤:
9.根据权利要求8所述的一种适用于麦克风矩阵的定向收音系统,其特征在于:所述newman-fast算法将所述系统拓扑图中的每个顶点设为一个独立的簇,每次迭代选择产生最大模块度的两个簇进行合并,直至整个网络合并成一个簇;
10.根据权利要求9所述的一种适用于麦克风矩阵的定向收音系统,其特征在于:所述并行处理超参调优时,在训练一周期后,通过预期生命周期成本来判断基于当前所述超参数值的决策的优越性;