一种音响参数确定方法和系统与流程

专利2022-05-09  95


分案说明

本申请是2020年12月28日提交的的题为“一种音响参数确定方法和系统”的中国专利申请cn202011572703.3的分案申请。

本说明书涉及音响领域,特别涉及一种音响参数确定方法和系统。



背景技术:

随着线下服务业的快速发展,音响的应用越来越广泛。在使用时,用户可以通过调节音响的音响参数,以获得更好的听音体验。然而,大多数音响只具有基础的调节功能,在确定音响参数时未考虑各种影响因素,例如,音响所在的环境因素、位置与角度因素等。另外,大部分用户也不具备自主调节音响参数的专业性,以及准确确定音响参数的专业听音环境。导致对音响参数的确定不够全面、不够准确,难以获得较优的音效,从而影响用户的听音体验。

因此,需要提供一种音响参数确定方法和系统,提高音响参数确定的全面性和准确性,提升音响的音效,为用户提供优质的听音体验。



技术实现要素:

本说明书实施例之一提供一种音响参数确定方法,所述方法包括:获取放置目标音响的目标空间的全景图像,所述目标音响具有led灯,所述全景图像在所述led灯点亮情况下拍摄得到;获取所述目标空间的听音位置;对所述全景图像进行分析,包括:通过识别所述全景图像中所述目标音响的led灯的形状或位置,识别所述目标音响的位置;基于所述听音位置与所述目标音响的位置,识别所述听音位置与所述目标音响之间的第一距离和第一角度;识别所述目标空间中的放置物的位置、目标空间的大小、目标空间的墙面材料;基于所述全景图像的分析结果,确定所述目标音响的增益,包括:将所述目标音响的位置、所述听音位置与所述目标音响之间的第一距离和第一角度,以及所述放置物的位置、目标空间的大小、目标空间的墙面材料,输入至已训练好的音响参数配置模型,输出得到所述目标音响的增益。

本说明书实施例之一提供一种音响参数确定系统,所述系统包括:第一获取模块,用于获取放置目标音响的目标空间的全景图像,所述目标音响具有led灯,所述全景图像在所述led灯点亮情况下拍摄得到;第二获取模块,用于获取所述目标空间的听音位置;分析模块,用于对所述全景图像进行分析,所述分析模块包括:第一识别模块,用于通过识别所述全景图像中所述目标音响的led灯的形状或位置,识别所述目标音响的位置;第二识别模块,用于基于所述听音位置与所述目标音响的位置,识别所述听音位置与所述目标音响之间的第一距离和第一角度;第三识别模块,用于识别所述目标空间中的放置物的位置、目标空间的大小、目标空间的墙面材料;第一确定模块,用于基于所述全景图像的分析结果,确定所述目标音响的增益,包括:将所述目标音响的位置、所述听音位置与所述目标音响之间的第一距离和第一角度,以及所述放置物的位置、目标空间的大小、目标空间的墙面材料,输入至已训练好的音响参数配置模型,输出得到所述目标音响的增益。

本说明书实施例之一提供一种计算机可读存储介质,所述存储介质存储计算机指令,当所述计算机指令被处理器执行时实现如上方法。

附图说明

本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:

图1是根据本说明书的一些实施例所示的音响调节系统的应用场景图;

图2是根据本说明书的一些实施例所示的音响参数确定方法的示例性流程图;

图3是根据本说明书的另一些实施例所示的音响参数确定方法的示例性流程图;

图4是根据本说明书的一些实施例所示的确定目标音响的增益的示例性流程图;

图5是根据本说明书的一些实施例所示的音响参数确定系统的模块图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。

应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。

如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。

本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。

图1是根据本说明书的一些实施例所示的音响调节系统的应用场景图。在示例性应用场景中,音响调节系统100可以包括服务器110、处理器120、存储设备130、用户终端140、网络150。

在一些实施例中,音响调节系统100可以用于确定音响参数。音响调节系统100可以应用于各种使用音响的线下场景。例如,住宅居室、餐厅、咖啡厅、商场、演出舞台、电影院等。音响调节系统100可以通过实施本说明书中披露的方法和/或过程来确定音响的最优音响参数,为用户提供最优质的听音效果,提升用户的听音体验。

在一些实施例中,可以通过用户终端140获取上述场景的多张图像和/或由用户输入的听音位置,经服务器110处理后确定音响的最优音响参数。服务器110在处理时可以获取存储设备130上的数据或将数据保存到存储设备130,也可以通过网络150从其他来源读取数据和将数据输出到其他目标对象。在一些实施例中,至少部分确定音响参数的处理操作可以在用户终端140上进行。本说明书中的操作可以通过处理器120执行程序指令进行。上述方式仅为方便理解,本系统亦可以其他可行的操作方式实施本说明书中的方法。

在一些实施例中,服务器110、用户终端140以及其他可能的系统组成部分中可以包括存储设备130。

在一些实施例中,服务器110、用户终端140以及其他可能的系统组成部分中可以包括处理器120。

服务器110可以用于管理资源以及处理来自本系统至少一个组件或外部数据源(例如,云数据中心)的数据和/或信息。在一些实施例中,服务器110可以是单一服务器或服务器组。该服务器组可以是集中式或分布式的(例如,服务器110可以是分布式系统),可以是专用的也可以由其他设备或系统同时提供服务。在一些实施例中,服务器110可以是区域的或者远程的。在一些实施例中,服务器110可以在云平台上实施,或者以虚拟方式提供。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。

处理器120可以处理从其他设备或系统组成部分中获得的数据和/或信息。处理器120可以基于这些数据、信息和/或处理结果执行程序指令,以执行一个或多个本说明书中描述的功能。在一些实施例中,处理器120可以包含一个或多个子处理设备(例如,单核处理设备或多核多芯处理设备)。仅作为示例,处理器120可以包括中央处理器(cpu)、专用集成电路(asic)、专用指令处理器(asip)、图形处理器(gpu)、物理处理器(ppu)、数字信号处理器(dsp)、现场可编程门阵列(fpga)、可编辑逻辑电路(pld)、控制器、微控制器单元、精简指令集电脑(risc)、微处理器等或以上任意组合。

存储设备130可以用于存储数据和/或指令。存储设备130可以包括一个或多个存储组件,每个存储组件可以是一个独立的设备,也可以是其他设备的一部分。在一些实施例中,存储设备130可包括随机存取存储器(ram)、只读存储器(rom)、大容量存储器、可移动存储器、易失性读写存储器等或其任意组合。示例性的,大容量储存器可以包括磁盘、光盘、固态磁盘等。在一些实施例中,所述存储设备130可在云平台上实现。

数据指对信息的数字化表示,可以包括各种类型,比如声音数据、二进制数据、文本数据、图像数据、视频数据等。指令指可控制设备或器件执行特定功能的程序。

用户终端140指用户所使用的一个或多个终端设备或软件。在一些实施例中,使用用户终端140的可以是一个或多个用户,可以包括直接使用音响听音服务的用户,也可以包括其他相关用户。在一些实施例中,用户终端140可以是移动设备140-1、平板计算机140-2、膝上型计算机140-3、台式计算机140-4等其他具有输入和/或输出功能的设备中的一种或其任意组合。在一些实施例中,移动设备140-1可包括可穿戴设备和智能移动设备等或其任意组合。在一些实施例中,智能移动设备可以包括智能电话、个人数字助理(pda)、游戏设备、导航设备、手持终端(pos)等或其任意组合。在一些实施例中,台式计算机140-4可以是小型计算机、电视等。

在一些实施例中,其他具有输入和/或输出功能的移动设备140-1可包括设置在公共场所或家庭环境的音响控制终端。在一些实施例中,用户可以是指住宅拥有者、音响使用者或其他服务请求者。

上述示例仅用于说明所述用户终端140设备范围的广泛性而非对其范围的限制。

网络150可以连接系统的各组成部分和/或连接系统与外部资源部分。网络150使得各组成部分之间,以及与音响调节系统100之外其他部分之间可以进行通讯,促进数据和/或信息的交换。在一些实施例中,网络150可以是有线网络或无线网络中的任意一种或多种。例如,网络150可以包括电缆网络、光纤网络、电信网络、互联网、局域网络(lan)、广域网络(wan)、无线局域网络(wlan)、城域网(man)、公共交换电话网络(pstn)、蓝牙网络、紫蜂网络(zigbee)、近场通信(nfc)、设备内总线、设备内线路、线缆连接等或其任意组合。各部分之间的网络连接可以是采用上述一种方式,也可以是采取多种方式。在一些实施例中,网络可以是点对点的、共享的、中心式的等各种拓扑结构或者多种拓扑结构的组合。在一些实施例中,网络150可以包括一个或以上网络接入点。例如,网络150可以包括有线或无线网络接入点,例如基站和/或网络交换点150-1、150-2、…,通过这些点进出音响调节系统100的一个或多个组件可连接到网络150上以交换数据和/或信息。

图2是根据本说明书的一些实施例所示的音响参数确定方法的示例性流程图。如图2所示,该流程200可以由处理器120执行。

步骤210,获取放置目标音响的目标空间的图像。在一些实施例中,步骤210可以由第一获取模块510执行。

目标音响是指待确定参数的音响设备。在一些实施例中,目标音响可以包括一个或多个音箱,或以各种组合方式排列的音响设备。在一些实施例中,目标音响可以是家庭影院中的一个或多个音响的组合。例如,目标音响可以包括2个前置音箱、2个后置音箱、1个中置环绕音箱、1个重低音炮音箱中的一个或多个。又例如,5.1音响。

目标空间是指放置目标音响的场景所在空间。例如,住宅的居室、餐厅的等候区、电影院的放映厅等。

在一些实施例中,图像可以是上述目标空间的多张图像。其中,上述多张图像中的至少两张图像可以包含一个或多个相同的元素。例如,包含相同的物体或其一部分和/或相同的目标空间的基准线等。

全景图像是指以照片形式存在的广角图像。全景图像可以显示目标空间和/或其中的物体的信息。例如,全景图像可以反映出目标音响在目标空间的放置位置、目标空间中其他物体的位置、目标空间的尺寸等信息。在一些实施例中,处理设备(例如,处理器120)可以对全景图像的上述信息进行分析,并根据分析结果确定目标音响的参数。关于根据全景图像的分析结果确定目标音响的参数的更多细节,可以参见图3及其相关描述,此处不再赘述。

第一获取模块510可以通过多种方式获取放置目标音响的目标空间的图像。在一些实施例中,第一获取模块510可以通过网络150从用户终端140中获取放置目标音响的目标空间的图像。例如,用户终端140可以通过图像采集设备(例如,摄像头)拍摄图像,以网络传输的方式供第一获取模块510获取。在一些实施例中,用户可以通过用户终端140拍摄放置目标音响的目标空间的多张图像。其中,拍摄到的上述多张图像中的至少两张图像可以包含至少一个相同的元素,以便于通过上述多张图像计算目标空间的尺寸。

在一些实施例中,第一获取模块510可以从服务器110中获取放置目标音响的目标空间的图像。例如,用户可以将拍摄的图像上传至服务器110供第一获取模块510获取。在一些实施例中,第一获取模块510可以从存储设备130中获取放置目标音响的目标空间的图像。例如,用户可以将拍摄的图像存储至存储设备130中供第一获取模块510获取。在一些实施例中,第一获取模块510可以获取预存在网络150的存储空间中的图像。例如,第一获取模块510可以获取云存储空间中的图像。

步骤220,获取所述目标空间的听音位置。在一些实施例中,步骤220可以由第二获取模块520执行。

听音位置是指用户收听目标音响时所处的位置。听音位置可以是一个或多个。在一些实施例中,听音位置可以是用户在目标空间中的实时位置。实时位置可以是用户在当前时刻位于空间坐标系的坐标位置。仅作为示例,第一时刻用户在目标空间中的坐标位置为a,第二时刻用户在目标空间中的坐标位置为b,则实时位置a和实时位置b均为用户的听音位置。

在一些实施例中,听音位置可以是用户在目标空间中的常用位置。常用位置可以是用户在目标空间中常出现的位置。以家庭影院场景为例,常用位置可以是用户的就坐位置。以餐厅服务场景为例,常用位置可以是用户在餐厅等候区的位置,也可以是用户在餐厅用餐区的位置。需要说明的是,还可以将上述场景中用户使用的物体位置确定为听音位置。例如,家庭影院中的某个沙发处、餐厅等候区或餐厅用餐区的某个椅子处的坐标位置确定为听音位置,以提高确定听音位置的精度。在一些实施例中,第二获取模块520可以通过多种方式获取目标空间的听音位置。在一些实施例中,处理器120可以从存储设备130存储的图像(例如,全景图像)中获取目标空间的听音位置。例如,处理器120可以从全景图像中确定用户在目标空间中的一个或多个常用位置,并将上述常用位置确定为目标空间的听音位置。又如,处理器120可以通过分析全景图像的布局信息,或分析全景图像中某些特定物品(例如,桌子、座椅等)的位置,来自动识别听音位置。关于目标空间的布局信息的更多细节可以参见步骤230及其相关描述,此处不再赘述。

在一些实施例中,第二获取模块520也可以通过用户终端140获取目标空间的听音位置。例如,第二获取模块520可以通过网络150从服务器110中获取用户终端140在目标空间的实时位置,并将该实时位置确定为目标空间的听音位置。又如,第二获取模块520可以通过网络150从服务器110中获取用户终端140输入或在应用程序界面中点选的听音位置。以家庭影院场景为例,用户可以通过用户终端140的应用程序获取拍摄图像的提示,通过用户终端140的摄像头拍摄一张或多张当前场景的图像并上传至该应用程序,用户可以根据上述图像在应用程序中输入或点选至少一个听音位置供第二获取模块520获取。

步骤230,基于所述图像,识别所述目标空间的布局信息。在一些实施例中,步骤230可以由分析模块530执行。

布局信息是指目标空间中布局的物体相关信息。在一些实施例中,布局信息可以包括但不限于目标音响的位置、听音位置与目标音响之间的距离、目标空间中的放置物的位置、放置物的材质、放置物的形状、放置物的尺寸、目标空间的尺寸、目标空间的驻波、目标空间的混响、目标音响的灵敏度、目标音响的增益公式等。

在一些实施例中,分析模块530可以通过多种方式识别目标空间的布局信息。在一些实施例中,分析模块530可以通过机器学习模型和/或结合相关算法识别目标空间的布局信息。其中,机器学习模型可以包括但不限于卷积神经网络(convolutionalneuralnetworks,cnn)、长短期记忆(longshort-termmemory,lstm)模型等。相关算法可以包括但不限于layoutnet、flat2layout、e2p、几何算法、深度信息算法等。关于识别目标空间的布局信息的更多细节,可以参见图3及其相关描述,此处不再赘述。

目标音响的位置是指目标音响在目标空间中的放置位置。在一些实施例中,分析模块530可以通过图像识别技术识别出目标音响的位置。在一些实施例中,分析模块530可以通过卷积神经网络(convolutionalneuralnetworks,cnn)从图像中提取目标音响的特征,该特征在图像中的位置即为目标音响的位置。关于识别目标音响的位置的更多细节可以参见图3及其相关描述,此处不再赘述。

在一些实施例中,分析模块530可以通过多种方式识别听音位置与目标音响之间的距离。在一些实施例中,分析模块530可以通过图像识别技术识别出听音位置与目标音响之间的距离。在一些实施例中,分析模块530可以通过卷积神经网络(convolutionalneuralnetworks,cnn)从景图像中提取目标音响和听音位置的特征,并根据上述特征确定两者之间的基线,结合图像的比例可以确定该基线在实景中对应的实际长度,将该实际长度确定为听音位置与目标音响之间的距离。

在一些实施例中,处理设备(例如,处理器120)可以计算两者在目标空间中的坐标差值,得出听音位置与目标音响之间的距离。关于识别听音位置与目标音响之间的距离的更多细节,可以参见图3及其相关描述,此处不再赘述。

放置物是指目标空间中放置的物体,例如,沙发、桌椅、窗帘、挂画等家具或装饰物。在一些实施例中,分析模块530可以通过图像识别技术识别出放置物的位置。在一些实施例中,分析模块530可以通过卷积神经网络(convolutionalneuralnetworks,cnn)从图像中提取放置物的特征,该特征在图像中的位置即为放置物的位置。在一些实施例中,卷积神经网络可以通过预设的算法提取放置物的特征。例如,ssd算法(singleshotmultiboxdetector)。

放置物的材料、形状和尺寸可以影响目标音响的参数。例如,采用吸音材质的放置物可以吸收目标音响的声波,从而会减小目标音响的音质和音量等音响参数。又例如,形状不规则或尺寸较大的放置物会阻碍目标音响的声波传递,从而会减弱目标音响的环绕声效和立体声效等音响参数。

驻波是指两个波长、周期、频率和波速皆相同的正弦波相向行进干涉而成的合成波。目标空间的驻波会使目标音响发出的部分声波减弱,从而降低用户的听音体验。目标空间的驻波与目标空间的尺寸相关。例如,目标空间的尺寸越大,则目标空间的驻波的临界频率越小,驻波对目标音响的影响越小。

混响是指声源发音停止后声音继续存在的声学现象。目标空间的混响会影响目标音响的音质。目标空间的混响与目标空间的尺寸、目标空间的材质有关。

目标音响的灵敏度是指当音响的功放达到满功率输出时,在输入端的信号电压大小。信号电压越大,则灵敏度越低。音响的灵敏度通常用于反映人耳主观感受的声音大小。音响的灵敏度高,用户感受音响的声音越大,但是过高的灵敏度会损害音响的音质,因此音响的灵敏度大小应控制在合理的范围才能为用户带来优质的听音体验。

目标音响的增益公式是指确定目标音响的增益过程中所用到的公式。在一些实施例中,目标音响的增益公式可以为确定目标音响的最大电压容量公式。其中,通过确定目标音响的最大电压容量可以对目标音响进行保护。

步骤240,基于所述布局信息,确定所述目标音响的参数,所述参数包括所述目标音响的增益。在一些实施例中,步骤240可以由第一确定模块540执行。

目标音响的增益是指目标音响的信号放大率。例如,较小输出电压经过放大器放大变为较大输出电压的放大率。

在一些实施例中,第一确定模块540可以根据布局信息确定目标音响的多个候选增益,并从上述多个候选增益确定目标音响的增益。目标音响的增益可以决定目标音响在同等音量下获得更好的音质提升。在一些实施例中,目标音响的增益可以通过相应的均衡器(eq)来确定、调整。

在一些实施例中,目标音响的参数可以包括但不限于目标音响的增益、目标音响的输出功率和目标音响的延迟等。在一些实施例中,第一确定模块540可以通过多种方式确定目标音响的参数。在一些实施例中,第一确定模块540可以基于机器学习模型确定目标音响的参数。在一些实施例中,第一确定模块540可以通过目标音响的初始参数,确定目标音响的参数。在一些实施例中,目标音响的初始参数可以包括但不限于目标音响的增益、目标音响的输出功率和目标音响的延时中的一个或多个。在一些实施例中,第一确定模块540可以基于目标音响的初始参数和/或全景图像的分析结果确定目标音响的参数。

关于确定目标音响的参数的更多细节,可以参见图3和图4及其相关描述,此处不再赘述。

由于目标空间的布局信息会影响目标音响的参数。例如,若目标音响的周围存在数量较多的放置物,会阻碍目标音响的声波传递,影响用户的听音效果。因此,通过识别目标空间的布局信息能够更全面、准确地确定目标音响的参数,从而为用户提供更优质的听音效果。

图3是根据本说明书的另一些实施例所示的音响参数确定方法的示例性流程图。如图3所示,该流程300可以由处理器120执行。

步骤310,获取放置目标音响的目标空间的全景图像。在一些实施例中,步骤310可以由第一获取模块510执行。

在一些实施例中,目标音响具有一个或多个led灯。其中,led灯可以是目标音响的功能指示灯,也可以是目标音响的外观装饰灯。

在一些实施例中,全景图像在led灯点亮情况下拍摄得到。由于点亮状态的led灯可以不受目标空间中光线明暗程度的影响,在全景图像中具有较高分辨率和外形轮廓清晰的显示效果。因此,其可以帮助处理设备(例如,处理器120)更好地识别出目标音响的位置,有利于后续全面、准确地确定目标音响的参数。

在一些实施例中,第一获取模块510可以从移动终端获取所述目标空间的多张图像。移动终端可以为用户终端140。在一些实施例中,移动终端可以通过图像采集设备(例如,摄像头)拍摄目标空间的多张图像。在一些实施例中,多张图像可以来自目标空间的不同位置。例如,用户可以在目标空间中的不同位置拍摄多张包含目标空间的相同元素的图像,或选取上述图像中拍摄质量最好的一张或几张图像供第一获取模块510获取。在一些实施例中,多张图像可以来从目标空间的同一位置进行拍摄。例如,用户可以在目标空间的同一位置以不同的角度拍摄多张图像供第一获取模块510获取。

在一些实施例中,第一获取模块510可以从存储设备130中,或通过网络150从云存储空间中获取移动终端存储的多张图像。在一些实施例中,第一获取模块510可以基于多张图像,获得全景图像。在一些实施例中,第一获取模块510可以通过图像处理设备(例如,处理器120)对目标空间的多张图像进行排列组合,将上述排列组合中符合条件的多张图像进行拼接,获得目标空间的全景图像。

在一些实施例中,第一获取模块510可以从存储设备130中,或通过网络150从云储存空间中获取移动终端拍摄或存储的全景图像。

关于获取全景图像的更多细节可以参见图2及其相关描述,此处不再赘述。

步骤320,获取所述目标空间的听音位置。在一些实施例中,步骤320可以由第二获取模块520执行。

在一些实施例中,第二获取模块520可以从移动终端获取由用户输入的所述听音位置。在一些实施例中,用户输入至移动终端的听音位置可以包括多种类型。例如,用户的常用听音位置点选听音位置或喜好听音位置等。在一些实施例中,用户输入至移动终端的听音位置可以为一个,也可以为多个。其中,多个听音位置的类型可以为同一种,也可以为多种。

在一些实施例中,第二获取模块520可以从存储设备130中,或通过网络150从云存储空间中获取用户输入的听音位置。在一些实施例中,处理设备(例如,处理器120)可以对用户输入至移动终端的听音位置进行记录,并以历史数据的形式存储至存储设备130中,第二获取模块520可以从该历史数据中获取用户输入的听音位置。关于从移动终端中获取用户输入的听音位置的更多细节,可以参见图2及其相关描述,此处不再赘述。

通过上述描述可知,第二获取模块520可以无需对全景图像进行识别,更快地获取用户输入至移动终端的多种、多个听音位置,从而能够通过上述听音位置更全面、更准确地确定音响参数,为用户提供更优质的听音体验。

步骤330,对所述全景图像进行分析。在一些实施例中,步骤330可以由分析模块530执行。在一些实施例中,步骤330还可以包括以下步骤。

步骤331,通过识别所述全景图像中所述目标音响的led灯的形状或位置,识别所述目标音响的位置。在一些实施例中,步骤331可以由第一识别模块531执行。

目标音响的led灯能够帮助第一识别模块531从目标空间的全景图像中准确地识别目标音响。在一些实施例中,第一识别模块531可以识别目标音响的led灯的形状。在一些实施例中,第一识别模块531可以根据led灯的预设参数识别led灯的形状。其中,预设参数可以包括led灯的图案led灯的尺寸、led灯的颜色等。在一些实施例中,处理设备(例如,处理器120)可以基于led灯的预设参数从全景图像中提取出led灯的特征,第一识别模块531可以根据该特征识别led灯的形状。在一些实施例中,处理设备(例如,处理器120)可以基于目标空间的全景图像通过机器学习模型识别出led灯的形状。在一些实施例中,第一识别模块531可以识别目标音响的led灯的位置。在一些实施例中,处理设备(例如,处理器120)可以从全景图像中提取多个led灯的特征,第一识别模块531可以获取上述多个特征的连接形成的基线,并根据该基线确定led灯在全景图像中的位置。

在一些实施例中,第一识别模块531可以通过识别全景图像中目标音响的led灯的形状或位置,识别目标音响与全景图像的拍摄者之间的第二距离。第二距离即为拍摄者与目标音响的相对距离。在一些实施例中,处理设备(例如,处理器120)可以根据全景图像确定拍摄者的位置,并确定该位置与led灯的位置连接形成的基线。在一些实施例中,第一识别模块531可以结合全景图像的比例,根据该基线确定第二距离的长度。仅作为示例,全景图像的比例为1:20,上述基线的长度为5cm。如此,则第二距离的长度为100cm。

在一些实施例中,第一识别模块531可以基于第二距离,确定目标音响的位置。仅作为示例,假设拍摄者的位置坐标为坐标原点,第二距离为100cm。如此,则表示目标音响与拍摄者的位置的相对距离为100cm,第一识别模块531可以根据该相对距离计算得出目标音响的坐标,进而可以得出目标音响的位置。

由于led灯的形状和尺寸相较于目标音响的形状和尺寸更简单,并且根据前述可知点亮状态下的led灯在全景图像中的轮廓更清晰、显示的分辨率更高,因此通过识别目标音响的led灯可以更快速、更准确地识别出目标音响的位置,从而能够提升后续目标音响参数确定的效率和准确性。

步骤332,基于所述听音位置与所述目标音响的位置,识别所述听音位置与所述目标音响之间的第一距离和第一角度。在一些实施例中,步骤332可以由第二识别模块532执行。

在一些实施例中,第二识别模块532可以根据听音位置与目标音响的位置确定两者在全景图像中连接的基线,并根据该基线的长度结合全景图像的比例确定第一距离。需要说明的是,当目标音响为多个时,第二识别模块532可以根据听音位置与多个目标音响在全景图像中连接的基线,确定听音位置与目标音响之间的多个第一距离。

关于识别第一距离的更多细节可以参见步骤331中识别第二距离的相关描述,此处不再赘述。

在一些实施例中,第二识别模块532可以通过离轴曲线识别听音位置与目标音响之间的第一角度。离轴曲线是指音响偏离轴线时的频率响应曲线。其中,轴线是指音响与听音位置处于0°时的连线。离轴曲线可以反映声音的量化表现。在一些实施例中,离轴曲线可以是预设的。具体的,可以通过对目标音响进行预先测量的方式得到数据,基于得到的数据绘制离轴曲线。例如,以输出的声压级和频率为轴,绘制出20-22khz内声音输出情况的离轴曲线。

可以理解,第二识别模块532可以先识别出目标音响在特定频率(例如,20-22khz)下对听音位置输出的声压级,再根据预设的离轴曲线对该输出的声压级进行对比,进而识别出听音位置与目标音响的第一角度。

需要说明的是,由于高频信号的指向性,当目标音响与听音位置的角度为0°时(称之为在轴),用户听到的高音相对于其他角度(离轴)更清晰、更准确。也就是说,离轴角度越大,音响发出的高音部分量感越少。因此可以基于上述属性,预设针对离轴的均衡器,即,离轴eq。

在一些实施例中,处理设备(例如,处理器120)可以通过离轴eq确定目标音响的增益。具体的,离轴eq可以对不同离轴角度下的目标音响发出的高音进行调整,以确保离轴的目标音响的音质尽可能地接近于在轴的状态。

步骤333,识别所述目标空间中的放置物的位置、目标空间的大小、目标空间的墙面材料。在一些实施例中,步骤333可以由第三识别模块533执行。

在一些实施例中,第三识别模块533可以根据处理设备(例如,处理器120)提取的放置物的特征识别放置物的位置。关于识别放置物的位置的更多细节可以参见图2及其相关描述,此处不再赘述。

在一些实施例中,第三识别模块533还可以通过预设的放置物的参数识别放置物的材质、形状和尺寸。放置物的预设参数可以包括放置物的材质参数、形状参数和尺寸参数。在一些实施例中,处理设备(例如,处理器120)可以从全景图像中提取出放置物的特征,第三识别模块533可以将该特征与预设参数进行比对,并根据比对结果确定放置物的材质、形状和尺寸。仅作为示例,第三识别模块533可以将放置物的特征与放置物的材质参数进行比对,假设该材质参数为木制,若比对结果为是,则表示放置物的材质为木制。

在一些实施例中,第三识别模块533可以识别目标空间的大小。目标空间的大小可以是目标空间的体积,或目标空间中所有墙体、地面的表面积。具体的,第三识别模块533可以先识别出全景图像的多个基线,再根据全景图像的比例计算各基线的实际长度,进而根据各基线的实际长度计算出目标空间的大小。关于基线的更多细节,可以参见下文中关于基线和目标空间尺寸的相关描述,此处不再赘述。

在一些实施例中,第三识别模块533可以识别目标空间的墙面材料。以目标空间为单个房间为例,目标空间的墙面材料可以是目标空间中六个墙面的表面材料,例如,油漆、涂层等。具体的,第三识别模块533可以将全景图像中墙面材料对应的元素与全景图像特征进行对比,并根据得到的对比结果识别出目标空间的墙面材料。其中,该全景图像特征可以是从全景图像中预提取的墙面材料的特征,例如,不同墙面材料的像素、特征向量等。

需要说明的是,目标空间的大小和目标空间的墙面材料均可以影响目标空间的混响,关于目标空间的混响的更多细节可以参见下文实施例及其相关描述,此处不再赘述。

通过识别放置物的位置、材质、形状和尺寸,以及目标空间的大小、目标空间的墙面材料,可以结合上述信息分析其对目标音响参数的多个影响因素,从而能够提升音响参数确定的全面性和准确性。

在一些实施例中,对全景图像进行分析,可以进一步包括:识别目标空间的尺寸、目标空间的驻波、目标空间的混响、目标音响的灵敏度、目标音响的增益公式中的至少一个。在一些实施例中,目标空间的尺寸、目标空间的驻波、目标空间的混响、目标音响的灵敏度、目标音响的增益公式等识别操作可以由第三识别模块533执行。例如,采用吸音材质的放置物可以吸收目标音响的声波,从而会减小目标音响的音质和音量等音响参数。又例如,形状不规则或尺寸较大的放置物会阻碍目标音响的声波传递,从而会减弱目标音响的环绕声效和立体声效等音响参数。

在一些实施例中,第三识别模块533可以识别目标空间的尺寸。在一些实施例中,处理设备(例如,处理器120)可以从目标空间的全景图像中提取多个目标空间的关键点。其中,关键点可以是目标空间的墙面与地面的交界线的连接点。在一些实施例中,第三识别模块533可以根据上述多个关键点识别出多个关键点连接形成的基线,根据上述基线的尺寸结合全景图像的比例计算出目标空间的尺寸。仅作为示例,假设多个基线中的一个基线的长度为20cm,全景图像的比例为1:5,则该基线对应目标空间的尺寸为100cm。

在一些实施例中,第三识别模块533可以识别目标空间的驻波。在一些实施例中,第三识别模块533可以根据目标空间的大小识别目标空间的驻波。在一些实施例中,驻波频率的计算公式可以表示为:

其中,f1为目标空间长度方向的第一阶驻波频率,f2为目标空间宽度方向的第一阶驻波频率,f3为目标空间高度方向的第一阶驻波频率,l1为目标空间的长度,l2为目标空间的宽度,l3为目标空间的高度,v为声源发出的声音在目标空间中的传播速度,即,声速。

需要说明的是,由于公式(1)中需要通过声速v计算相应的驻波频率。因此,当出现声源的声音被放置物完全遮挡时,需要将公式(1)中的l1定义为声源与放置物的距离。

目标空间的混响可以由t60混响表示。t60混响是指当声音达到稳态后突然停止,该声音衰减60db所需的时间。在一些实施例中,目标空间的t60混响的测量公式可以表示为:

其中,v表示目标空间的大小(体积),m表示空气衰减系数,s表示目标空间的表面积,α表示平均吸声系数。

在一些实施例中,第三识别模块533可以识别目标空间的混响。根据公式(2)可知目标空间的混响与目标空间的体积、表面积和材质有关。在一些实施例中,处理设备(例如,处理器120)可以根据前述步骤获取目标空间的尺寸和材质,第三识别模块533可以根据上述目标空间的信息估算出目标空间的混响,以便于后续通过低音均衡器确定目标音响的增益。

在一些实施例中,第三识别模块533可以识别目标音响的灵敏度。在一些实施例中,第三识别模块533可以根据预设的灵敏度参数识别目标音响的灵敏度。预设的灵敏度参数可以包括目标音响的最大电压容量和电压增益。在一些实施例中,处理设备(例如,处理器120)可以提取目标音响的特征,例如,目标音响的型号,第三识别模块533可以根据该特征为目标音响确定预设的灵敏度参数。例如,可以选取最大电压容量相等或最接近的预设的灵敏度参数。在一些实施例中,第三识别模块533可以根据预设的灵敏度参数结合灵敏度计算公式得到目标音响的灵敏度。在一些实施例中,灵敏度的计算公式可以表示为:

其中,v′表示目标音响的灵敏度,v表示目标音响的最大电压容量,a表示电压增益。一般地,目标音响的灵敏度的大小在0.775v至1.5v之间。

目标音响的增益公式是指确定目标音响的增益过程中所用到的公式。在一些实施例中,目标音响的增益可以为目标音响的最大电压容量公式。通过确定目标音响的最大电压容量可以对目标音响进行保护。目标音响的最大电压容量可以根据目标音响的最大功率和负载阻抗得到,则对应的增益公式可以表示为:

v=w×ω(4)

其中,v表示目标音响的最大电压容量,w表示目标音响的最大功率,ω表示目标音响的负载阻抗。

在一些实施例中,第三识别模块533可以识别目标音响的增益公式。在一些实施例中,第三识别模块533可以从存储设备130中,或者通过网络150从服务器110中获取目标音响的增益公式。

通过识别上述与目标空间和目标音响有关的多种信息,可以结合上述信息分析影响目标音响参数的多个因素,从而能够提升音响参数确定的全面性和准确性。

步骤340,基于所述全景图像的分析结果,确定所述目标音响的增益。在一些实施例中,步骤340可以由第一确定模块540执行。

在一些实施例中,目标音响的参数可以包括但不限于目标音响的增益、目标音响的输出功率和目标音响的延迟等。

在一些实施例中,第一确定模块540可以通过机器学习模型确定目标音响的参数。在一些实施例中,可以将目标空间的多张图像或全景图像输入至机器学习模型,输出得到较优的目标音响的参数。在一些实施例中,处理设备(例如,处理器120)可以获取存储在存储设备130的目标音响的原始参数,并通过辅助设备或程序(例如,音质评估应用程序)评估原始参数下目标音响的音质,确定优化后的目标音响的参数。

在一些实施例中,还可以通过目标音响的预设参数确定目标音响的参数。关于通过目标音响的预设参数确定目标音响的参数的更多细节可以参见图4及其相关描述,此处不再赘述。

在一些实施例中,第一确定模块540可以通过机器学习模型确定目标音响的增益。在一些实施例中,机器学习模型可以是训练好的音响参数配置模型。在一些实施例中,音响参数配置模型可以包括但不限于卷积神经网络(convolutionalneuralnetworks,cnn)、长短期记忆(longshort-termmemory,lstm)模型等。在一些实施例中,音响参数配置模型的输入可以是目标音响的位置、听音位置与目标音响之间的第一距离、第一角度、放置物的位置、放置物的种类、放置物的形状、放置物的材质等中的一种或多种,输出可以是目标音响的参数(例如,增益)。在一些实施例中,音响参数配置模型的输入也可以是包含上述信息的图像。其中,上述目标音响信息可以通过处理设备(例如,处理器120)以图像识别方法得到。

在一些实施例中,可以基于多个带有标签的训练样本训练音响参数配置模型。具体的,将带有标签的训练样本输入至音响参数配置模型,通过训练更新音响参数配置模型的参数。

在一些实施例中,训练样本可以包括目标音响的位置、听音位置与目标音响之间的第一距离、第一角度、放置物的位置、放置物的材质、放置物的形状、目标音响的参数、或包含上述信息的图像等或其组合。

在一些实施例中,训练样本可以通过辅助设备获取。在一些实施例中,辅助设备可以是自动装置。例如,机械手臂、自动推车等。在一些实施例中,辅助设备可以通过多种方式获取训练样本。例如,辅助设备可以通过移动目标音响、听音设备或各放置物,来改变目标音响的位置、听音位置与目标音响之间的第一距离、第一角度、放置物的位置。又例如,辅助设备可以替换各放置物的种类、形状和/或材质。又例如,辅助设备可以根据上述数据对目标音响的参数进行自动设置或调节,来获取多个目标音响的参数。从而辅助设备能够通过上述操作来获取大量的训练样本。

在一些实施例中,标签可以是目标音响的音质或目标音响的参数。在一些实施例中,目标音响的音质可以用对应的分值表示。其中,分值越高对应的目标音响的音质越好。在一些实施例中,目标音响的参数可以是自动设置的目标音响的多个参数值。其中,上述多个参数值可以根据训练样本进行自动设置。

在一些实施例中,标签可以通过具有评分功能的听音设备(例如,模拟用户系统)获取。在一些实施例中,该听音设备可以通过接收目标音响发出的声音,对目标音响的音质进行自动评分。在一些实施例中,该听音设备可以对上述标签进行筛选,将符合预设条件的目标音响的音质或目标音响的参数作为对应训练样本的标签。在一些实施例中,预设条件可以为目标音响的音质,或目标音响的参数对应的音质大于预设阈值。在一些实施例中,听音设备可以获取符合预设条件的目标音响的音质作为标签。例如,听音设备获取当前训练样本中目标音响的音质为95分,预设阈值为90分,则表示该目标音响的音质符合预设条件,可以用作对应训练样本的标签。在一些实施例中,听音设备可以获取符合预设条件的目标音响的参数作为标签。例如,辅助设备可以获取多组训练样本,并为每组训练样本自动设置目标音响的多个不同的参数,听音设备获取上述多个不同的参数下对应目标音响的音质评分,将音质评分超过预设阈值的目标音响的参数用作对应训练样本的标签。

在一些实施例中,音响参数配置模型可以基于上述样本,通过各种方法进行训练来更新模型参数。例如,可以基于梯度下降法进行训练。

在一些实施例中,当训练的音响参数配置模型满足预设条件时,训练结束。其中,预设条件可以是损失函数结果收敛或小于预设阈值等。

根据以上描述,确定目标音响的参数时考虑目标音响的位置、听音位置与目标音响之间的第一距离、第一角度、放置物的位置、目标空间的大小、目标空间的墙面材料等,从而提高了目标音响参数确定的准确性和全面性,提升用户的听音体验。

在一些实施例中,第一确定模块540可以基于全景图像的分析结果,确定目标音响的输出功率和/或目标音响的延时。

目标音响的输出功率是指目标音响使用时的额定功率。目标音响的输出功率能够决定目标音响的最大声音强度。在一些实施例中,第一确定模块540可以基于全景图像的分析结果,确定目标音响的输出功率。在一些实施例中,全景图像的分析结果可以包括目标空间的尺寸。第一确定模块540可以根据目标空间的尺寸结合目标音响的增益公式,确定最优的目标音响的输出功率。在一些实施例中,目标音响的增益公式可以为目标空间的体积与目标音响的输出功率的最佳对应关系。例如,当目标空间的体积为20m3时,第一确定模块540可以根据该最佳对应关系,将最优的目标音响的输出功率确定为60w。

目标音响的延时是指用户接收各音响发出声音的延时。适当的延时可以提升目标音响的立体音质。例如,两个声源的延时量5ms至35ms时,人耳只能感觉到超前一个声源的存在;声源的延时量在30ms至50ms时,人耳能够大致分辨出两个声源的存在;声源的延时量大于50ms时,人耳能够感觉到两个声源同时存在。目标音响的延时越小,目标音响的音质越柔和;目标音响的延时越大,目标音响的音质立体环绕感越强。在一些实施例中,第一确定模块540可以根据用户要求的听音效果确定目标音响的延时。例如,当用户要求立体感较强的音质时,第一确定模块540可以在合理的范围内确定较大的目标音响的延时。

通过确定目标音响的输出功率和目标音响的延时,能够合理地调节目标音响的参数,从而提升了音响参数确定的全面性,提升用户的听音体验。

在一些实施例中,第一确定模块540可以根据第一距离或第二距离确定目标音响的增益。以听音位置与5.1音响的第一距离为例,用户在听音位置到该5.1音响的五个音箱的第一距离分别为a1、a2、a3、a4、a5。在一些实施例中,上述第一距离的平均值可以表示为:

在一些实施例中,上述五个音箱的增益可以表示为:

其中,a可以为a1至a5中的任何一个。

在一些实施例中,可以通过目标音响的均衡器或动态均衡器对上述增益进行调节,以确定目标音响的参数。

步骤350,获取所述目标音响中至少一个音响的预设参数。在一些实施例中,步骤350可以由第三获取模块550执行。

预设参数是指预先设定好的目标音响的参数。在一些实施例中,预设参数可以是较优的音响参数。例如,目标音响的延时的大小可以在5ms至50ms之间,若使目标音响的音质立体环绕感较强,则较优的目标音响的延时的大小可以为30ms至50ms之间。在一些实施例中,预设参数可以是目标音响的参数可调节范围的终点值。例如,当目标音响的延时的大小可调整范围为30ms至50ms之间,则预设参数可以是目标音响的延时的大小可以为30ms或50ms。

在一些实施例中,第三获取模块550可以从存储设备130中,或通过网络150从云存储空间中获取目标空间的预设参数。在一些实施例中,第三获取模块550可以从用户终端140中获取用户手动输入目标音响的预设参数。

在一些实施例中,预设参数可以包括至少一个音响的预设增益。例如,目标音响的灵敏度增益、目标音响的输出功率增益等。

步骤360,基于所述听音位置和所述预设参数,确定所述至少一个音响的目标位置。在一些实施例中,步骤360可以由第二确定模块560执行。

在一些实施例中,预设参数可以是目标音响的延时。在一些实施例中,处理设备(例如,处理器120)可以获取某一听音位置下目标音响的延时,第二确定模块560可以根据该目标音响的延时确定至少一个音响的目标位置或目标位置的可选范围。例如,当目标音响的延时大于50ms时,表示目标音响的延时过大,会产生影响目标音响音质的回声效果,第二确定模块560可以将至少一个音响与其他音响的距离减小,以降低目标音响的整体延时。

在一些实施例中,预设参数可以是目标音响的增益。在一些实施例中,处理设备(例如,处理器120)可以获取某一听音位置下目标音响的增益,第二确定模块560可以根据该目标音响的增益确定至少一个音响的目标位置或目标位置的可选范围。例如,当目标音响的增益为通过3个20db的放大器对目标音响的输出电压进行千倍放大增益时,用户可以通过辅助设备或系统(例如,音质评估应用程序)评估目标音响的音质,第二确定模块560可以将至少一个音响与其他音响的距离增大,以进一步地增加目标音响的环绕音质。

通过上述描述可知,在目标音响的参数达到较优值、最优值或可调节范围的终点值时,能够通过改变目标音响的位置来进一步地提升用户的听音体验,从而提升了音响参数确定的准确性和多样性。

图4是根据本说明书的一些实施例所示的确定目标音响的增益的示例性流程图。该流程400可以由处理器120执行。

步骤410,获取所述目标音响的初始参数。

初始参数可以是目标音响的默认参数。在一些实施例中,初始参数可以根据经验设置。在一些实施例中,初始参数可以包括所述目标音响的初始参数。例如,目标音响的初始增益、目标音响的初始输出功率、目标音响的初始延时等。

在一些实施例中,处理器120可以从存储设备130或用户终端140中获取初始参数。

步骤420,基于所述全景图像的分析结果和所述初始参数,从所述多个听音位置中确定至少一个最优听音位置。

在一些实施例中,全景图像的分析结果可以包括目标音响的位置和听音位置。在一些实施例中,处理设备(例如,处理器120)可以获取多个听音位置对应的多个目标音响的参数,根据上述多个目标音响的参数与初始参数的比较结果,确定至少一个最优听音位置。仅作为示例,假设初始参数为目标音响的延时,第一听音位置对应的目标音响的延时为40ms,第二听音位置对应的目标音响的延时为60ms,则比较结果为第一听音位置优于第二听音位置。重复上述步骤直至确定出至少一个最优听音位置。

步骤430,基于所述最优听音位置,调整所述目标音响的增益。

在一些实施例中,处理设备(例如,处理器120)可以基于最优听音位置,调整目标音响的增益。仅作为示例,假设用户要求的听音效果为柔和音质,则处理器120可以降低目标音响的增益。例如,通过减小目标音响的放大器倍数来实现。

通过上述描述可知,能够在最优听音位置下进一步地确定音响的最优参数,从而提高了音响参数确定的全面性和准确性,进而提升用户的听音体验。

图5是根据本说明书的一些实施例所示的音响参数确定系统的模块图。

在一些实施例中,该系统500可以包括第一获取模块510、第二获取模块520、分析模块530、第一确定模块540、第三获取模块550和第二确定模块560。

第一获取模块510可以用于获取全景图像。在一些实施例中,第一获取模块510可以用于获取放置目标音响的目标空间的全景图像,所述目标音响具有led灯,所述全景图像在所述led灯点亮情况下拍摄得到。在一些实施例中,第一获取模块510还可以用于从移动终端获取所述目标空间的多张图像;基于所述多张图像,获得所述全景图像。

第二获取模块520可以用于获取听音位置。在一些实施例中,第二获取模块520可以用于获取所述目标空间的听音位置。在一些实施例中,第二获取模块520还可以用于从移动终端获取由用户输入的所述听音位置。

分析模块530可以用于对全景图像进行分析。在一些实施例中,分析模块530可以用于识别所述目标空间中的所述放置物的材质、形状和尺寸。

在一些实施例中,分析模块530还可以包括第一识别模块531、第二识别模块532和第三识别模块533。

第一识别模块531可以用于识别目标音响的位置。在一些实施例中,第一识别模块531可以用于通过识别所述全景图像中所述目标音响的led灯的形状或位置,识别所述目标音响的位置。在一些实施例中,第一识别模块531还可以用于通过识别所述全景图像中所述目标音响的led灯的形状或位置,识别所述目标音响与所述全景图像的拍摄者之间的第二距离;以及基于所述第二距离,确定所述目标音响的位置。

第二识别模块532可以用于识别听音位置与目标音响的相对距离。在一些实施例中,第二识别模块532可以用于基于所述听音位置与所述目标音响的位置,识别所述听音位置与所述目标音响之间的第一距离和第一角度。

第三识别模块533可以用于识别放置物和目标空间的信息。在一些实施例中,第三识别模块533可以用于识别所述目标空间中的放置物的位置。在一些实施例中,第三识别模块533还可以用于识别所述目标空间中的所述放置物的材质、形状和尺寸。在一些实施例中,第三识别模块533还可以用于识别所述目标空间的尺寸、所述目标空间的驻波、所述目标空间的混响、所述目标音响的灵敏度、所述目标音响的增益公式中的至少一个。

第一确定模块540可以用于基于所述全景图像的分析结果,确定所述目标音响的增益。在一些实施例中,第一确定模块540还可以用于将所述目标音响的位置、所述听音位置与所述目标音响之间的第一距离和第一角度,以及所述放置物的位置、目标空间的大小、目标空间的墙面材料,输入至已训练好的音响参数配置模型,输出得到所述目标音响的增益。在一些实施例中,第一确定模块540还可以用于获取所述目标音响的初始参数,所述初始参数包括所述目标音响的初始增益;基于所述全景图像的分析结果和所述初始参数,从所述多个听音位置中确定至少一个最优听音位置;以及基于所述最优听音位置,调整所述目标音响的增益。

第三获取模块550可以用于获取目标音响的预设参数。在一些实施例中,第三获取模块550可以用于获取所述目标音响中至少一个音响的预设参数,所述预设参数包括所述至少一个音响的预设增益。

第二确定模块560可以用于确定目标音响的位置。在一些实施例中,第二确定模块560可以用于基于所述听音位置和所述预设参数,确定所述至少一个音响的目标位置。

应当理解,图5所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、cd或dvd-rom的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。

需要注意的是,以上对于音响参数确定系统500及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。例如,在一些实施例中,图5中披露的第一获取模块510、第二获取模块520、分析模块530、第一确定模块540、第三获取模块550和第二确定模块560可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。又例如,第一获取模块510和第二获取模块520可以是两个模块,也可以是一个模块同时具有获取和数据处理功能。又例如,第一识别模块531和第二识别模块532可以是两个模块,当听音位置和获取全景图像的位置一致时,第一识别模块531可以和第二识别模块532是一个模块,同时具有识别听音位置与目标音响之间距离的功能。诸如此类的变形,均在本说明书的保护范围之内。

本说明书实施例可能带来的有益效果包括但不限于:(1)通过对音响所处目标空间的全景图像进行识别,获取多个影响音响参数的因素,从而能够根据上述影响因素更方便、更快速、更全面、更准确地确定音响的参数;(2)通过改变音响的位置,能够在音响的最优参数或最优的听音位置下进一步地确定音响的增益,从而能够提升用户的听音体验。

需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。

同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。

针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。

最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。


技术特征:

1.一种音响参数配置模型训练方法,包括:

获取训练样本,所述训练样本至少包括:目标音响的位置、听音位置与所述目标音响之间的第一距离和第一角度、目标空间中的放置物的位置、所述放置物的材质、所述放置物的形状、所述目标音响的参数、或包含上述信息的图像中的一种或多种;

获取所述训练样本对应的标签,所述标签至少包括所述目标音响的音质或所述目标音响的参数中的一种或多种;以及

基于所述训练样本和所述训练样本对应的标签,对所述音响参数配置模型进行训练,当训练的所述音响参数配置模型满足预设条件时,训练结束。

2.根据权利要求1所述的音响参数配置模型训练方法,所述获取训练样本包括:通过辅助设备获取所述训练样本。

3.根据权利要求2所述的音响参数配置模型训练方法,所述辅助设备为自动装置,所述自动装置至少包括机械手臂或自动推车中的一种或多种。

4.根据权利要求2所述的音响参数配置模型训练方法,所述通过辅助设备获取所述训练样本,包括:

通过所述辅助设备移动所述目标音响、听音设备或所述放置物,改变所述目标音响的位置、所述听音位置与所述目标音响之间的第一距离和第一角度、所述放置物的位置;或通过所述辅助设备替换所述放置物的种类、形状和/或材质;以及

根据上述数据对所述目标音响的参数进行自动设置或调节,以获取所述目标音响的多个参数,从而获取所述训练样本。

5.根据权利要求1所述的音响参数配置模型训练方法,所述目标音响的参数包括自动设置的所述目标音响的多个参数值,所述多个参数值根据所述训练样本进行设置。

6.根据权利要求1所述的音响参数配置模型训练方法,所述获取所述训练样本对应的标签包括:

对所述标签进行筛选,将符合预设的筛选条件的所述目标音响的音质和/或所述目标音响的参数作为与所述训练样本对应的标签。

7.根据权利要求6所述的音响参数配置模型训练方法,所述对所述标签进行筛选,将符合所述预设的筛选条件的所述目标音响的音质和/或所述目标音响的参数作为与所述训练样本对应的标签包括:

对所述目标音响发出的声音对应的所述目标音响的音质进行自动评分;以及

当所述目标音响的音质的分数或所述目标音响的参数对应的音质的分数大于预设的分数阈值时,将所述目标音响的音质或所述目标音响的参数作为所述训练样本对应的标签。

8.根据权利要求7所述的音响参数配置模型训练方法,所述对所述目标音响发出的声音对应的所述目标音响的音质进行自动评分包括:通过具有评分功能的听音设备接收所述目标音响发出的声音,并对所述目标音响发出的声音对应的所述目标音响的音质进行自动评分。

9.根据权利要求8所述的音响参数配置模型训练方法,所述听音设备包括模拟用户系统。

10.根据权利要求1所述的音响参数配置模型训练方法,所述基于所述训练样本和所述训练样本对应的标签,对所述音响参数配置模型进行训练,当训练的所述音响参数配置模型满足预设条件时,训练结束包括:

基于梯度下降法训练所述音响参数配置模型。

11.根据权利要求1所述的音响参数配置模型训练方法,所述预设条件包括损失函数结果收敛或小于预设阈值。

技术总结
本说明书实施例公开了一种音响参数配置模型训练方法,包括:获取训练样本,所述训练样本至少包括:目标音响的位置、听音位置与所述目标音响之间的第一距离和第一角度、目标空间中的放置物的位置、所述放置物的材质、所述放置物的形状、所述目标音响的参数、或包含上述信息的图像中的一种或多种;获取所述训练样本对应的标签,所述标签至少包括所述目标音响的音质或所述目标音响的参数中的一种或多种;以及基于所述训练样本和所述训练样本对应的标签,对所述音响参数配置模型进行训练,当训练的所述音响参数配置模型满足预设条件时,训练结束。

技术研发人员:陈玮;张鲲鹏
受保护的技术使用者:汉桑(南京)科技有限公司
技术研发日:2020.12.28
技术公布日:2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-1621.html

最新回复(0)