音频数据处理方法、装置、系统、电子设备及存储介质与流程

专利2022-05-09  17


本公开涉及人工智能技术领域,特别涉及智能语音及自然语言处理等领域的音频数据处理方法、装置、系统、电子设备及存储介质。



背景技术:

当多人同时进行语音会议(网络会议)时,通常每个终端设备如电脑仅对应一个说话人(用户),即便对应多个说话人,也无法有效区分出不同的说话人,若要区分出不同的说话人,则需要与第三方厂商进行对接开发,从而增加了实现复杂度和实现成本等。



技术实现要素:

本公开提供了音频数据处理方法、装置、系统、电子设备及存储介质。

根据本公开的一个方面,提供了一种音频数据处理方法,包括:

确定接入终端设备的音频设备;

当所述音频设备生成音频数据时,获取所述音频数据;

将所述音频数据以及所述音频设备的设备标识发送给所述终端设备关联的服务器。

根据本公开的一个方面,提供了一种音频数据处理方法,包括:

获取来自客户端的音频数据以及生成所述音频数据的音频设备的设备标识,其中,所述音频设备为接入所述客户端所在终端设备的音频设备;

将所述音频数据及所述设备标识对应保存。

根据本公开的一个方面,提供了一种音频数据处理方法,包括:

获取来自服务器的设备标识,其中,所述设备标识为服务器获取到的客户端上生成音频数据的音频设备的设备标识;

将所述设备标识进行展示。

根据本公开的一个方面,提供了一种音频数据处理装置,包括:确定模块、第一获取模块以及发送模块;

所述确定模块,用于确定接入终端设备的音频设备;

所述第一获取模块,用于当所述音频设备生成音频数据时,获取所述音频数据;

所述发送模块,用于将所述音频数据以及所述音频设备的设备标识发送给所述终端设备关联的服务器。

根据本公开的一个方面,提供了一种音频数据处理装置,包括:第二获取模块以及保存模块;

所述第二获取模块,用于获取来自客户端的音频数据以及生成所述音频数据的音频设备的设备标识,其中,所述音频设备为接入所述客户端所在终端设备的音频设备;

所述保存模块,用于将所述音频数据及所述设备标识对应保存。

根据本公开的一个方面,提供了一种音频数据处理装置,包括:第三获取模块以及展示模块;

所述第三获取模块,用于获取来自服务器的设备标识,所述设备标识为服务器获取到的客户端上生成音频数据的音频设备的设备标识;

所述展示模块,用于将所述设备标识进行展示。

根据本公开的一个方面,提供了一种音频数据处理系统,包括:如以上所述的第一种装置和第二种装置。

根据本公开的一个方面,提供了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上所述的方法。

根据本公开的一个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行如以上所述的方法。

根据本公开的一个方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如以上所述的方法。

上述公开中的一个实施例具有如下优点或有益效果:可根据实际需要,在终端设备上接入一个或多个音频设备,并可在上传任一音频设备生成的音频数据时,同时上传音频设备的设备标识,从而可有效区分出不同的音频数据的来源,即不同的说话人,并降低了实现复杂度和实现成本等。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1为本公开所述音频数据处理方法第一实施例的流程图;

图2为本公开所述音频数据处理方法第二实施例的流程图;

图3为本公开所述音频数据处理方法第三实施例的流程图;

图4为本公开所述音频数据处理方法的整体实现过程示意图;

图5为本公开所述音频数据处理装置第一实施例500的组成结构示意图;

图6为本公开所述音频数据处理装置第二实施例600的组成结构示意图;

图7为本公开所述音频数据处理装置第三实施例700的组成结构示意图;

图8为本公开所述音频数据处理系统第一实施例800的组成结构示意图;

图9为本公开所述音频数据处理系统第二实施例900的组成结构示意图;

图10示出了可以用来实施本公开的实施例的示例电子设备1000的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

另外,应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

图1为本公开所述音频数据处理方法第一实施例的流程图。如图1所示,包括以下具体实现方式。

在步骤101中,确定接入终端设备的音频设备。

在步骤102中,当音频设备生成音频数据时,获取音频数据。

在步骤103中,将音频数据以及音频设备的设备标识(id)发送给终端设备关联的服务器。

上述方法实施例所述方案中,可根据实际需要,在终端设备上接入一个或多个音频设备,并可在上传任一音频设备生成的音频数据时,同时上传音频设备的设备标识,从而可有效区分出不同的音频数据的来源,并降低了实现复杂度和实现成本等。

上述方法实施例所述方案的执行主体可为位于终端设备中的客户端。终端设备具体为何种设备可根据实际需要而定,比如可为电脑。

可按照预设时间间隔,周期性检测是否有接入终端设备的音频设备。即可周期性地进行轮询,从而确定出接入终端设备的音频设备。所述周期的具体时长也可根据实际需要而定。不同时刻,接入终端设备的音频设备的数量等可能发生变化,比如,原来接入终端设备的音频设备为音频设备1,之后又接入了音频设备2,通过周期性地进行轮询,可及时发现新接入的音频设备,使其及时生效等。

另外,各音频设备可通过集线器(hub)方式接入终端设备,非常简单方便,并可根据实际需要随时增加或减少音频设备。所述音频设备具体为何种设备同样可根据实际需要而定,比如可为麦克风。

优选地,接入终端设备的音频设备可为参加语音会议的音频设备。理论上,接入同一终端设备的不同音频设备参加的可以是同一语音会议,也可以是不同的语音会议,但通常来说,接入同一终端设备的不同音频设备参加的是同一语音会议。

可为每个音频设备开启一个音频接收的线程,当确定音频设备参加的语音会议处于进行状态、且音频设备生成音频数据时,可获取音频设备对应的音频数据,并发送给终端设备关联的服务器,在发送音频数据的同时,还可将音频数据对应的音频设备的设备标识以及对应的语音会议的会议标识一起发送给服务器,以便区分音频数据的来源。

其中,设备标识可从终端设备处获取,会议标识可为用户输入的,如用户可利用终端设备上的浏览器相关界面输入参加的会议标识等。

也就是说,可根据实际需要,在终端设备上接入一个或多个音频设备,实现按需扩展会议参与人,并可通过对应的音频设备的设备标识及对应的语音会议的会议标识有效区分出不同的音频数据的来源,即不同的说话人,从而降低了实现复杂度和实现成本等。

在实际应用中,还可与服务器之间建立长链接,通过所建立的长链接,从服务器获取语音会议的会议状态。会议状态可包括未开始状态、进行状态以及结束状态等。所建立的长链接可为网络套接字(websocket)长链接等。

相应地,对于任一音频设备来说,当其参加的语音会议处于进行状态、且音频设备生成音频数据时,可获取对应的音频数据。

通过上述处理,可避免不必要的音频数据发送,从而节省了传输资源等。

在实际应用中,还可启动一个监督(supervise)线程来监听客户端的状态,并可在客户端因异常情况退出时重启客户端,保证收音功能的可用性及稳定性等。

以上主要从客户端一侧对本公开所述方案进行说明,以下从服务器一侧对本公开所述方案进行进一步说明。

图2为本公开所述音频数据处理方法第二实施例的流程图。如图2所示,包括以下具体实现方式。

在步骤201中,获取来自客户端的音频数据以及生成音频数据的音频设备的设备标识,其中,音频设备为接入客户端所在终端设备的音频设备。

在步骤202中,将获取到的音频数据及设备标识对应保存。

上述方法实施例所述方案中,可将获取到的来自客户端的音频数据及对应的音频设备的设备标识进行对应保存,从而可有效区分出不同的音频数据的来源,并降低了实现复杂度和实现成本等。

上述方法实施例所述方案的执行主体可为服务器,接入终端设备的音频设备可为参加语音会议的音频设备。

相应地,获取到的音频数据可为当音频设备参加的语音会议处于进行状态时音频设备生成的音频数据。另外,还可获取语音会议的会议标识,并将音频数据保存到对应的音频文件中,音频文件以会议标识及设备标识的组合作为文件标识。

即在获取到不同客户端发送来的音频数据后,可按照会议标识 设备标识的维度写入到不同的音频文件中。也就是说,对于任一音频文件,其文件标识可由对应的会议标识和设备标识组成,即文件标识=会议标识 设备标识。

另外,还可与客户端之间建立长链接,通过所建立的长链接向客户端同步语音会议的会议状态。

还可将获取到的音频数据转换为文字信息,如何转换不作限制,并且,可将转换得到的文字信息以及对应的设备标识发送给参加语音会议的终端设备进行展示。比如,可在参加语音会议的各终端设备的浏览器相关界面上展示上述信息。

通过上述处理,可方便参加语音会议的各用户查看其它用户的音频内容/发言内容,并可明确发言内容对应的用户。

当语音会议结束后,还可根据文件标识,将参加语音会议的各音频设备对应的音频文件进行合并,从而得到语音会议的会议音频文件。

以语音会议x为例,由于各音频文件的文件标识均由会议标识和设备标识组成,那么当语音会议x结束后,可根据各音频文件的文件标识,方便准确地查找出属于语音会议x的各音频文件,即参加语音会议x的各音频设备对应的音频文件,进而可通过调用命令行工具等,将各音频文件进行合并,从而得到所需的语音会议x的会议音频文件,以方便后续对会议内容进行回听。

图3为本公开所述音频数据处理方法第三实施例的流程图。如图3所示,包括以下具体实现方式。

在步骤301中,获取来自服务器的设备标识,其中,设备标识为服务器获取到的客户端上生成音频数据的音频设备的设备标识。

在步骤302中,将获取到的设备标识进行展示。

上述方法实施例所述方案中,可对生成音频数据的音频设备的设备标识进行展示,从而使得用户可以基于所展示的内容有效区分出不同的音频数据的来源。

可选地,可获取来自服务器的文字信息以及文字信息对应的设备标识,文字信息为服务器对获取到的音频数据进行转换得到的文字信息,设备标识为生成音频数据的音频设备的设备标识,相应地,可将获取到的文字信息及设备标识进行展示。

综合上述介绍,图4为本公开所述音频数据处理方法的整体实现过程示意图。

如图4所示,电脑a、电脑b和电脑c为三台处于不同网络环境下的电脑,其中,电脑a和电脑b处于网络环境a,电脑c处于网络环境b,电脑a、电脑b和电脑c上分别通过hub方式接入了两个麦克风。

假设这些麦克风对应的用户参加的是同一个语音会议x,以图4中所示的麦克风1为例,位于电脑a上的客户端a可针对麦克风1执行以下处理:当确定语音会议x处于进行状态时,获取麦克风1对应的音频数据,将获取到的音频数据连同麦克风1的设备标识及语音会议x的会议标识一起发送给服务器。

相应地,仍以图4中所示的麦克风1为例,服务器可将获取到的音频数据保存到以语音会议x的会议标识 麦克风1的设备标识作为文件标识的音频文件中,并可将音频数据转换为文字信息,将转换得到的文字信息等发送给电脑a、电脑b和电脑c进行展示等。

以上以图4中所示的麦克风1为例,对于其它的麦克风,均可按照上述方式进行处理。

当语音会议x结束后,服务器还可将各麦克风对应的音频文件进行合并,从而得到语音会议x的会议音频文件。

需要说明的是,对于前述的各方法实施例,为了简单描述,都将其表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本公开所必须的。另外,某个实施例中没有详述的部分,可以参见其它实施例中的相关说明。

以上是关于方法实施例的介绍,以下通过装置实施例,对本公开所述方案进行进一步说明。本公开提供的音频数据处理装置用于执行上述任一音频数据处理方法。

图5为本公开所述音频数据处理装置第一实施例500的组成结构示意图。如图5所示,包括:确定模块501、第一获取模块502以及发送模块503。

确定模块501,用于确定接入终端设备的音频设备.

第一获取模块502,用于当音频设备生成音频数据时,获取音频数据。

发送模块503,用于将获取到的音频数据以及音频设备的设备标识发送给终端设备关联的服务器。

上述装置实施例所述方案中,可根据实际需要,在终端设备上接入一个或多个音频设备,并可在上传任一音频设备生成的音频数据时,同时上传音频设备的设备标识,从而可有效区分出不同的音频数据的来源,并降低了实现复杂度和实现成本等。

其中,确定模块501可按照预设时间间隔,周期性检测是否有接入终端设备的音频设备,即可周期性地进行轮询,从而确定出接入所述终端设备的音频设备。不同时刻,接入终端设备的音频设备的数量等可能发生变化,比如,原来接入终端设备的音频设备为音频设备1,之后又接入了音频设备2,通过周期性地进行轮询,可及时发现新接入的音频设备,使其及时生效等。

另外,所述音频设备可为通过hub方式接入终端设备的音频设备,接入方式非常简单方便。

针对任一音频设备,第一获取模块502可在音频设备参加的语音会议处于进行状态、且音频设备生成音频数据时,获取音频设备对应的音频数据,并发送给服务器。

第一获取模块502还可获取语音会议的会议标识,并在发送音频数据的同时,将音频数据对应的音频设备的设备标识以及对应的语音会议的会议标识一起发送给服务器。

另外,第一获取模块502还可与服务器之间建立长链接,通过长链接从服务器获取语音会议的会议状态。

图6为本公开所述音频数据处理装置第二实施例600的组成结构示意图。如图6所示,包括:第二获取模块601以及保存模块602。

第二获取模块601,用于获取来自客户端的音频数据以及生成音频数据的音频设备的设备标识,其中,音频设备为接入客户端所在终端设备的音频设备。

保存模块602,用于将获取到的音频数据及设备标识对应保存。

上述装置实施例所述方案中,可将获取到的来自客户端的音频数据及对应的音频设备的设备标识进行对应保存,从而可有效区分出不同的音频数据的来源,并降低了实现复杂度和实现成本等。

其中,第二获取模块601获取到的音频数据可为:当音频设备参加的语音会议处于进行状态时音频设备生成的音频数据。

相应地,第二获取模块601还可获取语音会议的会议标识。保存模块602可将获取到的音频数据保存到对应的音频文件中,所述音频文件可以会议标识及设备标识的组合作为文件标识。

另外,第二获取模块601还可与客户端之间建立长链接,通过长链接向客户端同步语音会议的会议状态。

保存模块602还可将获取到的音频数据转换为文字信息,并可将转换得到的文字信息以及对应的设备标识等发送给参加语音会议的终端设备进行展示。

进一步地,当语音会议结束后,保存模块602还可根据文件标识,将参加语音会议的各音频设备对应的音频文件进行合并,从而得到语音会议的会议音频文件。

图7为本公开所述音频数据处理装置第三实施例700的组成结构示意图。如图7所示,包括:第三获取模块701以及展示模块702。

第三获取模块701,用于获取来自服务器的设备标识,所述设备标识为服务器获取到的客户端上生成音频数据的音频设备的设备标识。

展示模块702,用于将获取到的设备标识进行展示。

上述装置实施例所述方案中,可对生成音频数据的音频设备的设备标识进行展示,从而使得用户可以基于所展示的内容有效区分出不同的音频数据的来源。

可选地,第三获取模块701可获取来自服务器的文字信息以及文字信息对应的设备标识,文字信息为服务器对获取到的音频数据进行转换得到的文字信息,设备标识为生成音频数据的音频设备的设备标识,相应地,展示模块702可将获取到的文字信息及设备标识进行展示。

本公开同时公开了音频数据处理系统。图8为本公开所述音频数据处理系统第一实施例800的组成结构示意图。如图8所示,包括:第一音频数据处理装置500和第二音频数据处理装置600。

其中,第一音频数据处理装置500可为图5所示实施例中的音频数据处理装置,第二音频数据处理装置600可为图6所示实施例中的音频数据处理装置。

应用上述系统实施例所述方案,可根据实际需要,在终端设备上接入一个或多个音频设备,并可在上传任一音频设备生成的音频数据时,同时上传音频设备的设备标识,相应地,可将音频数据及对应的设备标识进行对应保存,从而可有效区分出不同的音频数据的来源,并降低了实现复杂度和实现成本等。

图9为本公开所述音频数据处理系统第二实施例900的组成结构示意图。如图9所示,包括:第一音频数据处理装置500、第二音频数据处理装置600以及第三音频数据处理装置700。

其中,第一音频数据处理装置500可为图5所示实施例中的音频数据处理装置,第二音频数据处理装置600可为图6所示实施例中的音频数据处理装置,第三音频数据处理装置700可为图7所示实施例中的音频数据处理装置。

相比于图8所示实施例,图9所示音频数据处理系统中进一步包括第三音频数据处理装置700,通过第三音频数据处理装置700,可对生成音频数据的音频设备的设备标识进行展示,从而使得用户可以基于所展示的内容有效区分出不同的音频数据的来源。

上述装置和系统实施例的具体工作流程请参照前述方法实施例中的相关说明,不再赘述。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图10示出了可以用来实施本公开的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图10所示,设备1000包括计算单元1001,其可以根据存储在只读存储器(rom)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(ram)1003中的计算机程序,来执行各种适当的动作和处理。在ram1003中,还可存储设备1000操作所需的各种程序和数据。计算单元1001、rom1002以及ram1003通过总线1004彼此相连。输入/输出(i/o)接口1005也连接至总线1004。

设备1000中的多个部件连接至i/o接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理,例如本公开所述的方法。例如,在一些实施例中,本公开所述的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些实施例中,计算机程序的部分或者全部可以经由rom1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到ram1003并由计算单元1001执行时,可以执行本公开所述的方法的一个或多个步骤。备选地,在其他实施例中,计算单元1001可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行本公开所述的方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(vps)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。云计算指的是通过网络接入弹性可扩展的共享物理或虚拟资源池,资源可以包括服务器、操作系统、网络、软件、应用和存储设备等,并可以以按需、自服务的方式对资源进行部署和管理的技术体系,通过云计算技术,可以为人工智能、区块链等技术应用、模型训练提供高效强大的数据处理能力。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

需要说明的是,本公开所述方案可应用于人工智能领域,特别涉及智能语音及自然语言处理等领域。

人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术,人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术,人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

转载请注明原文地址:https://doc.8miu.com/read-150363.html

最新回复(0)