一种动物情感识别方法、装置及存储介质与流程

专利2022-05-09  79


本发明涉及动物研究领域,具体涉及一种动物情感识别方法、装置及存储介质。



背景技术:

动物和人一样,也会有喜怒哀乐;随着动物行为学研究的发展,人类对动物的情感表达越发重视。动物通过声音和动作等特定行为表达情感;其中,动物声音与人类语言类似,可实现同种物种之间的交流。传统的动物情感的识别方法,通常从动物的声音识别根据人为经验,这种动物情感的识别方法无疑极度依赖人为经验判断,并对动物照料者提出了极高的要求。



技术实现要素:

鉴于以上技术问题,本发明的目的在于提供一种动物情感识别方法、装置及存储介质,解决传统的动物情感的识别方法极度依赖人为经验判断的问题。

本发明采用以下技术方案:

本发明的一种动物情感识别方法,包括:

获取待识别动物声音信号;

将所述待识别动物声音信号进行预处理,得到预处理后的动物声音信号;

建立情感识别模型;将所述待识别动物声音信号输入情感识别模型,得到所述待识别动物声音信号的第一情感识别结果;

根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果。

进一步的,所述根据预设的方式对第一情感识别结果进行调整,得到待识别动物声音信号调整后的第二情感识别结果具体包括:获取待识别动物声音信号对应的视频数据;从所述视频数据中提取图像集合数据;

使用预设回归模型对所述图像集合数据进行动物的动作或微表情检测,得到包含动物动作或微表情的图像帧集合;并对每帧图像进行特征提取,根据动作或微表情识别模型识别所述视频数据对应的情感识别结果;

若动作或微表情识别模型识别所述视频数据对应的情感识别结果不一致,则根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号的第二情感识别结果。

进一步的,所述预处理包括:对获取待识别动物声音信号进行抗混叠滤波、模数变换、分帧和预加重处理。

进一步的,所述建立情感识别模型具体包括:提取动物的样本声音信号的特征参数为训练样本,所述特征参数包括梅尔-频率倒谱系数;以所述训练样本对应的情感标识为样本标签进行训练得到。

进一步的,所述情感标识包括:开心、生气、难过、烦躁和撒娇。

进一步的,所述根据预设的方式对第一情感识别结果进行调整的步骤具体包括:

将待识别动物声音信号分割成若干长度相等的预设长度段,根据第一公式计算对情感识别结果进行某个调整后的综合概率,选取综合概率最高的调整方案对第一情感识别结果进行调整,所述第一公式为:

p=k(θ)αn-i(1-α)i;

其中,k(θ)为待识别动物声音信号包含的情感的数量所对应的概率值,由样本经过统计得到,为单调递减的预设函数,θ为待识别动物声音信号包含的情感的数量,α为每一预设长度段待识别动物声音信号的情感识别的正确率,n为待识别动物声音信号所包含的预设长度段的数量,i为调整包含的情感识别结果的预设长度段的数量。

进一步的,还包括:获取所述待识别动物声音信号的频率的高低与情感特征的相关性权重,学习所述待识别动物声音信号每一帧信号对待识别动物的情感权重,以实现监测待识别动物情感。

进一步的,还包括:以多种图表方式显示待识别动物声音信号的情感变化,所述图表包括折线图、柱状图、散点图和仪表盘。

本发明的一种动物情感识别装置,包括:

接收模块,用于获取待识别动物声音信号;

处理模块,用于将所述待识别动物声音信号进行预处理,得到预处理后的动物声音信号;

情感识别模块,用于建立情感识别模型;将所述待识别动物声音信号输入情感识别模型,得到所述待识别动物声音信号的第一情感识别结果;

情感调整模块,用于根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果。

一种计算机存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现所述的动物情感识别方法。

相比现有技术,本发明的有益效果在于:

本发明通过建立情感识别模型对动物声音信号进行识别,得到第一情感识别结果,并对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果,可以在动物照料过程中不依赖人为经验判断动物情感,并且情感识别结果准确。

进一步的,通过监测待识别动物情感变化,并以多种图表方式进行展示,能方便动物照料人员及时获取动物的情感变化,以及对动物生活习性的及时掌控,制订保护策略;可适用于日常家居人与宠物之间的互动交流。

附图说明

图1为本发明一实施例提供的一种动物情感识别方法的流程示意图;

图2为本发明另一实施例提供的一种动物情感识别装置的示意图;

图3为本发明另一实施例提供的一种电子设备的结构示意图。

具体实施方式

下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例:

实施例一:

请参照图1所示,示出了本发明的一种动物情感识别方法,包括:

步骤s1:获取待识别动物声音信号;

步骤s2:将所述待识别动物声音信号进行预处理,得到预处理后的动物声音信号;

具体的,所述预处理包括:对获取待识别动物声音信号进行抗混叠滤波、模数变换、分帧和预加重处理。

通过预处理待识别动物声音信号,以方便通过情感识别模型识别情感的步骤中的特征提取。

步骤s3:建立情感识别模型;将所述待识别动物声音信号输入情感识别模型,得到所述待识别动物声音信号的第一情感识别结果;

可选的,所述建立情感识别模型具体包括:提取动物的样本声音信号的特征参数为训练样本,所述特征参数包括梅尔-频率倒谱系数;以所述训练样本对应的情感标识为样本标签进行训练得到。

其中,梅尔-频率倒谱系数又称mfcc情感特征参数,是一种语音情感特征参数,该参数是在梅尔标度频率域提取出来的倒谱系数。

应理解,选取mfcc情感特征参数,能增加特征参数的实用性,并减少特征提取的复杂度。本发明的方法不一定限定在提取mfcc情感特征参数。在具体实施例中,建立情感识别模型的训练样本的可以是提取动物的样本声音信号的其他特征参数,例如共振峰参数、过零率参数或频谱特征等。

步骤s4:根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果。

在上述实现过程中,通过建立情感识别模型对动物声音信号进行识别,得到第一情感识别结果,并对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果,可以在动物照料过程中不依赖人为经验判断动物情感,并且情感识别结果准确。

其中,所述步骤s4可具体包括:

步骤s41:获取待识别动物声音信号对应的视频数据;从所述视频数据中提取图像集合数据;

步骤s42:使用预设回归模型对所述图像集合数据进行动物的动作或微表情检测,得到包含动物动作或微表情的图像帧集合;并对每帧图像进行特征提取,根据动作或微表情识别模型识别所述视频数据对应的情感识别结果;

具体的,包括:

根据预设分布曲线的分布函数建立所述回归模型;

使用所述回归模型对图像区域中动物动作或微表情的出现时间和结束时间进行区间估计,得到包括所述动物动作或微表情的开始帧、持续帧和结束帧,并将所述开始帧、持续帧和结束帧作为所述图像帧集合。

其中,动作或微表情识别模型是以动物动作或微表情图像帧集合作为训练样本,以动物动作或微表情对应的情感为输出的神经网络模型。该模型可以针对少数动物进行检测,例如,狗摇尾巴一般表示开心或喜欢,猫翻滚、露出肚子一般表示开心。在实际的训练过程中,可将所有的训练音频分为训练集和测试集,由训练集对模型进行训练,再由测试集对每次训练后的模型进行测试。

步骤s43:若动作或微表情识别模型识别所述视频数据对应的情感识别结果不一致,则根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号的第二情感识别结果。

可选的,所述情感标识具体包括:开心、生气、难过、烦躁和撒娇。

可选的,所述根据预设的方式对第一情感识别结果进行调整的步骤具体包括:

将待识别动物声音信号分割成若干长度相等的预设长度段,根据第一公式计算对情感识别结果进行某个调整后的综合概率,选取综合概率最高的调整方案对第一情感识别结果进行调整,所述第一公式为:

p=k(θ)αn-i(1-α)i;

其中,k(θ)为待识别动物声音信号包含的情感的数量所对应的概率值,由样本经过统计得到,为单调递减的预设函数,θ为待识别动物声音信号包含的情感的数量,α为每一预设长度段待识别动物声音信号的情感识别的正确率,n为待识别动物声音信号所包含的预设长度段的数量,i为调整包含的情感识别结果的预设长度段的数量。

在上述实现过程中,通过将一段声音的情绪作为整体来识别,考虑一段声音情绪变化的概率,将待识别动物声音信号分割成若干长度相等的预设长度段,考虑对预设长度段情绪识别错误的概率,根据第一公式计算对情感识别结果进行某个调整后的综合概率,选取综合概率最高的调整方案对第一情感识别结果进行调整,可增加对动物声音信号进行情绪识别的准确率。

可选的,本发明的方法还包括:获取所述待识别动物声音信号的频率的高低与情感特征的相关性权重,学习所述待识别动物声音信号每一帧信号对待识别动物的情感权重,以实现监测待识别动物情感。

可选的,本发明的方法还包括:以多种图表方式显示待识别动物声音信号的情感变化,所述图表包括折线图、柱状图、散点图和仪表盘。

在上述实现过程中,通过监测待识别动物情感变化,并以多种图表方式进行展示,能方便动物照料人员及时获取动物的情感变化,以及对动物生活习性的及时掌控,制订保护策略;可适用于日常家居人与宠物之间的互动交流。

实施例二:

请参照图2所示,示出了本发明的一种动物情感识别装置,包括:

接收模块10,用于获取待识别动物声音信号;

处理模块20,用于将所述待识别动物声音信号进行预处理,得到预处理后的动物声音信号;

情感识别模块30,用于建立情感识别模型;将所述待识别动物声音信号输入情感识别模型,得到所述待识别动物声音信号的第一情感识别结果;

情感调整模块40,用于根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果。

具体的,所述情感调整模块40,可用于将待识别动物声音信号分割成若干长度相等的预设长度段,根据第一公式计算对情感识别结果进行某个调整后的综合概率,选取综合概率最高的调整方案对第一情感识别结果进行调整,所述第一公式为:

p=k(θ)αn-i(1-α)i;

其中,k(θ)为待识别动物声音信号包含的情感的数量所对应的概率值,由样本经过统计得到,为单调递减的预设函数,θ为待识别动物声音信号包含的情感的数量,α为每一预设长度段待识别动物声音信号的情感识别的正确率,n为待识别动物声音信号所包含的预设长度段的数量,i为调整包含的情感识别结果的预设长度段的数量。

在上述实现过程中,通过将一段声音的情绪作为整体来识别,考虑一段声音情绪变化的概率,将待识别动物声音信号分割成若干长度相等的预设长度段,考虑对预设长度段情绪识别错误的概率,根据第一公式计算对情感识别结果进行某个调整后的综合概率,选取综合概率最高的调整方案对第一情感识别结果进行调整,可增加对动物声音信号进行情绪识别的准确率。

可选的,本发明的装置还包括监测模块,所述监测模块,用于获取所述待识别动物声音信号的频率的高低与情感特征的相关性权重,学习所述待识别动物声音信号每一帧信号对待识别动物的情感权重,以实现监测待识别动物情感。

实施例三:

图3为本申请实施例提供的一种电子设备的结构示意图,在本申请中可以通过图3所示的示意图来描述用于实现本申请实施例的本发明一种动物情感识别方法的电子设备100。

如图3所示的一种电子设备的结构示意图,电子设备100包括一个或多个处理器102、一个或多个存储装置104,这些组件通过总线系统和/或其它形式的连接机构(未示出)互连。应当注意,图3所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备可以具有图3示出的部分组件,也可以具有图3未示出的其他组件和结构。

所述处理器102可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本申请实施例中(由处理器实现)的功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。

本发明还提供一种计算机存储介质,其上存储有计算机程序,本发明的方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在该计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机存储介质不包括电载波信号和电信信号。

对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。


技术特征:

1.一种动物情感识别方法,其特征在于,包括:

获取待识别动物声音信号;

将所述待识别动物声音信号进行预处理,得到预处理后的动物声音信号;

建立情感识别模型;将所述待识别动物声音信号输入情感识别模型,得到所述待识别动物声音信号的第一情感识别结果;

根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果。

2.根据权利要求1所述的动物情感识别方法,其特征在于,所述根据预设的方式对第一情感识别结果进行调整,得到待识别动物声音信号调整后的第二情感识别结果具体包括:获取待识别动物声音信号对应的视频数据;从所述视频数据中提取图像集合数据;

使用预设回归模型对所述图像集合数据进行动物的动作或微表情检测,得到包含动物动作或微表情的图像帧集合;并对每帧图像进行特征提取,根据动作或微表情识别模型识别所述视频数据对应的情感识别结果;

若动作或微表情识别模型识别所述视频数据对应的情感识别结果不一致,则根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号的第二情感识别结果。

3.根据权利要求1所述的动物情感识别方法,其特征在于,所述预处理包括:对获取待识别动物声音信号进行抗混叠滤波、模数变换、分帧和预加重处理。

4.根据权利要求1所述的动物情感识别方法,其特征在于,所述建立情感识别模型具体包括:提取动物的样本声音信号的特征参数为训练样本,所述特征参数包括梅尔-频率倒谱系数;以所述训练样本对应的情感标识为样本标签进行训练得到。

5.根据权利要求4所述的动物情感识别方法,其特征在于,所述情感标识包括:开心、生气、难过、烦躁和撒娇。

6.根据权利要求1所述的动物情感识别方法,其特征在于,所述根据预设的方式对第一情感识别结果进行调整的步骤具体包括:

将待识别动物声音信号分割成若干长度相等的预设长度段,根据第一公式计算对情感识别结果进行某个调整后的综合概率,选取综合概率最高的调整方案对第一情感识别结果进行调整,所述第一公式为:

p=k(θ)αn-i(1-α)i;

其中,k(θ)为待识别动物声音信号包含的情感的数量所对应的概率值,由样本经过统计得到,为单调递减的预设函数,θ为待识别动物声音信号包含的情感的数量,α为每一预设长度段待识别动物声音信号的情感识别的正确率,n为待识别动物声音信号所包含的预设长度段的数量,i为调整包含的情感识别结果的预设长度段的数量。

7.根据权利要求1所述的动物情感识别方法,其特征在于,还包括:获取所述待识别动物声音信号的频率的高低与情感特征的相关性权重,学习所述待识别动物声音信号每一帧信号对待识别动物的情感权重,以实现监测待识别动物情感。

8.根据权利要求7所述的动物情感识别方法,其特征在于,还包括:以多种图表方式显示待识别动物声音信号的情感变化,所述图表包括折线图、柱状图、散点图和仪表盘。

9.一种动物情感识别装置,其特征在于,包括:

接收模块,用于获取待识别动物声音信号;

处理模块,用于将所述待识别动物声音信号进行预处理,得到预处理后的动物声音信号;

情感识别模块,用于建立情感识别模型;将所述待识别动物声音信号输入情感识别模型,得到所述待识别动物声音信号的第一情感识别结果;

情感调整模块,用于根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果。

10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时,实现如权利要求1-8任一项所述的动物情感识别方法。

技术总结
本发明公开了一种动物情感识别方法、装置及存储介质,所述方法包括:获取待识别动物声音信号;将所述待识别动物声音信号进行预处理,得到预处理后的动物声音信号;建立情感识别模型;将所述待识别动物声音信号输入情感识别模型,得到所述待识别动物声音信号的第一情感识别结果;根据预设的方式对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果。本发明通过建立情感识别模型对动物声音信号进行识别,得到第一情感识别结果,并对第一情感识别结果进行调整,得到调整后的待识别动物声音信号第二情感识别结果,可以在动物照料过程中不依赖人为经验判断动物情感,并且情感识别结果准确。

技术研发人员:谭贵勇;黎小辉
受保护的技术使用者:广州朗国电子科技有限公司
技术研发日:2021.04.16
技术公布日:2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-7653.html

最新回复(0)