人脸解析模型训练方法、电子设备及存储介质与流程

专利2022-05-09  10


本发明实施例涉及数据处理领域,特别涉及一种人脸解析模型训练方法、电子设备及存储介质。



背景技术:

随着近几年的深度学习技术和硬件技术的快速发展,人脸解析技术也开始使用深度学习得到模型,目前,基于深度学习的人脸解析方法是从大量带标注的训练图片中学习一个影像-影像人脸解析模型。

然而,现有的人脸解析模型训练方法依赖于大量标注图片,由于人工标注的成本较高,使得人脸解析模型训练的成本高;且目前所公开的带标注图片集主要基于欧美人脸数据,和实际人脸图片相比,人种和图片风格上存在较大差异,导致所训练的人脸解析模型的泛化效果差。



技术实现要素:

本发明实施方式的目的在于提供一种人脸解析模型训练方法、电子设备及存储介质,能够通过无标注人脸图片、增强人脸图片和变换参数训练人脸解析模型,达到降低人脸解析模型的训练成本和提高人脸解析模型的泛化效果的目的。

为解决上述技术问题,本发明的实施方式提供了一种人脸解析模型训练方法,包含:获取图片训练集,其中,所述图片训练集包含无标注人脸图片;对所述无标注人脸图片进行数据增强,获取增强图片训练集,其中,所述增强图片训练集包含所述无标注人脸图片、增强人脸图片和所述增强人脸图片对应的变换参数;基于预定义的一致性损失函数,利用所述增强图片训练集中的所述无标注人脸图片、所述增强人脸图片和所述变换参数对预设的预训练模型进行训练,获取人脸解析模型。

本发明的实施方式还提供了一种电子设备,包含:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上所述的人脸解析模型训练方法。

本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以上所述的人脸解析模型训练方法。

本发明实施方式相对于现有技术而言,在人脸解析模型训练的过程中,通过对无标注图片进行处理获取增强人脸图片和变换参数,再利用无标注图片、增强人脸图片和变换参数来训练人脸解析网络,从而达到降低人脸解析模型的训练成本和提高人脸解析模型的泛化效果的目的,解决了现有技术中主要使用基于欧美人脸数据的标注图片对人脸解析模型进行训练所导致泛化效果差和对新的训练数据进行标注成本大的技术问题。

另外,本发明实施方式提供的人脸解析模型训练方法,所述对所述无标注人脸图片进行数据增强之前还包括:将所述无标注人脸图片剪裁至预设尺寸。本发明提供的技术方案可以将无标注人脸图片剪裁至预设尺寸,避免由于无标注人脸图片无关区域太大而导致的数据计算量大的问题,使得本发明可以数据处理负载,提高人脸解析效率。

另外,本发明实施方式提供的人脸解析模型训练方法,所述图片训练集包含所述无标注人脸图片的人脸关键点;所述人脸解析模型训练方法还包括:基于预定义的关键点损失函数,利用所述无标注人脸图片训练所述人脸解析模型,其中,所述关键点损失函数通过所述人脸关键点和所述无标注人脸图片的人脸关键点预测结果获取。本发明提供的技术方案可以训练人脸解析模型,使其具备预测人脸图片关键点的功能。使得本发明可以提高人脸解析模型的实用性。

另外,本发明实施方式提供的人脸解析模型训练方法,所述人脸解析模型训练方法还包括:获取测试图片集,其中,所述测试图片集包含测试图片;利用训练后的人脸解析模型对所述测试图片集进行处理,获取所述测试图片集的人脸预测结果和所述测试图片集的人脸关键点预测结果;根据所述人脸预测结果和所述人脸关键点预测结果获取所述训练后的人脸解析模型的解析性能;若所述解析性能满足预设条件,则停止对所述人脸解析模型的训练;若所述解析性能不满足预设条件,则对所述人脸解析模型进行训练。本发明提供的技术方案可以通过所获取的解析性能自主判断是否停止对人脸解析模型的训练,使得本发明更加智能化。

另外,本发明实施方式提供的人脸解析模型训练方法,所述对所述无标注人脸图片进行数据增强,获取增强图片训练集,之前还包括:获取带标注人脸图片;基于预定义的分类损失函数,利用所述带标注人脸图片对初始模型进行训练,获取所述预训练模型,其中,所述初始模型为利用分治思想构造的神经网络模型,所述分类损失函数通过自适应权重和人脸类型损失获取。本发明提供的技术方案可以在对人脸解析模型训练之前利用少量带标注人脸图片对人脸解析模型进行预训练,使得本发明可以提高利用无标注人脸图片和增强人脸图片进行训练的分类准确性,降低人脸解析模型的训练时长。

另外,本发明实施方式提供的人脸解析模型训练方法,所述自适应权重通过所述预训练模型的各分类结果的分布概率获取;所述人脸类型损失通过所述带标注人脸图片的标注结果和所述带标注人脸图片的解析结果获取。本发明提供的技术方案在进行预训练时所使用的自适应权重函数根据各张图片的分类结果获取,避免由于皮肤区域的各个分类类型面积大小不一,统一权重情况下、面积较小的细分类型区域往往不太容易被优化的问题。使得本发明可以提高对人脸区域类型的解析效果。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。

图1是根据本发明实施方式的人脸解析模型训练方法的流程图一;

图2是根据本发明实施方式的人脸解析模型训练方法的流程图二;

图3是根据本发明实施方式的人脸解析模型训练方法的流程图三;

图4是根据本发明实施方式的人脸解析模型训练方法的流程图四;

图5是根据本发明实施方式的人脸解析模型训练方法的流程图五;

图6是根据本发明实施方式的电子设备的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。

本发明实施方式涉及一种人脸解析模型训练方法,如图1所示,具体包含:

步骤101,获取图片训练集,其中,图片训练集包含无标注人脸图片。

具体的说,所获取的图片训练集中包含有多张无标注人脸图片,无标注人脸图片是指人脸图片上不携带像素标注;除此之外,图片训练集中还可以包含每一张无标注人脸图片的人脸关键点,人脸关键点可以以标注的形式出现在每一张无标注人脸图片上,该关键点可以是人脸中心点在图片中的位置坐标,也可以是某一指定人脸部位在图片中的位置坐标,可以根据用户需求进行设定;关键点是在各无标注人脸图片组成图片训练集之前就已经检测好的,具体的检测方法不受限制,任意一种可以检测人脸关键点的方法都可以使用;而关键点在图像训练集中的存在形式也不受限制,可以保存在每一张无标注图片上的某一固定位置,也可以以单独的数据集保存等等。

此处需要注意的是:所获取的图片训练集还可以包含少量的带标注人脸图片,无标注人脸图片所包含的无标注人脸图片和带标注人脸图片在数量上有一定的要求(大量的无标注人脸图片和少量的带标注人脸图片),假设无标注人脸图片包括n张无标注人脸图片和m张带标注人脸图片,m和n均为大于0的整数,且n远大于m,也可以n的大小是m的大小乘以预设倍数。图片训练集中的带标注人脸图片有两个作用:一是在使用模型对无标注人脸图片处理之前,先对带标注人脸图片进行处理,来提高对无标注人脸图片的处理效果;而是在使用模型对无标注人脸处理的过程中,对带标注人脸图像进行处理,来防止人脸解析模型出现惰化的现象,保障人脸解析模型的解析能力。

步骤102,对无标注人脸图片进行数据增强,获取增强图片训练集,其中,增强图片训练集包含无标注人脸图片、增强人脸图片和增强人脸图片对应的变换参数。

具体的说,在获取到图片训练集之后,需要对图片训练集中的各张无标注人脸图片进行数据增强处理,以获取增强图片训练集,增强图片训练集中包含有无标注人脸图片、增强人脸图片和增强人脸图片对应的变换参数,增强人脸图片也包括未标注增强人脸图片(当图片训练集中包含少量带标注人脸图片时,增强图片训练集也包含带标注人脸增强图片),变换参数用于表示对无标注人脸图片进行了何种数据增强;数据增强处理的方法可以包含镜像处理、剪裁处理、拉伸处理、旋转处理、模糊处理、亮度处理、对比度处理、噪声处理中的一种或几种,也可以对不同的无标注人脸图片采用不同的数据增强处理方法,其中,镜像处理是指对图片进行左右镜像、上下镜像或者对角镜像,剪裁处理是指是先在原始图片上随机裁剪出部分人脸图片,在将裁剪出的部分人脸照片的大小调整到固定尺寸,拉伸处理是指将原始图片沿着水平方向或竖直方向进行拉伸,并将拉伸后的图片填补到固定尺寸,旋转处理是指从多组不同角度的多个模板关键点中随机选择一组进行仿射变换,模糊处理、亮度处理、对比度处理和噪声处理是指采用某种算法对原始图片进行模糊、亮度调整、对比度调整和噪声处理。

步骤103,基于预定义的一致性损失函数,利用增强图片训练集中的无标注人脸图片、增强人脸图片和变换参数对预设的预训练模型进行训练,获取人脸解析模型。

具体的说,将各张无标注人脸图片、各张增强人脸图片和各个变换参数输入预训练模型中进行处理(预训练模型是利用少量带标注人脸图片进行训练后的利用分治思想构造的神经网络模型),获取各张无标注人脸图片和各张增强人脸图片的人脸预测结果,并对各张无标注人脸图片的人脸预测结果根据各自对应的变换参数进行数据增强变换,获取各张无标注人脸图片的增强人脸预测结果,并根据各张无标注人脸图片的增强人脸预测结果各张增强人脸图片的人脸预测结果计算一致性损失函数,然后根据一致性损失函数的值判断训练是否停止,训练停止之后的模型便是人脸解析模型,人脸解析模型的输出是图片,该图片上划分有各个区域,每个区域上标注有h*w*n,h为该区域的长,w为该区域的宽,n为该区域的人脸类型,n的值是该区域的像素值经softmax函数归一化后的概率向量,人脸类型可以包含:鼻子、眼睛、嘴巴等人脸部位。

一致性损失函数的表达式为:

losspair=|transform(faceparsingnet(pic))-faceparsingnet(transform(pic))|

其中,transform(faceparsingnet(pic))为无标注人脸图片的增强人脸预测结果;faceparsingnet(transform(pic))为增强人脸图片的人脸预测结果。

本发明实施方式相对于现有技术而言,在人脸解析模型训练的过程中,通过对无标注图片进行处理获取增强人脸图片和变换参数,再利用无标注图片、增强人脸图片和变换参数来训练人脸解析网络,从而达到降低人脸解析模型的训练成本和提高人脸解析模型的泛化效果的目的,解决了现有技术中主要使用基于欧美人脸数据的标注图片对人脸解析模型进行训练所导致泛化效果差和对新的训练数据进行标注成本大的技术问题。

本发明的实施方式涉及一种人脸解析模型训练方法,如图2所示,具体包含:

步骤201,获取图片训练集,其中,图片训练集包含无标注人脸图片。

具体的说,本步骤与本发明实施方式中的步骤101大致相同,此处不一一赘述。

步骤202,将各张无标注人脸图片剪裁至预设尺寸。

具体的说,在获取到无标注人脸图片后,可以先对无标注人脸图片进行剪裁处理,使所有的无标注人脸图片成为一个同一尺寸的图片,方便后期进行处理,用户可以根据自身需求或者图片训练集各图片的大小情况设定预设尺寸,同时本发明也不对图片剪裁工具进行限制。

此处需要注意的是:当图片训练集中也包含少量的带标注人脸图片时,也需要对带标注人脸图片进行同样的操作。

步骤203,依次对剪裁后的各张无标注人脸图片进行数据增强,获取增强图片训练集,其中,增强图片训练集包含无标注人脸图片、增强人脸图片和增强人脸图片对应的变换参数。

具体的说,本步骤与本发明实施方式中的步骤102大致相同,此处不一一赘述。

步骤204,基于预定义的一致性损失函数,利用增强图片训练集中的无标注人脸图片、增强人脸图片和变换参数对预设的预训练模型进行训练,获取人脸解析模型。

具体的说,本步骤与本发明实施方式中的步骤103大致相同,此处不一一赘述。

本发明实施方式相对于现有技术而言,在其他实施方式所带来的有益效果的基础之上,还可以将无标注人脸图片剪裁至预设尺寸,避免由于无标注人脸图片中的无关区域太大而导致的数据计算量大的问题,使得本发明可以数据处理负载,提高人脸解析效率。

本发明的实施方式涉及一种人脸解析模型训练方法,如图3所示,具体包含:

步骤301,获取图片训练集,其中,图片训练集包含无标注人脸图片和所无标注人脸图片的人脸关键点。

具体的说,本步骤与本发明实施方式中的步骤101大致相同,此处不一一赘述。

步骤302,对无标注人脸图片进行数据增强,获取增强图片训练集,其中,增强图片训练集包含无标注人脸图片、增强人脸图片和增强人脸图片对应的变换参数。

具体的说,本步骤与本发明实施方式中的步骤102大致相同,此处不一一赘述。

步骤303,基于预定义的一致性损失函数,利用增强图片训练集中的无标注人脸图片、增强人脸图片和变换参数对预设的预训练模型进行训练,获取人脸解析模型。

具体的说,本步骤与本发明实施方式中的步骤103大致相同,此处不一一赘述。

步骤304,基于预定义的关键点损失函数,利用无标注人脸图片训练人脸解析模型,其中,关键点损失函数通过人脸关键点和无标注人脸图片的人脸关键点预测结果获取。

具体的说,在获取到人脸解析模型之后,还可以再次将各张无标注人脸图片输入人脸解析模型处理,获取各张无标注人脸图片的人脸关键点预测结果,并根据人脸关键点预测结果和图片训练集所包含无标注人脸图片的人脸关键点计算损失函数,根据关键点损失函数判断人脸解析模型的是否停止训练,停止训练后的人脸解析模型便具备预测人脸关键点的功能,其中,人脸解析模型可以通过任何一种人脸关键点检测算法来对无标注人脸图片进行处理。关键点损失函数的表达式为:

losscri=|coorpred-coorgt|

其中,coorgt为无标注人脸图片上所标注的人脸关键点,coorparsing为无标注人脸图片的人脸关键点预测结果。

此外需要注意的是,上述步骤说明的预测人脸关键点功能的训练是处于人脸解析功能训练之后仅仅是举例说明,也可以将预测人脸关键点功能的训练放在人脸解析功能的训练步骤之前,在训练预训练模型时,所获取的带标注图片训练集也可以包含各张带标注人脸图片的人脸关键点,预训练模型除去训练分类之外还可以进行预测人脸关键点功能的训练。

此外需要注意的是,本发明还可以使用无标注人脸图片和增强人脸图片一同进行预测人脸关键点功能的训练,当需要使用增强人脸图片进行预测人脸关键点功能的训练时,再对未标注人脸图片进行数据增强时不能够选择拉伸处理、旋转处理和镜像处理等会影响人脸关键点位置的数据增强处理方法,以免会影响所训练的人脸解析模型在预测人脸关键点时的准确度,在使用无标注人脸图片和增强人脸图片一同进行预测人脸关键点功能的训练时所使用的损失函数与一致性损失函数相差不大。

本发明实施方式相对于现有技术而言,在其他实施方式所带来的有益效果的基础之上,还可以通过训练人脸解析模型使其具备预测人脸图片关键点的功能,使得本发明可以提高人脸解析模型的实用性。

本发明的实施方式涉及一种人脸解析模型训练方法,如图4所示,具体包含:

步骤401,获取图片训练集,其中,图片训练集包含无标注人脸图片和无标注人脸图片的人脸关键点。

具体的说,本步骤与本发明实施方式中的步骤101大致相同,此处不一一赘述。

步骤402,对无标注人脸图片进行数据增强,获取增强图片训练集,其中,增强图片训练集包含无标注人脸图片、增强人脸图片和增强人脸图片对应的变换参数。

具体的说,本步骤与本发明实施方式中的步骤102大致相同,此处不一一赘述。

步骤403,基于预定义的一致性损失函数,利用增强图片训练集中的无标注人脸图片、增强人脸图片和变换参数对预设的预训练模型进行训练,获取人脸解析模型。

具体的说,本步骤与本发明实施方式中的步骤103大致相同,此处不一一赘述。

步骤404,基于预定义的关键点损失函数,利用无标注人脸图片训练人脸解析模型,其中,关键点损失函数通过人脸关键点和无标注人脸图片的人脸关键点预测结果获取。

具体的说,本步骤与本发明实施方式中的步骤404大致相同,此处不一一赘述。

步骤405,获取测试图片集,其中,测试图片集包含测试图片。

具体的说,所获取的测试图片是任何一种包含人脸图像的照片,在获取测试图片之后,可以对所获取的测试图片进行剪裁处理,使所有的测试图片的尺寸都相同,测试图片集中还可以包含各张测试图片的正确人脸预测结果和各张测试图片的正确人脸关键点。

步骤406,利用训练后的人脸解析模型对测试图片集进行处理,获取测试图片集的人脸预测结果和测试图片集的人脸关键点预测结果。

具体的说,使用训练后的人脸解析模型对测试图片集中的各张测试图片进行处理,获取各张测试图片的人脸预测结果和人脸关键点预测结果。

步骤407,根据人脸预测结果和人脸关键点预测结果获取训练后的人脸解析模型的解析性能。

具体的说,将通过人脸解析模型获取的各张测试图片的人脸预测结果和人脸关键点预测结果与测试图片训练集中的各张测试图片的正确人脸预测结果和正确人脸关键点进行对比,获取所训练解析模型的解析性能,解析性能可以以正确率的形式反馈,也可以以其他形式反馈。

步骤408,判断解析性能是否满足预设条件。

具体的说,将所获取的解析性能与预设条件进行比较,例如:预设条件为准确率大于等于90%;当满足预设条件时,则说明人脸解析模型已经成熟,不需要再进行训练便可以投入使用,此时执行步骤409;当不满足预设条件时,则说明人脸解析模型的准确度还有待提高,还需要再进行训练以提高准确度,此时执行步骤410。

步骤409,停止对人脸解析模型的训练。

步骤410,对人脸解析模型进行训练。

此处需要注意的是:本实施例举例说明的是,根据人脸预测结果和人脸关键点预测结果判断解析性能,当人脸解析模型未进行人脸关键点预测功能的训练时,仅采用人脸预测结果判断解析性能。

本发明实施方式相对于现有技术而言,在其他实施方式所带来的有益效果的基础之上,还可以通过所获取的解析性能自主判断是否停止对人脸解析模型的训练,使得本发明更加智能化。

本发明的实施方式涉及一种人脸解析模型训练方法,如图5所示,具体包含:

步骤501,获取图片训练集,其中,图片训练集包含无标注人脸图片和无标注人脸图片的人脸关键点和带标注人脸图片。

具体的说,本步骤与本发明实施方式步骤101所提及的相同,此处不一一赘述。

步骤502,基于预定义的分类损失函数,利用带标注人脸图片对初始模型进行训练,获取预训练模型,其中,初始模型为利用分治思想构造的神经网络模型,分类损失函数通过自适应权重和人脸类型损失获取。

具体的说,本申请在获取到图片训练集中的带标注人脸图片后,可以先使用带标注人脸图像对初始模型进行预训练来获取预训练模型,使得本申请使用的预训练模型可以更好的对无标注人脸图片进行处理;在本申请的初始模型就是基于分治思想构造的神经网络模式,分治思想是指对于输入的带标注人脸图片,先分割成三个大类(背景、皮肤、头发)之后对于预测出的皮肤区域,再进行进一步的细分(人脸、鼻子、眼睛、嘴巴、眉毛、耳朵、脖子等),完成对带标注人脸图片的分类,之后基于分类结果解析各人脸类型区域的像素值并获取带标注人脸图片的人脸类型,再根据人脸类型计算分类损失函数,判断是否停止训练,停止训练之后所获取的就是预训练模型。

分类损失函数的表达式为:

其中,为人脸类型损失函数,wi为自适应权重函数,i为像素下标,泛指图片中的任一像素,该像素值是经softmax函数归一化后的概率向量,可以用于表示人脸类型;

人脸类型损失的表达式为:

其中,为模型对带标注人脸图片的解析结果,为带标注人脸图片的人脸标注结果;

自适应权重的表达式为:

其中,facetypei为人脸类型,frequency(facetype0)为人脸类型i概率,a为预设常数;

人脸类型概率的表达式为:

其中,numpixel(facetypei)当前人脸类型的像素个数,h为当前人脸图片的长度,w为当前人脸图片的宽度。

步骤503,对无标注人脸图片进行数据增强,获取增强图片训练集,其中,增强图片训练集包含无标注人脸图片、增强人脸图片和增强人脸图片对应的变换参数。

具体的说,本步骤与本发明实施方式中的步骤102大致相同,此处不一一赘述。

步骤504,基于预定义的一致性损失函数,利用增强图片训练集中的无标注人脸图片、增强人脸图片和变换参数对预训练模型进行训练,获取人脸解析模型。

具体的说,本步骤与本发明实施方式中的步骤103大致相同,此处不一一赘述。

本发明实施方式相对于现有技术而言,在其他实施方式所带来的有益效果的基础之上,还可以在对人脸解析模型训练之前利用少量带标注图片对人脸解析模型进行预训练,且进行预训练时所使用的自适应权重根据各张无标注人脸图片的人类类型的分布概率获取的;使得本发明可以提高利用无标注人脸图片和增强人脸图片进行训练的分类准确性、降低人脸解析模型的训练时长和提高对人脸区域类型的解析效果,同时采用分治思想构造神经网络模型可以使得模型学习更加简单,加速模型的训练。

本发明实施方式涉及一种电子设备,如图6所示,包含:

至少一个处理器601;以及,

与所述至少一个处理器601通信连接的存储器602;其中,

所述存储器602存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器601执行,以使所述至少一个处理器601能够执行本发明以上任一所述的人脸解析模型训练方法。

其中,存储器和处理器采用总线方式连接,总线可以包含任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。

处理器负责管理总线和通常的处理,还可以提供各种功能,包含定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。

本发明实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。

即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包含若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包含:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

转载请注明原文地址:https://doc.8miu.com/read-250333.html

最新回复(0)