本技术涉及计算机,特别是涉及一种分类模型构建方法、对象分类方法、装置和计算机设备。
背景技术:
1、随着计算机技术的发展,机器学习的应用领域越来越广泛,例如,可以应用在对象分类领域,通过机器学习模型对待分类对象进行分类。其中,待分类对象具体可为图像、文本等等。
2、目前,主要通过逻辑回归来进行对象分类。在一对多策略中,需要针对每一个分类类别训练一个独立的逻辑回归模型,每个逻辑回归模型决定对应分类类别与其他所有分类类别之间的分类边界,因此,当有多个分类类别时,则需要通过多个逻辑回归模型来对待分类对象进行分类,从而耗费较多的电力、计算机等资源。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够节约资源的分类模型构建方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种分类模型构建方法,所述方法包括:
3、获取待分类对象和多类别集合;所述多类别集合包括从多种分类类别各自对应的样本集中抽取出的分类样本;
4、根据预设的数值约束条件,将所述待分类对象投影至基于所述多类别集合确定的多类别向量空间,得到所述待分类对象所对应的特征投影向量;所述数值约束条件,为用于对特征投影向量中各元素的大小进行约束的条件;
5、调用目标分类模型对所述待分类对象所对应的特征投影向量中的元素进行融合处理,得到融合特征向量,并基于所述融合特征向量确定所述待分类对象的分类结果。
6、第二方面,本技术还提供了一种分类模型构建装置,所述装置包括:
7、第一投影模块,用于获取待分类对象和多类别集合;所述多类别集合包括从多种分类类别各自对应的样本集中抽取出的分类样本;根据预设的数值约束条件,将所述待分类对象投影至基于所述多类别集合确定的多类别向量空间,得到所述待分类对象所对应的特征投影向量;所述数值约束条件,为用于对特征投影向量中各元素的大小进行约束的条件;
8、分类模块,用于调用目标分类模型对所述待分类对象所对应的特征投影向量中的元素进行融合处理,得到融合特征向量,并基于所述融合特征向量确定所述待分类对象的分类结果。
9、在其中一个实施例中,所述第一投影模块用于确定所述多类别集合中的每一列各自对应的分类类别,并确定所述多类别集合中的每一列在对应分类类别下的基向量;根据所述多类别集合中的每一列分别在对应分类类别下的基向量,确定多类别向量空间。
10、在其中一个实施例中,所述第一投影模块用于获取投影模型;所述投影模型,包括基于数值约束条件生成的数值约束模型;获取初始的特征投影向量,将所述初始的特征投影向量、所述待分类对象的对象特征和所述多类别集合输入至所述投影模型,朝着最小化投影模型输出结果的方向对所述初始的特征投影向量进行调整,并在调整的过程中通过所述数值约束模型对调整得到的特征投影向量中的各元素进行数值大小约束;将投影模型输出结果最小化时确定的特征投影向量,作为所述待分类对象所对应的特征投影向量。
11、在其中一个实施例中,所述第一投影模块用于将所述初始的特征投影向量作为在首个轮次生成的特征投影向量;在从第二个轮次起的当前轮次中,根据所述多类别集合、在前一个轮次生成的特征投影向量和所述待分类对象的对象特征,生成当前轮次的特征投影向量;进入下一个轮次,将下一个轮次作为新的当前轮次,并返回根据所述多类别集合、在前一个轮次生成的特征投影向量和所述待分类对象的对象特征,生成当前轮次的特征投影向量的步骤继续执行,直至达到预设停止条件;将在最后一个轮次生成的特征投影向量,作为所述待分类对象所对应的特征投影向量。
12、在其中一个实施例中,所述第一投影模块用于将所述多类别集合与在前一个轮次生成的特征投影向量进行融合,得到当前轮次的第一融合特征;确定所述当前轮次的第一融合特征和所述待分类对象的对象特征之间的第一差异;获取预设的步长参数,并将所述多类别集合、所述第一差异和所述步长参数进行融合,得到当前轮次的第二融合特征;根据所述在前一个轮次生成的特征投影向量和所述当前轮次的第二融合特征之间的第二差异,确定当前轮次的中间特征投影向量;根据当前轮次的中间特征投影向量,确定当前轮次的特征投影向量。
13、在其中一个实施例中,所述第一投影模块用于获取预设的超参数和预设的步长参数,并将所述超参数与所述步长参数进行融合,得到融合参数;根据在当前轮次生成的中间特征投影向量和所述融合参数之间的第三差异,确定当前轮次的特征投影向量。
14、在其中一个实施例中,所述分类模块还用于将所述待分类对象所对应的特征投影向量输入至目标分类模型,以触发所述目标分类模型将所述目标分类模型的权重矩阵与所述待分类对象所对应的特征投影向量中的元素进行融合,得到所述待分类对象所对应的融合特征向量;;对所述融合特征向量进行归一化处理,得到归一化结果,并基于所述归一化结果确定所述待分类对象的分类结果。
15、第三方面,本技术还提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本技术实施例提供的任一种对象分类方法中的步骤。
16、第四方面,本技术还提供了一种计算机可读存储介质,所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本技术实施例提供的任一种对象分类方法中的步骤。
17、第五方面,本技术还提供了一种计算机程序产品,所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本技术实施例提供的任一种对象分类方法中的步骤。
18、上述对象分类方法、装置、计算机设备、存储介质和计算机程序产品,通过获取待分类对象和多类别集合,可将待分类对象投影至多类别集合所对应的多类别向量空间中,这样便可得到待分类对象所对应的特征投影向量。通过得到待分类对象的特征投影向量,可将特征投影向量输入至训练得到的目标分类模型,通过目标分类模型得到待分类对象的分类结果。由于只需通过一个模型即可得到分类结果,相比于传统的需要通过多个模型才能够得到分类结果,本技术可节约模型运行时所耗费的电力、计算机等资源。
19、第一方面,本技术提供了一种分类模型构建方法,所述方法包括:
20、获取多种分类类别各自对应的样本集,并根据分别从每个所述样本集中抽取出的第一分类样本,生成多类别集合;
21、确定所述多类别集合所对应的多类别向量空间;
22、从每个所述样本集中分别抽取出第二分类样本,根据预设的数值约束条件,将抽取出的每个第二分类样本分别投影至所述多类别向量空间,得到每个所述第二分类样本各自对应的特征投影向量;所述数值约束条件,为用于对特征投影向量中各元素的大小进行约束的条件;
23、根据每个所述第二分类样本各自对应的特征投影向量,确定每个所述第二分类样本各自对应的预测分类结果;
24、根据每个所述第二分类样本各自对应的预测分类结果和标准分类结果之间的差异,对分类模型进行训练,得到目标分类模型。
25、第二方面,本技术还提供了一种分类模型构建装置,所述装置包括:
26、多类别集合生成模块,用于获取多种分类类别各自对应的样本集,并根据分别从每个所述样本集中抽取出的第一分类样本,生成多类别集合;
27、第二投影模块,用于确定所述多类别集合所对应的多类别向量空间;从每个所述样本集中分别抽取出第二分类样本,根据预设的数值约束条件,将抽取出的每个第二分类样本分别投影至所述多类别向量空间,得到每个所述第二分类样本各自对应的特征投影向量;所述数值约束条件,为用于对特征投影向量中各元素的大小进行约束的条件;
28、训练模块,用于根据每个所述第二分类样本各自对应的特征投影向量,确定每个所述第二分类样本各自对应的预测分类结果;根据每个所述第二分类样本各自对应的预测分类结果和标准分类结果之间的差异,对分类模型进行训练,得到目标分类模型。
29、在其中一个实施例中,所述多类别集合生成模块用于从多种分类类别各自对应的样本集中分别抽取出预设数量个第一分类样本,并确定抽取出的每个第一分类样本各自的样本特征;根据每个所述第一分类样本各自的样本特征,生成多类别集合。
30、在其中一个实施例中,所述多类别集合生成模块用于根据抽取出的每个所述第二分类样本各自所属的样本集,确定每个所述第二分类样本各自对应的分类类别;按照每个所述第二分类样本各自对应的分类类别,对每个所述第二分类样本各自的样本特征进行排序,得到多类别集合。
31、在其中一个实施例中,所述第二投影模块用于确定所述多种分类类别各自对应的样本集中样本的数量;根据所述多种分类类别各自对应的样本集中样本的数量,确定每个所述样本集各自对应的样本抽取数量;根据每个所述样本集各自对应的样本抽取数量,从每个所述样本集中分别抽取出第二分类样本。
32、在其中一个实施例中,所述预测分类结果包括第二分类样本在每种分类类别下的预测概率值;所述标准分类结果包括第二分类样本在每种分类类别下的标准概率值;在其中一个实施例中,所述训练模块用于针对所述多种分类类别中的每种分类类别,确定每个所述第二分类样本分别在所针对的分类类别下的预测概率值和标准概率值;针对每个所述第二分类样本,对所针对的第二分类样本在所针对的分类类别下的预测概率值和标准概率值进行融合,得到所针对的第二分类样本在所针对的分类类别下的融合概率值;根据每个所述第二分类样本在每种分类类别下的融合概率值,对分类模型进行训练,得到目标分类模型。
33、第三方面,本技术还提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本技术实施例提供的任一种分类模型构建方法中的步骤。
34、第四方面,本技术还提供了一种计算机可读存储介质,所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本技术实施例提供的任一种分类模型构建方法中的步骤。
35、第五方面,本技术还提供了一种计算机程序产品,所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本技术实施例提供的任一种分类模型构建方法中的步骤。
36、上述分类模型构建方法、装置、计算机设备、存储介质和计算机程序产品,通过获取多个分类类别各自对应的样本集,可通过每个样本集中的第一分类样本,生成多类别集合。由于多类别集合中包括每种分类类别下的样本特征,因此,可确定由多类别集合构成的多类别向量空间,并将从样本集中的抽取出的第二分类样本投影至该多类别向量空间中,以基于投影操作确定多类别集合中与第二分类样本的样本特征相似的特征,进而基于相似度来得到第二分类样本所对应的特征投影向量。其中,特征投影向量中的各元素可看成是一个权重,当多类别集合中的某个分类类别下的样本特征与第二分类样本的样本特征相似,则与该分类类别下的样本特征相对应的权重就越高,权重越高,则第二分类样本属于该分类类别的概率就越大,因此,本技术可基于特征投影向量来确定第二分类样本的预测分类结果。通过确定预测分类结果,可基于预测分类结果和标准分类结果来对分类模型进行训练,以得到训练好的目标分类模型,通过目标分类模型输出准确的分类结果。
37、由于本技术在模型训练的过程中设置有数值约束条件,而数值约束条件可用于对特征投影向量中各元素的大小进行约束,以防止各元素的值过大。由于过大的元素会提升模型训练的复杂度,因此,本技术可通过数值约束条件对特征投影向量中的元素进行约束的方式会降低模型训练的复杂度,从而提升模型训练的训练效率。此外,由于本技术在具有多个分类类别时,也只需训练一个模型即可,相比于传统的需要针对每种分类类别均训练一个模型,本技术减少了需要训练的模型的数量,节约了模型训练时所耗费的电力、计算机等资源。
1.一种对象分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述根据预设的数值约束条件,将所述待分类对象投影至基于所述多类别集合确定的多类别向量空间,得到所述待分类对象所对应的特征投影向量,包括:
4.根据权利要求3所述的方法,其特征在于,所述朝着最小化投影模型输出结果的方向对所述初始的特征投影向量进行调整,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述多类别集合、在前一个轮次生成的特征投影向量和所述待分类对象的对象特征,生成当前轮次的特征投影向量,包括:
6.根据权利要求5所述的方法,其特征在于,所述根据当前轮次的中间特征投影向量,确定当前轮次的特征投影向量,包括:
7.根据权利要求1所述的方法,其特征在于,所述调用目标分类模型对所述待分类对象所对应的特征投影向量中的元素进行融合处理,得到融合特征向量,包括:
8.一种分类模型构建方法,其特征在于,所述方法包括:
9.根据权利要求8所述的方法,其特征在于,所述预测分类结果包括第二分类样本在每种分类类别下的预测概率值;所述标准分类结果包括第二分类样本在每种分类类别下的标准概率值;
10.根据权利要求8所述的方法,其特征在于,所述根据分别从每个所述样本集中抽取出的第一分类样本,生成多类别集合,包括:
11.根据权利要求10所述的方法,其特征在于,所述根据每个所述第一分类样本各自的样本特征,生成多类别集合,包括:
12.根据权利要求8所述的方法,其特征在于,所述从每个所述样本集中分别抽取出第二分类样本,包括:
13.一种对象分类装置,其特征在于,所述装置包括:
14.一种分类模型构建装置,其特征在于,所述装置包括:
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
17.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
