数据处理方法、装置、电子设备及存储介质与流程

专利2026-02-01  4


本申请属于深度学习,尤其涉及数据处理设备、数据处理方法、装置、电子设备及计算机可读存储介质。


背景技术:

1、卷积神经网络是今年发展起来的引起广泛重视的一种高效识别方法,对于大型图像处理有着非常出色的表现。由于卷积神经网络避免了对图像的复杂前期预处理,可直接输入原始图像,因而在图像分类等领域得到了更为广泛的应用。卷积神经网络的核心是卷积运算操作,卷积运算是指利用卷积核按特定步长在原始图像或输入特征图上滑动,和对应区域中的每个像素进行乘加运算的操作。

2、目前通常采用并行运算的方法来提高卷积神经网络的计算速度,但在采用输入通道并行运算时,由于计算单元并行运算固定数量的输入通道的数据,在输入图像通道数较少时,存储和参与运算的输入通道数据较少,使得计算单元的计算效率较低。


技术实现思路

1、本申请实施例提供了数据处理方法、装置、电子设备及存储介质,可以提高处理器基于输入通道进行并行运算时的存储利用率和卷积运算效率。

2、第一方面,本申请实施例提供了一种数据处理方法,包括:

3、获取待处理数据在各个像素位置上的各个通道的数据,得到各个像素位置所对应的各个通道数据;

4、根据上述待处理数据的通道数和上述处理器能够并行运算的通道数确定宽度并行计算量,其中,所述宽度并行计算量用于指示所述处理器在对所述待处理数据进行一次并行运算时能够处理的所述像素位置的数量;

5、若上述宽度并行计算量大于或等于2,则根据上述待处理数据确定多个第一目标数据,每个上述第一目标数据通过将上述待处理数据中的n个上述像素位置上的通道数据按照上述n个像素位置的顺序进行重排得到,上述n为根据上述宽度并行计算量确定的大于1的整数;

6、对每一个上述第一目标数据,根据上述第一目标数据和上述第一目标数据所对应的第一权值集合进行并行运算,得到上述第一目标数据对应的卷积结果,上述第一权值集合包括上述第一目标数据中各个通道数据所对应的卷积参数;

7、根据各个上述第一目标数据对应的卷积结果确定上述待处理数据的卷积结果。

8、第二方面,本申请实施例提供了一种数据处理装置,包括:

9、通道数据获取模块,用于获取待处理数据在各个像素位置上的各个通道的数据,得到各个像素位置所对应的各个通道数据;

10、宽度并行计算量获取模块,用于根据上述待处理数据的通道数和上述处理器能够并行运算的通道数确定宽度并行计算量,其中,所述宽度并行计算量用于指示所述处理器在对所述待处理数据进行一次并行运算时能够处理的所述像素位置的数量;

11、第一目标数据获取模块,用于若上述宽度并行计算量大于或等于2,则根据上述待处理数据确定多个第一目标数据,每个上述第一目标数据通过将上述待处理数据中的n个上述像素位置上的上述通道数据按照上述n个像素位置的顺序进行重排得到,上述n为根据上述宽度并行计算量确定的大于1的整数;

12、第一运算模块,用于对每一个上述第一目标数据,根据上述第一目标数据和上述第一目标数据所对应的第一权值集合进行并行运算,得到上述第一目标数据对应的卷积结果,上述第一权值集合包括上述第一目标数据中各个通道数据所对应的卷积参数;

13、第一结果获取模块,用于根据各个上述第一目标数据对应的卷积结果确定上述待处理数据的卷积结果。

14、第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的数据处理方法的步骤。

15、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中所述的数据处理方法的步骤。

16、第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第一方面中任一项所述的数据处理方法。

17、本申请实施例与现有技术相比存在的有益效果是:

18、本申请实施例中,由于宽度并行计算量根据待处理数据的通道数和处理器确定,且该宽度并行计算量用于指示处理器在对该待处理数据进行一次并行运算时能够处理的像素位置的数据,即用于指示处理器对该待处理数据进行一次并行运算时能够进行多少个像素位置的通道数据的并行运算,因此,在宽度并行计算量大于或等于2的时候,根据待处理数据确定多个第一目标数据,而每个第一目标数据是通过将待处理数据中的n个像素位置上的通道数据按照n个像素位置的顺序进行重排得到,且n为根据宽度并行计算量确定的大于1的整数,即本申请实施例的第一目标数据相当于通过将待处理数据中的至少2个像素位置上的通道数据进行重排得到,因此,在根据第一目标数据和第一目标数据所对应的第一权值集合进行并行运算时,使得处理器能够并行运算至少2个像素位置的各个通道数据,从而在提高存储利用率的同时提高了处理器的运算效率。同时,由于根据待处理数据重排得到多个第一目标数据,每个第一目标数据中又包括待处理数据中的至少2个像素位置上的通道数据,因此,基于第一目标数据得到待处理数据的卷积结果所需的时间,小于或等于基于1个像素位置的通道数据并行运算得到待处理数据的卷积结果的一半,大大减小了卷积运算时间。



技术特征:

1.一种数据处理方法,应用于处理器,其特征在于,包括:

2.如权利要求1所述的数据处理方法,其特征在于,还包括:

3.如权利要求2所述的数据处理方法,其特征在于,若所述待处理数据所对应的卷积核的宽度为w,高度为h,且所述卷积核的尺寸w*h大于2,所述若所述宽度并行计算量大于或等于2,则根据所述待处理数据确定多个第一目标数据,包括:

4.如权利要求3所述的数据处理方法,其特征在于,若所述宽度并行计算量大于或等于2,且所述宽度并行计算量小于所述卷积核的尺寸w*h,所述根据所述待处理数据确定多个第一目标数据,包括:

5.一种数据处理装置,应用于处理器,其特征在于,包括:

6.如权利要求5所述的数据处理装置,其特征在于,还包括:

7.如权利要求6所述的数据处理装置,其特征在于,所述待处理数据所对应的卷积核的宽度为w,高度为h,且所述卷积核的尺寸w*h大于2,所述第一目标数据获取模块包括:

8.如权利要求5所述的数据处理装置,其特征在于,若所述宽度并行计算量大于或等于2,且所述宽度并行计算量小于所述卷积核的尺寸w*h,所述第一目标数据获取模块包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的方法。


技术总结
本申请适用于深度学习技术领域,提供了数据处理方法、装置、电子设备及存储介质,包括:获取待处理数据在各个像素位置上的各个通道的数据,得到各个像素位置所对应的各个通道数据,根据待处理数据的通道数和处理器能够并行运算的通道数确定宽度并行计算量,若宽度并行计算量大于或等于2,则根据待处理数据确定多个第一目标数据,每个第一目标数据通过将待处理数据中的N个像素位置上的通道数据按照该N个像素位置的顺序进行重排得到,对每一个第一目标数据进行并行运算,得到第一目标数据对应的卷积结果,根据各个第一目标数据对应的卷积结果确定待处理数据的卷积结果。本申请可以提高存储利用率和卷积运算效率。

技术研发人员:蒋文,王和国
受保护的技术使用者:深圳云天励飞技术股份有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/index.php/read-1826935.html

最新回复(0)