视频处理方法、装置、电子设备及计算机可读存储介质与流程

专利2022-05-10  36



1.本技术涉及计算机视频处理领域,具体而言,涉及一种视频处理方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.在机器视觉应用中,在对同一任务下的多路视频进行检测处理时,通常采用一个算法模块处理每个场景的输入视频,然后再汇总所有处理结果。在每路视频的处理环节中,每路视频的每个图像帧需要调用一次算法模型,在多路视频共用一个算法模型的情况下,存在因异步调用模型导致处理阻塞,而影响视频处理的效率。


技术实现要素:

3.本技术实施例的目的在于提供一种视频处理方法、装置、电子设备及计算机可读存储介质,能够改善在视频处理过程中因调用模型导致处理阻塞,而影响视频处理的效率的问题。
4.为了实现上述目的,本技术的实施例通过如下方式实现:
5.第一方面,本技术实施例提供一种视频处理方法,所述方法包括:
6.获取n路第一视频数据,n为大于1的整数;
7.将所述n路第一视频数据解码为包含图像帧的n路第二视频数据;
8.将所述n路第二视频数据中,时序相对应的图像帧组合成图像批块;
9.将所述图像批块输入预设检测模型,得到所述预设检测模型对所述图像批块输出的检测结果,所述检测结果包括与所述图像批块中的至少一路视频对应图像帧的分类结果。
10.在上述的实施方式中,通过将多路视频的图像帧组合成图像批块,然后再调用预设检测模型对图像批块进行检测,如此,无需对每路视频数据的图像帧单独调用预设检测模型进行检测,从而可以减少调用模型的次数,避免因调用模型次数多而造成处理阻塞,提升视频处理的效率。
11.结合第一方面,在一些可选的实施方式中,将所述n路第二视频数据中,时序相对应的图像帧组合成图像批块,包括:
12.当所述n路第二视频数据的帧率相同时,将所述n路第二视频数据中,时序相同的图像帧组合成所述图像批块。
13.在上述的实施方式中,通过将时序相同的图像帧组合成图像批块,可以使得图像批块中呈现的图像内容的时间相同,从而提高多路视频识别的同步性。
14.结合第一方面,在一些可选的实施方式中,将所述n路第二视频数据中,时序相对应的图像帧组合成图像批块,包括:
15.当所述n路第二视频数据的帧率不相同时,在所述n路第二视频数据中,将帧率大于目标帧率的第二视频数据进行丢帧处理,得到帧率均为所述目标帧率的n路第二视频数
据;其中,所述目标帧率为所述n路第二视频数据中的最小帧率;
16.将帧率均为所述目标帧率的n路第二视频数据中,时序相同的图像帧组合成所述图像批块。
17.在上述的实施方式中,当帧率不相同时,通过对高帧率的视频进行丢帧处理,以使n路视频的帧率相同,如此,有利于使得组合得到的图像批块中呈现的图像内容的时间相同或相近。
18.结合第一方面,在一些可选的实施方式中,将所述n路第二视频数据中,时序相对应的图像帧组合成图像批块,包括:
19.将所述n路第二视频数据中的图像帧的尺寸转换为预设尺寸;
20.将所述n路第二视频数据中时序相对应的所述预设尺寸的图像帧组合成所述图像批块。
21.在上述的实施方式中,通过将每路视频的图像帧转换为预设尺寸,如此,可以实现每路视频的图像帧尺寸统一,便于预设检测模型进行识别处理。
22.结合第一方面,在一些可选的实施方式中,将所述n路第一视频数据解码为包含图像帧的n路第二视频数据,包括:
23.通过图像处理器将所述n路第一视频数据编码为n路第三视频数据;
24.通过所述图像处理器将所述n路第三视频数据解码为包含图像帧的所述n路第二视频数据,所述第二视频数据存储于显卡内存中,所述第一视频数据为基于预设传输协议的视频流,所述第二视频数据为基于预设视频格式的视频数据,所述第三视频数据为基于预设编码格式的视频数据,所述预设传输协议包括实时流传输协议或实时消息传输协议;所述预设编码格式包括h264编码格式或h265编码格式,所述预设视频格式包括rgb格式或yuv格式。
25.在上述的实施方式中,通过图像处理器对视频数据进行硬件解码,有利于提高图像解码的效率。另外,解码后的视频图像存储于显卡内存中,在进行视频图像识别时,便可以直接从显存中提取图像,提升图像处理的输入读取效率,无需如现有方式先将解码的视频图像存储于内存,在需要进行图像处理时,再从内存搬移至显卡内存,再从显卡内存提取图像。
26.结合第一方面,在一些可选的实施方式中,输入所述预设检测模型中的所述图像批块为经过预处理的图像批块,所述预处理包括去噪处理、标准化处理、平移处理、旋转处理、翻转处理中的至少一种。
27.结合第一方面,在一些可选的实施方式中,所述预设检测模型为基于深度学习的网络模型。
28.第二方面,本技术实施例还提供一种视频处理装置,所述装置包括:
29.视频获取单元,用于获取n路第一视频数据,n为大于1的整数;
30.视频解码单元,用于将所述n路第一视频数据解码为包含图像帧的n路第二视频数据;
31.图像组合单元,用于将所述n路第二视频数据中,时序相对应的图像帧组合成图像批块;
32.检测单元,用于将所述图像批块输入预设检测模型,得到所述预设检测模型对所
述图像批块输出的检测结果,所述检测结果包括与所述图像批块中的至少一路视频对应图像帧的分类结果。
33.第三方面,本技术实施例还提供一种电子设备,包括相互耦合的处理器及存储器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述电子设备执行上述的方法。
34.第四方面,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的方法。
附图说明
35.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
36.图1为本技术实施例提供的电子设备的结构示意图。
37.图2为本技术实施例提供的视频处理方法的流程示意图。
38.图3为本技术实施例提供的四路视频的图像帧组合成图像批块的场景示意图。
39.图4为本技术实施例提供的视频处理装置的框图。
40.图标:10

电子设备;11

处理模块;12

存储模块;13

摄像头;200

视频处理装置;210

视频获取单元;220

视频解码单元;230

图像组合单元;240

检测单元。
具体实施方式
41.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。需要说明的是,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
42.请参照图1,本技术提供一种电子设备10,可以用于多路视频进行分析检测,可以提高对多路视频处理的效率。其中,电子设备10可以包括处理模块11及存储模块12。存储模块12内存储计算机程序,当计算机程序被所述处理模块11执行时,使得电子设备10能够执行下述视频处理方法中的各步骤。
43.当然,电子设备10还可以包括其他模块,例如,电子设备10还可以包括图形处理器(graphics processing unit,gpu)、摄像头13。图形处理器可以用于对视频数据进行解码,摄像头13拍摄的视频可以传输至处理模块11。在其他实施方式中,摄像头13可以为外接于电子设备10的独立模块。其中,摄像头13的数量可以为n个,n为大于1的整数,这里对摄像头13的数量不作具体限定。
44.处理模块11、存储模块12以及图形处理器、摄像头13各个元件之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
45.电子设备10可以为具有图形处理器的个人电脑、服务器等设备,这里不作具体限定。
46.请参照图2,本技术还提供一种视频处理方法,可以应用于上述的电子设备10,由电子设备10执行或实现方法的各步骤。方法可以包括如下步骤:
47.步骤s110,获取n路第一视频数据,n为大于1的整数;
48.步骤s120,将所述n路第一视频数据解码为包含图像帧的n路第二视频数据;
49.步骤s130,将所述n路第二视频数据中,时序相对应的图像帧组合成图像批块;
50.步骤s140,将所述图像批块输入预设检测模型,得到所述预设检测模型对所述图像批块输出的检测结果,所述检测结果包括与所述图像批块中的至少一路视频对应图像帧的分类结果。
51.在上述的实施方式中,通过将多路视频的图像帧组合成图像批块,然后再调用预设检测模型对图像批块进行检测,如此,无需对每路视频数据的图像帧单独调用预设检测模型进行检测,从而可以减少调用模型的次数,避免因调用模型次数多而造成处理阻塞,提升视频处理的效率。
52.下面将对方法的各步骤进行详细阐述,如下:
53.在步骤s110中,电子设备10可以从摄像头或其他中间设备获取n路第一视频数据。即,电子设备10可以直接从n个摄像头,直接获取到n路实时的视频数据。
54.或者,电子设备10也可以通过中间设备,间接获取n路第一视频数据。中间设备可以根据实际情况进行灵活确定,例如,可以为存储视频数据的服务器。比如,n个摄像头拍摄得到的n路视频数据先存储于服务器,然后,电子设备10再从服务器获取所存储n路视频数据。
55.可理解地,n路第一视频数据可以为实时的视频数据,或者为历史视频数据,这里不作具体限定。视频数据的路数n,通常为多路,可以根据实际情况进行灵活确定,这里对路数n不作具体限定。
56.在步骤s120中,第一视频数据通常为视频流,为拍摄的视频在传输过程中的数据形态,即为没有被解码成图像帧的视频数据。第二视频数据为被解码成图像帧的数据。
57.在本实施例中,电子设备10可以包括图像处理器及显存模块,在对视频解码时,采用硬件解码,即通过图像处理器对第一视频数据进行解码,并将解码后的图像存储于显存模块中。例如,步骤s120可以包括:
58.通过图像处理器将所述n路第一视频数据编码为n路第三视频数据;
59.通过所述图像处理器将所述n路第三视频数据解码为包含图像帧的所述n路第二视频数据,所述第二视频数据存储于显卡内存中,所述第一视频数据为基于预设传输协议的视频流,所述第二视频数据为基于预设视频格式的视频数据,所述第三视频数据为基于预设编码格式的视频数据。
60.其中,预设传输协议包括但不限于实时流传输协议(real time streaming protocol,rtsp)或实时消息传输协议(real time messaging protocol,rtmp)。预设编码格式可以包括但不限于h264编码格式或h265编码格式。预设视频格式可以包括但不限于rgb格式或yuv格式。其中,h264编码格式、h265编码格式为本领域技术人员熟知的编码格式,rgb格式、yuv格式为本领域技术人员熟知的视频格式,这里不再赘述。
61.在本实施例中,不同路的第一视频数据的预设传输协议可以相同,可以不同,可以根据实际情况进行灵活确定。电子设备10在获取到第一视频数据后,可以通过图像处理器
对第一视频数据进行解码操作。其中,在视频解码过程中,需要先将预设传输协议(比如为rtsp或rtmp)的视频流编码成基于预设编码格式(比如为h264编码格式或h265编码格式)的第三视频数据;然后,再将预设编码格式(比如为h264编码格式或h265编码格式)的第三视频数据,解码成预设视频格式(比如为rgb格式或yuv格式)的第二视频数据。解码后的第二视频数据存储于显卡内存中,以便于后续进行图像组合。
62.可理解地,现有的软件解码方式为:由中央处理器(central processing unit,cpu)对第一视频数据进行软件解码,解码后的图像存储于设备的内存中,当需要进行图像检测处理时,需要将内存中的解码后的图像帧搬移至显卡内存,然后再对显卡内存中的图像帧进行分析处理,其中,大量图像帧的搬移操作,会影响图像处理的输入读取效率。
63.在本技术实施例中,电子设备10通过图像处理器以硬件解码的方式,对第一视频数据进行解码,并将解码后的图像存储于显存模块中。后续进行图像检测处理时,便直接对显卡内存中的图像进行分析处理,无需进行图像的搬迁,从而有利于提高图像处理的输入读取效率。
64.请参照图3,在步骤s130中,假设,电子设备10获取到四路第一视频数据,然后解码得到四路第二视频数据,在四路第二视频数据中,在某一时刻,时序相对应的图像帧假设分别为如图3所示的图像帧a、图像帧b、图像帧c和图像帧d,此时,便对图像帧a、图像帧b、图像帧c和图像帧d进行组合,得到呈四宫格的图像批块。其中,每路视频数据的图像帧在图像批块中的位置可以根据实际情况进行灵活设置,这里不作具体限定。
65.其中,组合得到的图像批块可以存储在显卡内存的数据池中,数据池可以为预先创建的队列数据结构,即,数据池可以以队列的形式存储图像批块。当n路视频的解码速率高于图像处理速率时,此时,组合形成图像批块的速率大于预设检测模型检测图像批块的速率,即,数据池的队列容易存满图像批块。当数据池的队列存满数据批块后,可以降低组合图像批块的速率或降低视频解码速率,另外,队列的队尾(即,队列的数据出口端)图像批块出列以保证队列内均为最新图像批块。当图像处理速度高于解码速度时,队列内存入的图像批块将会被立即取出,以供预设检测模型进行图像识别处理。如此,视频解码环节与图像处理环节的耦合度降低,有利于提高图像检测整个流程的稳定性。
66.在步骤s140中,输入至预设检测模型中的图像批块为经过预处理的图像批块,预处理可以包括但不限于去噪处理、标准化处理、平移处理、旋转处理、翻转处理中的至少一种。预处理后的图像批块,有利于减少图像批块中的干扰因素,提高预设检测模型对预处理后的图像批块进行检测识别的准确率与效率。
67.其中,去噪处理即为减少数字图像中噪声,减少噪声对图像识别的干扰。例如,去噪处理的方式可以根据实际情况进行灵活确定,比如,图像处理器可以通过小波去噪算法去除图像批块中的噪声。
68.标准化处理即为图像批块的白化处理,即为是将图像数据通过去均值实现中心化的处理,为本领域技术人员熟知,这里不再赘述。
69.另外,在平移处理、旋转处理中,平移的距离、旋转的角度等,均可以根据实际情况进行灵活确定,这里不作具体限定。
70.翻转处理可以根据实际情况进行灵活确定。例如,在进行字符识别时,对所拍摄的视频图像中的字符可能存在翻转或镜像的情况,此时,便可以对图像批块进行翻转处理,以
便于进行字符的识别。
71.在本实施例中,预设检测模型为基于深度学习的网络模型。例如,预设检测模型所具有的功能包括但不限于对物体分类、字符识别、条码识别、二维码识别等。每个功能可以对应深度学习网络模型中的一个子网络模型。
72.预设检测模型进行图像批块的识别检测方式为本领域技术人员熟知的方式。
73.作为一种可选的实施方式,步骤s130可以包括:
74.当所述n路第二视频数据的帧率相同时,将所述n路第二视频数据中,时序相同的图像帧组合成所述图像批块。
75.示例性地,请再次参照图3,图像帧a、图像帧b、图像帧c和图像帧d分别为四路视频数据中的相应图像帧,假设四路视频数据的帧率相同,在某一时刻下,图像帧a、图像帧b、图像帧c和图像帧d的时序相同,在进行图像批块的组合时,便将图像帧a、图像帧b、图像帧c和图像帧d进行组合,得到图3所示的呈四宫格的图像批块。在进行后续图像帧的组合时,便将每路视频的下一个图像帧进行组合,如此,便可以对n路第二视频数据中时序相同的图像帧进行组合。
76.需要说明的是,在其他实施方式中,在图像批块组合的过程中,每路视频中的图像帧可以不是呈四宫格的方式组合,例如,可以组合成四个横向或纵向紧贴的图像批块,这里对组合得到的图像批块的排布方式不作具体限定。
77.作为一种可选的实施方式,步骤s130可以包括:
78.当所述n路第二视频数据的帧率不相同时,在所述n路第二视频数据中,将帧率大于目标帧率的第二视频数据进行丢帧处理,得到帧率均为所述目标帧率的n路第二视频数据;其中,所述目标帧率为所述n路第二视频数据中的最小帧率;
79.将帧率均为所述目标帧率的n路第二视频数据中,时序相同的图像帧组合成所述图像批块。
80.假设,请再次参照图3,电子设备10解码得到的视频数据分别为a、b、c、d,共四路第二视频数据,对应的帧率分别为40fps(frames per second,每秒传输帧数)、35fps、30fps、30fps,即,四路第二视频数据的帧率并不相同,此时,便将最小帧率30fps作为目标帧率,并将a、b路的第二视频进行丢帧处理,即,对a路的第二视频数据,每秒丢弃10帧图像,对b路的第二视频数据,每秒丢弃5帧图像。如此,可以使得a、b、c、d四路视频的帧率均相同,然后,在对时序相同的图像帧进行组合。其中,相同时序的图像帧可理解为:在同一秒中,a、b、c、d四路各自的第m个图像帧,即各自第m个图像帧的时序相同,m为1至30中的任一整数。
81.其中,在进行丢帧处理时,每路视频中所丢弃的相邻图像帧的时间间隔可以尽可能地相同或接近相同,以避免丢弃关键时段的监控图像。例如,在a路第二视频数据中,在每秒的40个顺序排列图像帧中,可以将4个顺序排列图像帧作为一组,从而可以得到10组图像帧,然后,在每组图像帧中丢弃一个图像帧,每组丢弃的图像帧的序列可以相同或不同。比如,每组中均丢弃时序最早的图像帧。类似地,在b路第二视频数据中,在每秒的35个顺序排列图像帧中,将7个顺序排列图像帧作为一组,从而可以得到5组图像帧,然后,在每组图像帧中丢弃一个图像帧。比如,每组中均丢弃时序最早的图像帧。可理解地,在需要进行丢帧处理的每路视频数据中,通过均匀丢弃图像帧,可以在丢弃图像帧后,仍然尽可能多地保留更全面的图像内容。
82.作为一种可选的实施方式,步骤s130可以包括:
83.将所述n路第二视频数据中的图像帧的尺寸转换为预设尺寸;
84.将所述n路第二视频数据中时序相对应的所述预设尺寸的图像帧组合成所述图像批块。
85.在本实施例中,预设尺寸可以为n路第二视频数据中的任一路视频中图像帧的尺寸,或者为不同于n路第二视频数据中的图像帧的尺寸,预设尺寸可以根据实际情况进行灵活确定,这里不作具体限定。
86.若在n路第二视频数据中,路视频图像帧的尺寸与预设尺寸相同,便无需进行图像帧的尺寸调整。
87.当n路第二视频数据中的任一路的视频的图像帧尺寸与预设尺寸不同时,可以对该路视频图像帧的尺寸进行缩放,以使缩放后的图像帧的尺寸为预设尺寸。如此,可以实现每路视频的图像帧尺寸统一,便于预设检测模型进行识别处理。
88.为了便于对视频处理方法的理解,下面将结合应用场景,举例阐述方法的实现流程:
89.示例性地,在钢厂中,不同位置区域在搬运各类钢材(例如钢坯、钢卷)的过程中,可以通过多个摄像头对搬运过程进行实时监控。每个被搬运的钢材在钢材的指定区域可以设置有二维码、或编码,或同时设置有编码及二维码等信息。其中,二维码、编码等所携带的信息可以根据实际情况进行灵活确定,例如,可以携带用于表示钢材的种类、钢材运输的目的地等信息。
90.钢材的指定区域通常为摄像头可以拍摄到的区域,可以根据实际情况进行灵活确定。如此,钢材在搬运过程中,摄像头便可以拍摄得到钢材的二维码、编码等图像,然后,多个摄像头拍摄得到的多路视频被传输至电子设备10,由电子设备10通过步骤s110至步骤s140,便可以对对组合的图像批块进行识别检测。检测处理的过程为:
91.电子设备10在接收到摄像头拍摄的多路第一视频数据时,便通过gpu将多路第一视频数据解码成第二视频数据,并将第二视频数据存储与显卡内存(或简称为显存)中;
92.由gpu将多路第一视频数据中时序相对应的图像帧组合成图像批块,如此,可以将多路图像帧组合成一路图像帧;组合得到的图像批块存储在显卡内存的数据池中,数据池可以以队列的形式存储图像批块;
93.预设检测模型从数据池中,顺序读取图像批块,然后进行识别处理。例如,通过预设检测模型识别每个图像批块中,每路视频帧的二维码、编码等所携带的文本信息,包括钢材的种类、运输目的地等信息。
94.基于上述设计,解码后的图像帧直接存放在显存中,内存和显存之间无数据交换,后续可更快地从显存取得解码后的数据。视频解码环节与图像处理环节异步处理的耦合度低,有利于提高视频检测处理整个流程的稳定性。另外,通过将多路视频的图像帧组合成图像批块,可以减少调用预设检测模型的次数,从而有利于提高视频处理的效率。
95.请参照图4,本技术实施例还提供一种视频处理装置200,可以应用于上述的电子设备10中,用于执行方法中的各步骤。视频处理装置200包括至少一个可以软件或固件(firmware)的形式存储于存储模块12中或固化在电子设备10操作系统(operating system,os)中的软件功能模块。处理模块11用于执行存储模块12中存储的可执行模块,例
如视频处理装置200所包括的软件功能模块及计算机程序等。
96.视频处理装置200可以包括视频获取单元210、视频解码单元220、图像组合单元230及检测单元240,可以执行的操作步骤如下:
97.视频获取单元210,用于获取n路第一视频数据,n为大于1的整数;
98.视频解码单元220,用于将所述n路第一视频数据解码为包含图像帧的n路第二视频数据;
99.图像组合单元230,用于将所述n路第二视频数据中,时序相对应的图像帧组合成图像批块;
100.检测单元240,用于将所述图像批块输入预设检测模型,得到所述预设检测模型对所述图像批块输出的检测结果,所述检测结果包括与所述图像批块中的至少一路视频对应图像帧的分类结果。
101.可选地,视频解码单元220可以用于:
102.通过图像处理器将所述n路第一视频数据编码为n路第三视频数据;
103.通过所述图像处理器将所述n路第三视频数据解码为包含图像帧的所述n路第二视频数据,所述第二视频数据存储于显卡内存中,所述第一视频数据为基于预设传输协议的视频流,所述第二视频数据为基于预设视频格式的视频数据,所述第三视频数据为基于预设编码格式的视频数据,所述预设传输协议包括实时流传输协议或实时消息传输协议;所述预设编码格式包括h264编码格式或h265编码格式,所述预设视频格式包括rgb格式或yuv格式。
104.可选地,图像组合单元230还可以用于:
105.将所述n路第二视频数据中的图像帧的尺寸转换为预设尺寸;
106.将所述n路第二视频数据中时序相对应的所述预设尺寸的图像帧组合成所述图像批块。
107.可选地,图像组合单元230还可以用于:
108.当所述n路第二视频数据的帧率相同时,将所述n路第二视频数据中,时序相同的图像帧组合成所述图像批块。
109.可选地,图像组合单元230还可以用于:
110.当所述n路第二视频数据的帧率不相同时,在所述n路第二视频数据中,将帧率大于目标帧率的第二视频数据进行丢帧处理,得到帧率均为所述目标帧率的n路第二视频数据;其中,所述目标帧率为所述n路第二视频数据中的最小帧率;
111.将帧率均为所述目标帧率的n路第二视频数据中,时序相同的图像帧组合成所述图像批块。
112.在本实施例中,处理模块11可以是一种集成电路芯片,具有信号的处理能力。上述处理模块11可以包括但不限于中央处理器、图像处理器、数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。
113.存储模块12可以是,但不限于,随机存取存储器,只读存储器,可编程只读存储器,
可擦除可编程只读存储器,电可擦除可编程只读存储器等。在本实施例中,存储模块12可以用于存储第一视频数据、第二视频数据、预设检测模型等。当然,存储模块12还可以用于存储程序,处理模块11在接收到执行指令后,执行该程序。
114.可以理解的是,图1所示的结构仅为电子设备10的一种结构示意图,电子设备10还可以包括比图1所示更多或更少的组件。图1中所示的各组件可以采用硬件、软件或其组合实现。
115.需要说明的是,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的电子设备10的具体工作过程,可以参考前述方法中的各步骤对应过程,在此不再过多赘述。
116.本技术实施例还提供一种计算机可读存储介质。计算机可读存储介质中存储有计算机程序,当计算机程序在计算机上运行时,使得计算机执行如上述实施例中所述的视频处理方法。
117.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本技术可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现,基于这样的理解,本技术的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd

rom,u盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施场景所述的方法。
118.综上所述,本技术提供一种视频处理方法、装置、电子设备及计算机可读存储介质,方法包括:获取n路第一视频数据,n为大于1的整数;将n路第一视频数据解码为包含图像帧的n路第二视频数据;将n路第二视频数据中,时序相对应的图像帧组合成图像批块;将图像批块输入预设检测模型,得到预设检测模型对图像批块输出的检测结果,检测结果包括与图像批块中的至少一路视频对应图像帧的分类结果。在本方案中,通过将多路视频的图像帧组合成图像批块,然后再调用预设检测模型对图像批块进行检测,如此,无需对每路视频数据的图像帧单独调用预设检测模型进行检测,从而可以减少调用模型的次数,避免因调用模型次数多而造成处理阻塞,提升视频处理的效率。
119.在本技术所提供的实施例中,应该理解到,所揭露的装置、系统和方法,也可以通过其它的方式实现。以上所描述的装置、系统和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
120.以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
转载请注明原文地址:https://doc.8miu.com/read-1719099.html

最新回复(0)