本发明属于智能监控视频处理,特别涉及一种构建宽动态训练数据集的方法。
背景技术:
1、当在强光源(日光、灯具或反光等)照射下的高亮度区域及阴影、逆光等相对亮度较低的区域在图像中同时存在时,摄像头输出的图像会出现明亮区域因曝光过度成为白色,而黑暗区域因曝光不足成为黑色,严重影响图像质量。摄像头在同一场景中对最亮区域及较暗区域的表现是存在局限的,所以重建宽动态图像的意义重大。
2、在实际应用中,宽动态图像难以获取,目前,宽动态图像重建算法主要分为传统图像算法和深度学习两个方向。但目前传统算法融合不对齐数据难以避免鬼影问题,深度学习可以有效减小鬼影的问题,但基于深度学习的方法需要大量训练数据,本专利提出一种构建宽动态训练数据的方法。
3、目前现有合成宽动态训练数据的方法主要是用传统图像算法在静态场景下拍摄短帧、中帧、长帧三张不同曝光的数据进行合成标签,在该动态场景下,拍摄不对齐的短帧、中帧、长帧数据,使用静态场景的中帧替换动态中帧,构成训练对。
4、然而,现有技术的主要缺陷在于:
5、动态场景不对齐数据的位移难以控制可能导致和实际应用差别较大;拍摄短帧、中帧、长帧的曝光时间不好确定,导致合成的标签可能和实际场景存在较大偏差,且可能因为数据原因导致训练过拟合或者不收敛的情况;如果换成两帧或四帧合成方案,这种方式采集的数据难以复用。
6、此外,现有技术中的常用术语包括:
7、宽动态:当在强光源(日光、灯具或反光等)照射下的高亮度区域及阴影、逆光等相对亮度较低的区域在图像中同时存在时,摄像头输出的图像会出现明亮区域因曝光过度成为白色,而黑暗区域因曝光不足成为黑色,严重影响图像质量。摄像头在同一场景中对最亮区域及较暗区域的表现是存在局限的,这种局限就是通常所讲的“动态范围”。
8、动态范围:指场景中亮度最大值与最小值之比。在真实场景中,从最耀眼的阳光到最暗的星光,动态范围可达10^8,人眼能分辨的亮度范围也高达10^5。但是,普通传感器捕获的动态范围不超过10^3,显示器的动态范围更是只有10^2。正是由于真实场景和普通数码设备动态范围极其不匹配的这种现象,使得成像设备捕获的图像通常会出现过曝、欠曝及细节信息丢失等问题。
技术实现思路
1、为了解决上述问题,本技术的目的在于:利用多个静态场景拍摄,模拟动态场景位移,使得不对齐数据位移可控,获取较好的训练对,同时使用平移等方式对静态场景数据进行操作,获取更多较好训练对;在每个静态场景拍摄多组不同曝光时间的数据,根据合成算法选择比较接近真实场景动态范围的多帧数据作为训练对,这种方式采集的数据可以复用。
2、具体地,本发明提供一种构建动态训练数据集的方法,所述方法包括以下步骤:
3、s1.选取曝光时间序列t1,t2,...,t10,以保证合成的宽动态图像能够覆盖各个场景的动态范围;
4、s2.定义scene_i_j表示第i个大场景的第j个子场景,大场景表示摄像头移动的场景,子场景表示摄像头不动,摄像头拍摄的物体有位移的场景;
5、在静态场景scene_i_j下,用三脚架固定摄像头连续拍摄10张不同曝光时间的图像,记录为image_scene_i_j_1,image_scene_i_j_2,...,image_scene_i_j_10,同时记录相应的曝光时参数间t1,t2,...,t10;
6、s3.根据加权融合算法得到每个子场景的宽动态图像标签gt_scene_i_j;
7、s4.根据两帧宽动态合成算法,在每个场景scene_i_j中选择需要2张合成宽动态图像,对10张不同曝光的图像挑选其中2张进行组合,能够获得45个组合c_2_1,c_2_2,...,c_2_45,对这45个组合使用步骤s3的加权融合算法获得45个宽动态图像候选标签gt_scene_i_j_1,..,.gt_scene_i_j_45;
8、s5.制作对齐训练对:
9、挑选接近真实场景动态范围的宽动态图像标签,考虑到宽动态图像通常会经过色调映射算法显示,采用下式(2)对宽动态图像标签gt_scene_i_j和宽动态图像候选标签gt_scene_i_j_1,..,.gt_scene_i_j_45行比较,计算峰值信噪比mu_psnr,并对45个峰值信噪比进行排序,选取最优标签作为训练标签gt_scene_i_j_b,训练标签gt_scene_i_j_b和短帧、长帧组合得到对齐数据训练对;
10、
11、其中mu为固定系数5000,igt为宽动态图像标签,i l为宽动态候选标签,mu_psnr为峰值信噪比,越大表示宽动态图像标签和宽动态候选图像标签相似度越高;其中,此式(2)中的m、n分别为宽动态图像的宽、高;
12、s6.制作真实不对齐训练对:
13、定义第i个大场景,第j个子场景所选择的第k个对齐数据训练对为image_scene_i_j_k_1,image_scene_i_j_k_2,gt_scene_i_j_k,其中image_scene_i_j_k_1,image_scene_i_j_k_2分别为训练对的短帧、长帧,gt_scene_i_j_k为训练对的标签,根据对齐训练对组合的曝光时间t_scene_i_j_k_1,t_scene_i_j_k_2,在同一大场景i内,以短帧图像作为参考帧,用不同子场景对应相同曝光时间的长帧图像替换对齐训练对组合中的长帧对齐图像,得到曝光时间相同不对齐训练对;
14、s7.制作平移不对齐训练对:
15、对于第i个大场景,第j个子场景所选择的第k个对齐数据训练对[image_scene_i_j_s,image_scene_i_j_l,...,gt_scene_i_j_b],以对齐训练对的短帧为参考帧,将对齐训练对的长帧的图像进行水平垂直方向的随机平移,水平垂直平移像素不同时超过20,平移后替换对齐训练对的长帧得到平移不对齐训练对;
16、s8.将对齐训练对、真实不对齐训练对、平移不对齐训练对汇总合并,构建宽动态训练数据完成。
17、所述步骤s1中,曝光时间参数分别为
18、2,4,8,16,32,64,128,256,512,1024行;
19、所述步骤s5中,所述得到对齐数据训练对,如
20、[image_scene_1_1_1,image_scene_1_1_2,gt_scene_1_2_b]);
21、所述步骤s6中,原对齐训练对为
22、[image_scene_1_1_s,image_scene_1_1_l,gt_scene_1_1_b],
23、[image_scene_1_2_s,image_scene_1_2_l,gt_scene_1_2_b],image_scene_1_1_l和image_scene_1_2_l曝光时间参数相同,则制作的不对齐训练对为
24、[image_scene_1_1_s,image_scene_1_2_l,gt_scene_1_1_b],
25、[image_scene_1_2_s,image_scene_1_1_l,gt_scene_1_2_b]。
26、所述步骤s7中,假设对齐训练对为(image_scene_1_1_1_1,image_scene_1_1_1_2,image_scene_1_1_1_3,gt_scene_1_1_1),平移不对齐训练对为(image_scene_1_1_1_1’,image_scene_1_1_1_2,image_scene_1_1_1_3’,gt_scene_1_1_1),
27、其中image_scene_1_1_1_1’和image_scene_1_1_1_2’分别为image_scene_1_1_1_1和image_scene_1_1_1_2平移后的图像。
28、所述步骤s7中,
29、假设对齐训练对为image_scene_1_1_1_1,image_scene_1_1_1_2,image_scene_1_1_1_3,gt_scene_1_1_1,
30、平移不对齐训练对为image_scene_1_1_1_1’,image_scene_1_1_1_2,image_scene_1_1_1_3’,gt_scene_1_1_1,
31、其中image_scene_1_1_1_1’和image_scene_1_1_1_2’分别为image_scene_1_1_1_1和image_scene_1_1_1_2平移后的图像。
32、所述步骤s3中,所述加权融合算法如下式(1):
33、
34、其中w为权重,b it为图像比特位数,zmax为图像最大像素值,z为图像中每个像素值,i为图像,t为曝光时间,gt为生成的宽动态图像标签。
35、所述步骤s5中,所述式(2)中的m,n分别为1920,1080。
36、由此,本技术的优势在于:
37、(1)利用多个静态场景拍摄,模拟动态场景位移,使得不对齐数据位移可控,获取较好的训练对;
38、(2)在每个静态场景拍摄多组不同曝光时间的数据,根据合成算法选择比较接近真实场景动态范围的多帧数据作为训练对;
39、(3)不确定深度学习算法合成帧数的情况下,采集的数据可以复用;
40、(4)同时使用平移等方式对静态场景数据进行操作,获取更多较好训练对。
1.一种构建动态训练数据集的方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种构建动态训练数据集的方法,其特征在于,所述步骤s1中,曝光时间参数分别为2,4,8,16,32,64,128,256,512,1024行;
3.根据权利要求2所述的一种构建动态训练数据集的方法,其特征在于,所述步骤s7中,
4.根据权利要求1所述的一种构建动态训练数据集的方法,其特征在于,所述步骤s3中,所述加权融合算法如下式(1):
5.根据权利要求1所述的一种构建动态训练数据集的方法,其特征在于,所述步骤s5中,所述式(2)中的m,n分别为1920,1080。
