数字城市目标检测方法及其模型训练方法、系统与流程

专利2025-06-10  13


本发明涉及人工智能,尤其是涉及一种数字城市目标检测方法及其模型训练方法、系统。


背景技术:

1、数字城市的构建需要以海量数据和各类模型的构建作为底层支撑技术,以实现在复杂的城市管理与发展中稳定运行,云计算、边缘计算、物联网等前沿技术使得数字城市在处理海量复杂的图像数据成为可能。基于上述应用背景,联邦学习技术可以在保障数据隐私的前提下利用各类设备的存储与计算资源进行不同应用模型的训练与优化,对于数字城市的发展具有实际意义。但由于联邦学习只是一个基础的框架,随着各类智能设备以及深度学习模型的发展,简单依靠联邦学习的解决方案面临着越来越多的挑战。

2、具体的,传统的联邦学习系统未考虑通信开销问题,这在某些通信资源充足的场景中可以实现,但数字城市本身面临着大量的数据传输,联邦学习频繁的参数交互和更新无疑给网络通信资源带来了巨大的压力。

3、数字城市中每天要产生海量的数据,其中包含大量的冗余或对模型训练本身意义不大的脏数据,这类数据的存在不仅浪费设备有限的计算资源,同时使用此类数据进行模型训练也会导致模型很难收敛。

4、传统的联邦学习加权平均聚合方案仅考虑数据量的影响,这在实际应用中显得过于片面,仅靠数据量来计算权重值并不能很好的进行模型优化。


技术实现思路

1、有鉴于此,本发明的目的在于提供一种数字城市目标检测方法及其模型训练方法、系统,该模型在训练过程中采用浅层网络和深层网络进行网络切分训练,降低了训练资源消耗;同时通过节点信誉度作为衡量参数对模型训练过程进行管控,可有效提升模型性能,从而提高数字城市目标检测的精度。

2、第一方面,本发明实施方式提供了一种用于数字城市目标检测的模型训练方法,该方法包括:

3、获取采集设备在数字城市环境中采集的数字图像,并将数字图像输入至已初始化的卷积神经网络中;

4、获取卷积神经网络中包含的浅层网络和深层网络,并将数字图像分别传输至浅层网络和深层网络中进行训练,并实时更新卷积神经网络的训练参数;其中,浅层网络的网络层级低于深层网络的网络层级,浅层网络的训练时刻早于深层网络的训练时刻;

5、基于训练参数计算卷积神经网络的节点信誉度,并根据节点信誉度更新卷积神经网络的网络参数;

6、当卷积神经网络在已更新的网络参数下处于收敛状态时,将当前卷积神经网络确定为用于数字城市目标检测的模型。

7、在一种实施方式中,将数字图像分别传输至浅层网络和深层网络中进行训练,包括:

8、获取预设的训练周期,并将训练周期平均分为第一训练周期、第二训练周期和第三训练周期;第一训练周期、第二训练周期和第三训练周期的训练次数相同;

9、在第一训练周期内,将数字图像分别传输至浅层网络和深层网络中进行训练;

10、第一训练周期完成训练后,在第二训练周期内将数字图像随机传输至浅层网络和深层网络中进行训练;

11、第二训练周期完成训练后,在第三训练周期内将数字图像传输至深层网络中进行训练。

12、在一种实施方式中,获取卷积神经网络中包含的浅层网络和深层网络,包括:

13、获取卷积神经网络的输入层和卷积层,并将输入层和卷积层确定为浅层网络;

14、获取卷积神经网络的输出层和全连接层,并将输出层和全连接层确定为深层网络。

15、在一种实施方式中,实时更新卷积神经网络的训练参数,包括:

16、获取浅层网络和深层网络对应的训练参数;

17、利用数字图像对卷积神经网络进行训练,并实时更新训练参数;其中,训练参数通过以下算式计算得到:

18、

19、其中,θ为训练参数;t为训练轮数;η为学习率;dc为数字图像对应的数据集;□θ为卷积神经网络的损失函数;损失函数为:

20、

21、其中,ce为交叉熵函数;yi为卷积神经网络在数字图像对应样本的预测结果;yl为卷积神经网络在数字图像对应样本的真实标签;λ为衰减系数;l为卷积神经网络的层数;ωj为卷积神经网络在第j层网络的权重项;bj为卷积神经网络在第j层网络的偏差项。

22、在一种实施方式中,基于训练参数计算卷积神经网络的节点信誉度,包括:

23、计算训练参数对应的平均准确率;其中,平均准确率通过以下算式计算得到:

24、

25、其中,为平均准确率;γ为训练参数对应的准确率结果;t为训练轮数;ρ为卷积神经网络中对应的移动滑窗超参数;

26、根据平均准确率的动态缩放交叉熵计算结果,确定卷积神经网络的节点信誉度。

27、在一种实施方式中,当卷积神经网络在已更新的网络参数下处于收敛状态时,将当前卷积神经网络确定为用于数字城市目标检测的模型,包括:

28、利用已更新的网络参数对卷积神经网络进行训练,并实时判断卷积神经网络是否收敛;

29、当卷积神经网络处于收敛状态时,对卷积神经网络中的网络参数进行加权聚合更新后,将当前卷积神经网络确定为用于数字城市目标检测的模型;其中,网络参数为:

30、

31、其中,θg为更新后的网络参数;为数字图像的样本集与卷积神经网络中数据量的占比;为归一化后的节点信誉度;tg-tc为当前时间戳与数字图像训练完成时的时间戳间隔;θc为更新前的网络参数。

32、第二方面,本发明实施方式提供一种数字城市目标检测方法,该方法包括:

33、获取待测数字图像;

34、将待测数字图像传输至已完成训练的数字城市目标检测模型中,控制数字城市目标检测模型输出的第一检测结果;其中,数字城市目标检测模型通过第一方面中提到的用于数字城市目标检测的模型训练方法训练得到的;

35、按照数字城市中对应的目标检测类型对第一检测结果进行处理,得到第二检测结果;

36、基于第二检测结果确定数字城市的目标检测结果。

37、第三方面,本发明实施方式提供一种用于数字城市目标检测的模型训练系统,该系统包括:

38、数据采集训练单元,用于获取采集设备在数字城市环境中采集的数字图像,并将数字图像输入至已初始化的卷积神经网络中;

39、网络划分训练单元,用于获取卷积神经网络中包含的浅层网络和深层网络,并将数字图像分别传输至浅层网络和深层网络中进行训练,并实时更新卷积神经网络的训练参数;其中,浅层网络的网络层级低于深层网络的网络层级,浅层网络的训练时刻早于深层网络的训练时刻;

40、节点信誉度评定单元,用于基于训练参数计算卷积神经网络的节点信誉度,并根据节点信誉度更新卷积神经网络的网络参数;

41、模型参数聚合单元,用于当卷积神经网络在已更新的网络参数下处于收敛状态时,将当前卷积神经网络确定为用于数字城市目标检测的模型。

42、第四方面,本发明实施例方式提供一种数字城市目标检测系统,该系统包括:

43、待测数字图像获取模块,用于获取待测数字图像;

44、第一检测结果确定模块,用于将待测数字图像传输至已完成训练的数字城市目标检测模型中,控制数字城市目标检测模型输出的第一检测结果;其中,数字城市目标检测模型通过第一方面中提到的用于数字城市目标检测的模型训练方法训练得到的;

45、第二检测结果确定模块,用于按照数字城市中对应的目标检测类型对第一检测结果进行处理,得到第二检测结果;

46、目标检测结果确定模块,用于基于第二检测结果确定数字城市的目标检测结果。

47、第五方面,本发明实施方式还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现第一方面和第二方面提供的方法步骤。

48、第六方面,本发明实施方式还提供一种存储介质,该存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现第一方面和第二方面提供的方法步骤。

49、本发明实施方式提供的一种数字城市目标检测方法及其模型训练方法、系统,在对数字城市目标进行检测的过程中,首先获取待测数字图像;然后将待测数字图像传输至已完成训练的数字城市目标检测模型中,控制数字城市目标检测模型输出的第一检测结果;再按照数字城市中对应的目标检测类型对第一检测结果进行处理,得到第二检测结果;最后基于第二检测结果确定数字城市的目标检测结果。目标检测过程中所用的数字城市目标检测模型在训练过程中,首先获取采集设备在数字城市环境中采集的数字图像,并将数字图像输入至已初始化的卷积神经网络中;然后获取卷积神经网络中包含的浅层网络和深层网络,并将数字图像分别传输至浅层网络和深层网络中进行训练,并实时更新卷积神经网络的训练参数;其中,浅层网络的网络层级低于深层网络的网络层级,浅层网络的训练时刻早于深层网络的训练时刻;再基于训练参数计算卷积神经网络的节点信誉度,并根据节点信誉度更新卷积神经网络的网络参数;当卷积神经网络在已更新的网络参数下处于收敛状态时,将当前卷积神经网络确定为用于数字城市目标检测的模型。该模型在训练过程中采用浅层网络和深层网络进行网络切分训练,降低了训练资源消耗;同时通过节点信誉度作为衡量参数对模型训练过程进行管控,可有效提升模型性能,从而提高数字城市目标检测的精度。

50、本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

51、为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。


技术特征:

1.一种用于数字城市目标检测的模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的用于数字城市目标检测的模型训练方法,其特征在于,将所述数字图像分别传输至所述浅层网络和所述深层网络中进行训练,包括:

3.根据权利要求1所述的用于数字城市目标检测的模型训练方法,其特征在于,获取所述卷积神经网络中包含的浅层网络和深层网络,包括:

4.根据权利要求1所述的用于数字城市目标检测的模型训练方法,其特征在于,实时更新所述卷积神经网络的训练参数,包括:

5.根据权利要求4所述的用于数字城市目标检测的模型训练方法,其特征在于,基于所述训练参数计算所述卷积神经网络的节点信誉度,包括:

6.根据权利要求1所述的用于数字城市目标检测的模型训练方法,其特征在于,当所述卷积神经网络在已更新的所述网络参数下处于收敛状态时,将当前所述卷积神经网络确定为用于数字城市目标检测的模型,包括:

7.一种数字城市目标检测方法,其特征在于,所述方法包括:

8.一种用于数字城市目标检测的模型训练系统,其特征在于,所述系统包括:

9.一种数字城市目标检测系统,其特征在于,所述系统包括:

10.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现所述权利要求1至6任一项所述方法的步骤。


技术总结
本发明提供了一种数字城市目标检测方法及其模型训练方法、系统,涉及人工智能技术领域,在对数字城市目标进行检测的过程中,首先获取待测数字图像;然后将待测数字图像传输至已完成训练的数字城市目标检测模型中,控制数字城市目标检测模型输出的第一检测结果;再按照数字城市中对应的目标检测类型对第一检测结果进行处理,得到第二检测结果;最后基于第二检测结果确定数字城市的目标检测结果;该模型在训练过程中采用浅层网络和深层网络进行网络切分训练,降低了训练资源消耗;同时通过节点信誉度作为衡量参数对模型训练过程进行管控,可有效提升模型性能,从而提高数字城市目标检测的精度。

技术研发人员:邢家齐,李勇强
受保护的技术使用者:中电信数字城市科技有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/index.php/read-1821064.html

最新回复(0)