本发明涉及人工智能及数据处理,更具体地,涉及一种打刻面缺陷图像样本生成方法及系统。
背景技术:
::1、发动机打刻面承载着标注发动机的生产厂家、规格、性能、特点、工艺、用途和产品批次等信息的作用,同时也便于丢失查找和防止私自拆改发动机,如图1所示;在国标文件gb 7258中明确提出车辆需要打刻发动机型号和出厂编号在发动机上,如果发动机打刻面出现缺陷的话,车辆很可能无法正常上牌。故在发动机的生产制造过程中需要对打刻面的缺陷进行检测,而采用基于深度学习的模型方法对发动机缺陷进行检测时,需要对检测模型进行训练,然而训练的过程会面临缺陷样本少的问题,进而导致训练得到的检测模型易出现过拟合现象。2、目前现有的扩充缺陷图像样本的主要技术方案主要是通过翻转(水平或垂直)、随机裁剪、随机旋转、缩放等数据增强方法、添加随机噪声(如高斯噪声、椒盐噪声)或扰动输入特征(如随机遮挡、改变颜色、亮度、对比度等)等,来实现对缺陷图像样本数据集多样性的增强。3、然而,上述方法中,数据增强方法没有考虑到数据集的特性和分布,且对原始的真实缺陷样本数量要求较高,对模型训练的提升有限;随机噪声添加方法则难以控制噪声添加过程中的噪声质量,且可能导致训练标签的错误,不适用于打刻面缺陷识别这种精细推理需求的场景;而特征扰动方法涉及原始数据的修改或者转换,只能在已有特征上进行操作,无法引入完全新的特征,此外过于强烈的扰动会导致训练得到的模型对这些扰动过分关注,进而使得训练得到的模型无法准确的泛化到新的数据上。技术实现思路1、本发明为克服上述现有技术所述的打刻面缺陷检测训练数据有限的缺陷,提供一种打刻面缺陷图像样本生成方法及系统。2、为解决上述技术问题,本发明的技术方案如下:3、第一方面,一种打刻面缺陷图像样本生成方法,包括:4、将关联有第一语料参数的打刻面缺陷图像真实样本与第一缺陷描述文本,组合为训练集;其中,所述第一缺陷描述文本为用于表征所述打刻面缺陷图像真实样本的缺陷类型的文本提示;5、利用所述训练集训练缺陷图像样本生成模型;其中,所述缺陷图像样本生成模型配置有所述第一语料参数,所述第一语料参数用于指示所述缺陷图像样本生成模型确定所述第一缺陷描述文本所指向的缺陷类型;6、提取获得的打刻面正常图像真实样本的掩模图;7、利用训练好的所述缺陷图像样本生成模型,基于所述打刻面正常图像真实样本、所述掩模图及第二缺陷描述文本,生成打刻面缺陷图像样本;其中,所述第二缺陷描述文本是指用于表征所述打刻面缺陷图像样本的缺陷类型的文本提示。8、第二方面,一种打刻面缺陷图像样本生成系统,包括:9、数据采集模块,用于获取打刻面缺陷图像真实样本、打刻面正常图像真实样本、第一语料参数、第一缺陷描述文本及第二缺陷描述文本;其中,所述第一缺陷描述文本为用于表征所述打刻面缺陷图像真实样本的缺陷类型的文本提示,所述第二缺陷描述文本为用于表征生成的打刻面缺陷图像样本的缺陷类型的文本提示;10、训练模块,用于将所述第一语料参数与所述打刻面缺陷图像真实样本关联,并与所述第一缺陷描述文本组合为训练集;还用于利用所述训练集训练缺陷图像样本生成模型;其中,所述缺陷图像样本生成模型配置有第一语料参数,所述第一语料参数用于指示所述缺陷图像样本生成模型确定所述第一缺陷描述文本所指向的缺陷类型;11、图像生成模块,用于提取打刻面正常图像真实样本的掩模图;还用于搭载训练好的所述缺陷图像样本生成模型,并基于所述打刻面正常图像真实样本、所述掩模图及所述第二缺陷描述文本,生成所述打刻面缺陷图像样本。12、第三方面,一种电子设备,包括:13、存储器,用于存储计算机可执行指令或者计算机程序;14、处理器,用于执行所述存储器中存储的计算机可执行指令或者计算机程序时,实现第一方面所述方法。15、第四方面,一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,实现第一方面所述方法。16、与现有技术相比,本发明技术方案的有益效果是:17、本发明公开了一种缺陷图像样本生成方法,通过构建出的训练集训练缺陷图像样本生成模型,使得模型中特定的第一语料参数与打刻面缺陷图像真实样本相关联;后续模型使用时,利用训练好的所述缺陷图像样本生成模型,基于所述打刻面正常图像真实样本及对应的掩模图以及第二缺陷描述文本,可生成大量多样性的打刻面缺陷图像样本,具有良好的泛化效果。相较于现有技术,本发明不需要大量的打刻面缺陷图像真实样本,训练出的所述缺陷图像样本生成模型泛化性强,生成的打刻面缺陷图像样本真实性高,有利于降低用于缺陷检测的神经网络模型的训练难度并提高其精确度。技术特征:1.一种打刻面缺陷图像样本生成方法,其特征在于,包括:2.根据权利要求1所述的一种打刻面缺陷图像样本生成方法,其特征在于,所述掩模图包括区域掩模图;3.根据权利要求2所述的一种打刻面缺陷图像样本生成方法,其特征在于,采用扩散模型作为所述缺陷图像样本生成模型;4.根据权利要求3所述的一种打刻面缺陷图像样本生成方法,其特征在于,所述区域掩膜图包括字符区域掩膜图和非字符区域掩膜图;所述掩模图还包括字符轮廓掩膜图;5.根据权利要求4所述的一种打刻面缺陷图像样本生成方法,其特征在于,所述提取获得的打刻面正常图像真实样本的掩模图还包括:6.根据权利要求3所述的一种打刻面缺陷图像样本生成方法,其特征在于,所述扩散模型为stable diffusion模型;7.根据权利要求1-6任一项所述的一种打刻面缺陷图像样本生成方法,其特征在于,所述训练集的构建过程包括:8.一种打刻面缺陷图像样本生成系统,其特征在于,包括:9.一种电子设备,其特征在于,包括:10.一种计算机程序产品,包括计算机程序或计算机可执行指令,其特征在于,所述计算机程序或计算机可执行指令被处理器执行时,实现权利要求1-7任一项所述方法。技术总结本发明公开了一种打刻面缺陷图像样本生成方法及系统,涉及人工智能及数据处理领域。所述方法包括:将关联有第一语料参数的打刻面缺陷图像真实样本与第一缺陷描述文本,组合为训练集;利用所述训练集训练缺陷图像样本生成模型;提取获得的打刻面正常图像真实样本的掩模图;利用训练好的所述缺陷图像样本生成模型,基于所述打刻面正常图像真实样本、所述掩模图及第二缺陷描述文本,生成打刻面缺陷图像样本。相较于现有技术,本发明不需要大量的打刻面缺陷图像真实样本,训练出的所述缺陷图像样本生成模型泛化性强,生成的打刻面缺陷图像样本真实性高,有利于降低用于缺陷检测的神经网络模型的训练难度并提高其精确度。技术研发人员:谭建辉,张峰,陈海旋,张志宇,李斌,王鸣飞受保护的技术使用者:广汽本田汽车有限公司技术研发日:技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1823141.html