本发明涉及深度学习技术领域,具体地,涉及一种基于残差深度网络的孢子芽孢识别方法、系统及介质。
背景技术:
白带是女性阴道的分泌物,白带的微生态菌群检测是判定女性生殖系统是否健康的重要条件。其中,真菌感染在我国已是一类严重影响到人们身体健康的重大疾病,孢子和芽生孢子是真菌感染的较早期阶段性症状,能够早点检测出病情,对医院和病人的意义不言而喻。但目前医疗单位对真菌感染的检测能力亟待提高,特别是急需采用新的科技方法准确、高效地对病原菌进行检测。
目前检测的主要技术包括直接镜检、真菌培养以及培养检查。其中直接镜检作为经典的真菌检验方法之一,具有阳性率高,报告快的优势。医护人员需要在显微镜的视场中对于样本进行观察和判断,如果在显微图像中发现有孢子和芽生孢子的存在,即可诊断为vvc感染。但此方法要求操作者需要有丰富的检验经验,对菌量少、背景成分复杂的检验标本容易出现漏报、误报。相对于目前已有的自动生化检测设备相比,人工真菌镜检有着人员劳动强度大,结果主观判断程度高的缺点。
专利文献cn108052959a(申请号:cn201711130625.x)公开了一种提高深度学习图片识别鲁棒性的方法。首先对深度学习的神经网络进行随机初始化;然后将训练样本集和训练标签集作为输入深度学习神经网络,进行前向传播输出深度学习神经网络认为其所属各个类别的概率;接着将新的样本和其标签进行反向传播,对深度学习神经网络进行调优;利用测试样本集和测试标签集对训练效果进行测试,输出测试样本集的测试准确率;最后在对训练样本集和训练标签集迭代了一定次数后,输入验证样本集,并将深度学习神经网络的输出与验证标签集进行对比,输出深度学习神经网络的验证准确率。
随着卷积神经网络的出现和深度神经网络的完善,近些年来人工智能飞速发展,将人工智能的相关技术运用到医疗领域里,针对孢子和芽生孢子的检测研发一种基于卷积神经网络的识别分类方法是十分有意义的。
技术实现要素:
针对现有技术中的缺陷,本发明的目的是提供一种基于残差深度网络的孢子芽孢识别方法、系统及介质。
根据本发明提供的基于残差深度网络的孢子芽孢识别方法,包括:
步骤1:对从自动生物显微镜采集到的原始图片采用形态学方法进行分割,筛选需要识别的目标图片形成样本集并进行标注;
步骤2:将标注的样本集进行数据扩增,形成最终的训练数据集,将训练数据集分成训练集、验证集和测试集;
步骤3:在caffe框架上构建深度残差网络并设置超参数,利用数据集进行训练,得到深度残差网络训练模型;
步骤4:对实时采集的原始图片进行形态学分割后,用测试后综合识别率最高的深度残差网络训练模型进行识别评分,将大于置信度阈值的结果作为最后的识别结果并输出。
优选的,所述形态学方法包括:二值化方法、图像增强和锐化、边缘轮廓提取算法、轮廓外接矩形、分水岭算法和graphcut算法。
优选的,所述数据扩增包括:翻转、旋转、裁剪、变形和缩放的几何变换方法,噪声、模糊、颜色变换、擦除和填充的颜色变化方法,gan和autoaugment的无监督数据增强方法。
优选的,将进行数据扩增后的训练数据集按照70%、20%、10%的比例分成训练集、验证集和测试集。
优选的,所述深度残差网络包括:resnet-50、resnet-101和resnet-152的resnet系列深度网络。
优选的,在求解器文件中设置snapshot值,保存训练过程中的模型文件,选出迭代次数最多的模型和验证集测试准确率最高的模型进行测试集的测试,以综合识别率最高的模型作为最终使用模型。
优选的,利用深度残差网络训练模型进行识别评分的计算公式为:
深度残差网络模型对标注训练的孢子或芽生孢子准确率=深度残差网络模型对标注的孢子或芽生孢子分类正确的个数/机器识别出的所有的孢子或芽生孢子的个数*100%。
优选的,所述置信度阈值设置为0.9。
根据本发明提供的基于残差深度网络的孢子芽孢识别系统,包括:
模块m1:对从自动生物显微镜采集到的原始图片采用形态学方法进行分割,筛选需要识别的目标图片形成样本集并进行标注;
模块m2:将标注的样本集进行数据扩增,形成最终的训练数据集,将训练数据集分成训练集、验证集和测试集;
模块m3:在caffe框架上构建深度残差网络并设置超参数,利用数据集进行训练,得到深度残差网络训练模型;
模块m4:对实时采集的原始图片进行形态学分割后,用测试后综合识别率最高的深度残差网络训练模型进行识别评分,将大于置信度阈值的结果作为最后的识别结果并输出;
所述形态学方法包括:二值化方法、图像增强和锐化、边缘轮廓提取算法、轮廓外接矩形、分水岭算法和graphcut算法;
所述数据扩增包括:翻转、旋转、裁剪、变形和缩放的几何变换方法,噪声、模糊、颜色变换、擦除和填充的颜色变化方法,gan和autoaugment的无监督数据增强方法;
将进行数据扩增后的训练数据集按照70%、20%、10%的比例分成训练集、验证集和测试集;
所述深度残差网络包括:resnet-50、resnet-101和resnet-152的resnet系列深度网络;
在求解器文件中设置snapshot值,保存训练过程中的模型文件,选出迭代次数最多的模型和验证集测试准确率最高的模型进行测试集的测试,以综合识别率最高的模型作为最终使用模型;
利用深度残差网络训练模型进行识别评分的计算公式为:
深度残差网络模型对标注训练的孢子或芽生孢子准确率=深度残差网络模型对标注的孢子或芽生孢子分类正确的个数/机器识别出的所有的孢子或芽生孢子的个数*100%;
所述置信度阈值设置为0.9。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述的方法的步骤。
与现有技术相比,本发明具有如下的有益效果:
(1)本发明通过采用残差深度网络结构对孢子和芽生孢子进行识别,解决了形态学识别需要大量参数、效率低和识别率低的问题;
(2)本发明解决了采用其他神经网络算法时,网络过深造成的梯度消失问题,达到了综合识别率93%以上的识别效果,泛化能力优越,有利于降低医生误诊漏诊率,也有利于降低对医生的业务能力要求。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明方法流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1:
根据本发明提供的基于残差深度网络的孢子芽孢识别方法,包括:步骤1:对从自动生物显微镜采集到的原始图片采用形态学方法进行分割,筛选需要识别的目标图片形成样本集并进行标注;步骤2:将标注的样本集进行数据扩增,形成最终的训练数据集,将训练数据集分成训练集、验证集和测试集;步骤3:在caffe框架上构建深度残差网络并设置超参数,利用数据集进行训练,得到深度残差网络训练模型;步骤4:对实时采集的原始图片进行形态学分割后,用测试后综合识别率最高的深度残差网络训练模型进行识别评分,将大于置信度阈值的结果作为最后的识别结果并输出。
所述形态学方法包括:二值化方法、图像增强和锐化、边缘轮廓提取算法、轮廓外接矩形、分水岭算法和graphcut算法。所述数据扩增包括:翻转、旋转、裁剪、变形和缩放的几何变换方法,噪声、模糊、颜色变换、擦除和填充的颜色变化方法,gan和autoaugment的无监督数据增强方法。将进行数据扩增后的训练数据集按照70%、20%、10%的比例分成训练集、验证集和测试集。所述深度残差网络包括:resnet-50、resnet-101和resnet-152的resnet系列深度网络。在求解器文件中设置snapshot值,保存训练过程中的模型文件,选出迭代次数最多的模型和验证集测试准确率最高的模型进行测试集的测试,以综合识别率最高的模型作利用深度残差网络训练模型进行识别评分的计算公式为:深度残差网络模型对标注训练的孢子或芽生孢子准确率=深度残差网络模型对标注的孢子或芽生孢子分类正确的个数/机器识别出的所有的孢子或芽生孢子的个数*100%。所述置信度阈值设置为0.9。
根据本发明提供的基于残差深度网络的孢子芽孢识别系统,包括:模块m1:对从自动生物显微镜采集到的原始图片采用形态学方法进行分割,筛选需要识别的目标图片形成样本集并进行标注;模块m2:将标注的样本集进行数据扩增,形成最终的训练数据集,将训练数据集分成训练集、验证集和测试集;模块m3:在caffe框架上构建深度残差网络并设置超参数,利用数据集进行训练,得到深度残差网络训练模型;模块m4:对实时采集的原始图片进行形态学分割后,用测试后综合识别率最高的深度残差网络训练模型进行识别评分,将大于置信度阈值的结果作为最后的识别结果并输出;
所述形态学方法包括:二值化方法、图像增强和锐化、边缘轮廓提取算法、轮廓外接矩形、分水岭算法和graphcut算法;所述数据扩增包括:翻转、旋转、裁剪、变形和缩放的几何变换方法,噪声、模糊、颜色变换、擦除和填充的颜色变化方法,gan和autoaugment的无监督数据增强方法;将进行数据扩增后的训练数据集按照70%、20%、10%的比例分成训练集、验证集和测试集;所述深度残差网络包括:resnet-50、resnet-101和resnet-152的resnet系列深度网络;在求解器文件中设置snapshot值,保存训练过程中的模型文件,选出迭代次数最多的模型和验证集测试准确率最高的模型进行测试集的测试,以综合识别率最高的模型作为最终使用模型;利用深度残差网络训练模型进行识别评分的计算公式为:深度残差网络模型对标注训练的孢子或芽生孢子准确率=深度残差网络模型对标注的孢子或芽生孢子分类正确的个数/机器识别出的所有的孢子或芽生孢子的个数*100%;所述置信度阈值设置为0.9。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述的方法的步骤。
实施例2:
实施例2为实施例1的优选例。
如图1所示是本发明实施例提供的一种基于残差深度网络的孢子芽孢识别方法的流程示意图,包括:
步骤1:将分割出的单目标物进行人工筛选标记,包含目标类别和干扰类别;
步骤2:将得到标记好的样本,按照类别分好之后,采用翻转、平移、裁切、对比度调整等数据增强方法进行数据扩增;
步骤3:将扩增好的数据集按照7:2:1的比例分成训练集、验证集和测试集;
步骤4:使用caffe框架里的convert_imageset创建lmdb数据文件转化数据格式;使用caffe框架里提供的compute_image_mean.cpp文件,生成训练需要使用的均值文件;
步骤5:构建残差神经网络模型,写入caffe能够接受的prototxt文件网络模型;
步骤6:创建超参数文件slover.prototxt,定义训练参数;
步骤7:训练模型,根据训练情况进行参数调整,直至测试得出可用模型。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
1.一种基于残差深度网络的孢子芽孢识别方法,其特征在于,包括:
步骤1:对从自动生物显微镜采集到的原始图片采用形态学方法进行分割,筛选需要识别的目标图片形成样本集并进行标注;
步骤2:将标注的样本集进行数据扩增,形成最终的训练数据集,将训练数据集分成训练集、验证集和测试集;
步骤3:在caffe框架上构建深度残差网络并设置超参数,利用数据集进行训练,得到深度残差网络训练模型;
步骤4:对实时采集的原始图片进行形态学分割后,用测试后综合识别率最高的深度残差网络训练模型进行识别评分,将大于置信度阈值的结果作为最后的识别结果并输出。
2.根据权利要求1所述的基于残差深度网络的孢子芽孢识别方法,其特征在于,所述形态学方法包括:二值化方法、图像增强和锐化、边缘轮廓提取算法、轮廓外接矩形、分水岭算法和graphcut算法。
3.根据权利要求1所述的基于残差深度网络的孢子芽孢识别方法,其特征在于,所述数据扩增包括:翻转、旋转、裁剪、变形和缩放的几何变换方法,噪声、模糊、颜色变换、擦除和填充的颜色变化方法,gan和autoaugment的无监督数据增强方法。
4.根据权利要求1所述的基于残差深度网络的孢子芽孢识别方法,其特征在于,将进行数据扩增后的训练数据集按照70%、20%、10%的比例分成训练集、验证集和测试集。
5.根据权利要求1所述的基于残差深度网络的孢子芽孢识别方法,其特征在于,所述深度残差网络包括:resnet-50、resnet-101和resnet-152的resnet系列深度网络。
6.根据权利要求1所述的基于残差深度网络的孢子芽孢识别方法,其特征在于,在求解器文件中设置snapshot值,保存训练过程中的模型文件,选出迭代次数最多的模型和验证集测试准确率最高的模型进行测试集的测试,以综合识别率最高的模型作为最终使用模型。
7.根据权利要求1所述的基于残差深度网络的孢子芽孢识别方法,其特征在于,利用深度残差网络训练模型进行识别评分的计算公式为:
深度残差网络模型对标注训练的孢子或芽生孢子准确率=深度残差网络模型对标注的孢子或芽生孢子分类正确的个数/机器识别出的所有的孢子或芽生孢子的个数*100%。
8.根据权利要求1所述的基于残差深度网络的孢子芽孢识别方法,其特征在于,所述置信度阈值设置为0.9。
9.一种基于残差深度网络的孢子芽孢识别系统,其特征在于,包括:
模块m1:对从自动生物显微镜采集到的原始图片采用形态学方法进行分割,筛选需要识别的目标图片形成样本集并进行标注;
模块m2:将标注的样本集进行数据扩增,形成最终的训练数据集,将训练数据集分成训练集、验证集和测试集;
模块m3:在caffe框架上构建深度残差网络并设置超参数,利用数据集进行训练,得到深度残差网络训练模型;
模块m4:对实时采集的原始图片进行形态学分割后,用测试后综合识别率最高的深度残差网络训练模型进行识别评分,将大于置信度阈值的结果作为最后的识别结果并输出;
所述形态学方法包括:二值化方法、图像增强和锐化、边缘轮廓提取算法、轮廓外接矩形、分水岭算法和graphcut算法;
所述数据扩增包括:翻转、旋转、裁剪、变形和缩放的几何变换方法,噪声、模糊、颜色变换、擦除和填充的颜色变化方法,gan和autoaugment的无监督数据增强方法;
将进行数据扩增后的训练数据集按照70%、20%、10%的比例分成训练集、验证集和测试集;
所述深度残差网络包括:resnet-50、resnet-101和resnet-152的resnet系列深度网络;
在求解器文件中设置snapshot值,保存训练过程中的模型文件,选出迭代次数最多的模型和验证集测试准确率最高的模型进行测试集的测试,以综合识别率最高的模型作为最终使用模型;
利用深度残差网络训练模型进行识别评分的计算公式为:
深度残差网络模型对标注训练的孢子或芽生孢子准确率=深度残差网络模型对标注的孢子或芽生孢子分类正确的个数/机器识别出的所有的孢子或芽生孢子的个数*100%;
所述置信度阈值设置为0.9。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
技术总结