本申请涉及人工智能图像处理,具体涉及一种结直肠癌微卫星状态检测模型的训练方法。
背景技术:
1、结直肠癌(colorectal cancer,crc)是世界范围内一个重要的公共卫生问题。不断攀升的发病率和死亡率威胁着人类的健康,也给社会带来了巨大的经济负担。微卫星不稳定(microsatellite instability,msi)是由于在dna复制时发生插入或缺失突变,导致微卫星序列长度发生改变的现象,其在蛋白水平上表现为mlh1、msh2、msh6和pms2等错配修复蛋白的表达缺失,在癌症的发生和发展中起着重要作用,其在结直肠癌中的特定表现形式对于诊断和治疗具有重要的临床意义。基于微卫星(microsatellite,ms)状态的分子亚型,crc肿瘤可分为两类:微卫星稳定(mss)肿瘤和微卫星不稳定(msi)肿瘤。与mss表型的患者相比,具有msi特征的结直肠癌患者在发病机制、药物敏感性、治疗手段及预后等方面均存在显著差异。因此,中国结直肠癌诊疗规范及美国国家综合癌症网络指南均推荐对所有结直肠癌患者进行msi检测,用于林奇综合征筛查、辅助化疗方案选择及免疫治疗获益预测。然而,受经济条件和医疗资源的限制,并不是所有的患者都能接受ms状态检测。随着人工智能(artificial intelligence,ai)技术的迅速发展,计算机技术结合临床信息对患者进行个体化辅助诊断成为一种新兴的精准治疗手段。全切片数字化扫描技术(whole slideimage,wsi)为病理学家突破了传统显微镜的限制,不仅可以通过网络传输进行远程病理会诊,更关键的是可以与不断发展的计算机人工智能、大数据与云技术结合。ai技术与病理诊断不断发展融合,病理ai开始作为一种辅助诊断技术投入临床应用。
2、目前国内外针对msi状态的诊断还是主要停留在分子生物学技术上,存在以下问题:
3、①分子生物学技术的开展和应用需要专业人员,这就限制此类检测技术的普适性。②分子生物学技术进行检测需要耗费人力物力,大大增加检测的成本,给患者甚至是社会带来经济负担。③分子生物学技术的应用需要时间成本,以现有技术最快也需要72h才能出具完整的检测报告,在一定程度上延误患者治疗。④分子生物学技术的应用依赖于患者肿瘤组织的dna进行,这对肿瘤组织的数量提出更高要求,这会导致部分活检小标本获取肿瘤组织较少而无法完成msi状态的检测。
技术实现思路
1、为至少在一定程度上克服相关技术中存在的检测成本高、依赖患者肿瘤组织的dna等问题,本申请提供一种结直肠癌微卫星状态检测模型的训练方法。
2、根据本申请实施例的第一方面,提供一种结直肠癌微卫星状态检测模型的训练方法,包括如下步骤:
3、获取第一训练数据集和第二训练数据集;所述第二训练数据集是从目标人群采集的样本数据;每一个训练数据包括一个图像块及其对应的分类标签;
4、搭建深度学习预测模型,该预测模型用于对图像块进行图像特征提取并预测每个图像块的微卫星状态;
5、采用第一训练数据集对所述预测模型中的参数进行训练,获得初始检测模型;
6、采用迁移学习的方式,将第二训练数据集输入初始检测模型进行学习,获得结直肠癌微卫星状态检测模型。
7、进一步地,获取训练数据,具体包括如下步骤:
8、获取数字病理图像;
9、将所述数字病理图像中的肿瘤组织区域无重叠地切分成统一尺寸的图像块,并为每一个图像块赋予分类标签;
10、对图像块进行图像去噪和颜色归一化。
11、进一步地,对图像块进行图像去噪的具体步骤包括:
12、计算图像块中空白区域或模糊空间的面积在图像块总面积中的占比;
13、仅保留占比小于预设阈值的图像块。
14、进一步地,对图像块进行颜色归一化的具体步骤包括:
15、对每一个图像块均进行90°或180°随机旋转、水平或垂直平面随机翻转、随机缩放和/或仿射变换;
16、通过z-score的归一化使每一个图像块的像素值均服从标准正态分布。
17、进一步地,采用第一训练数据集对所述预测模型中的参数进行训练,具体包括如下步骤:
18、将模型参数优化的目标函数设置为交叉熵损失;
19、经过多次反向传播和参数的迭代更新,直至模型的目标函数值符合预设的收敛条件,模型停止训练。
20、进一步地,
21、所述分类模型包括一个卷积层、一个全连接层和多个残差块;其中,全连层为图像分类层,输出维度设置为2,用于预测每个图像块属于mss和msi的概率。
22、根据本申请实施例的第二方面,提供一种结直肠癌微卫星状态检测方法,包括如下步骤:
23、获取待检测的病理图像;
24、将所述病理图像切分为若干标准图像块;
25、将多个标准图像块输入检测模型,输出每个标准图像块的微卫星状态;其中,所述检测模型是采用上述实施例的模型训练方法获得的结直肠癌微卫星状态检测模型;
26、基于同一张病理图像的所有标准图像块的微卫星状态,确定该病理图像的微卫星状态。
27、进一步地,将所述病理图像切分为若干标准图像块,具体包括如下步骤:
28、将病理图像中的肿瘤组织区域无重叠地切分成统一尺寸的图像块;
29、对图像块进行图像去噪和颜色归一化。
30、进一步地,确定该病理图像的微卫星状态,具体包括如下步骤:
31、将从属于同一张病理图像的每个图像块的预测概率进行累加,用于判定最终的微卫星状态。
32、根据本申请实施例的第三方面,提供一种计算机设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述存储器中的计算机程序,以实现上述实施例的结直肠癌微卫星状态检测模型的训练方法,或者结直肠癌微卫星状态检测方法。
33、本申请的实施例提供的技术方案具备以下有益效果:
34、本申请的方案可以实现直接根据数字病理图像对结直肠癌患者微卫星不稳定性状态进行分类,提高预测精度的同时大量减少人力物力、降低成本;不依赖患者肿瘤组织的dna即可完成检测,提高检测效率、降低检测难度;采用目标人群的数据集对预测模型进行针对性调整,提高在目标人群中的检测准确度。
35、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
1.一种结直肠癌微卫星状态检测模型的训练方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的方法,其特征在于,获取训练数据,具体包括如下步骤:
3.根据权利要求2所述的方法,其特征在于,对图像块进行图像去噪的具体步骤包括:
4.根据权利要求2所述的方法,其特征在于,对图像块进行颜色归一化的具体步骤包括:
5.根据权利要求1所述的方法,其特征在于,采用第一训练数据集对所述预测模型中的参数进行训练,具体包括如下步骤:
6.根据权利要求1所述的方法,其特征在于,
7.一种结直肠癌微卫星状态检测方法,其特征在于,
8.根据权利要求7所述的方法,其特征在于,将所述病理图像切分为若干标准图像块,具体包括如下步骤:
9.根据权利要求7所述的方法,其特征在于,确定该病理图像的微卫星状态,具体包括如下步骤:
10.一种计算机设备,其特征在于,包括: