本发明涉及模式识别领域,特别是涉及一种疾病等级分类方法、设备、介质及产品。
背景技术:
1、疾病等级分类是指对医疗领域等有关疾病严重程度的相关数据集,进行疾病严重程度等级的判断。医疗诊断领域复杂的数据中不可避免的存在标签错误的情况,如果让人工处理这些复杂的数据将十分耗费时间和人力资源,因此利用人工智能技术建立鲁棒模型将有助于缓解资源压力。已有医疗等级分类问题往往是基于标签完全正确的情况,这并不符合实际情况。同时医疗等级数据集的类别之间存在明显的等级递进关系,顺序信息也应当考虑在内。
2、xiaofeng liu等为医疗诊断使用单峰均匀约束的wasserstein损失训练模型,挖掘医疗诊断分类问题中暗含的顺序信息;bo han等人针对标签噪声问题提出了co-teaching方法,基于网络拟合效应挑选干净样本进行模型训练;feng chen等人提出根据knn进行样本挑选以及根据预测输出概率做标签矫正的ssr方法。
3、申请号为cn201910357585.5的中国发明专利申请中,基于数据挖掘技术的心血管疾病患者虚弱症分级方法将主成分分析信息作为分类模型的训练数据项进行分类;申请号为cn202111346214.0的中国发明专利申请提供的基于3d注意力卷积与自监督学习的脑疾病分类方法,利用注意力机制的3dcnn从fmri数据中提取全脑体素的空间特征,同时利用自监督学习挖掘数据的隐含特征提升分类效果;申请号为cn202311183569.1的发明专利申请提出了一种基于异步co-teaching的含标签噪声数据分类方法,该方法将经典co-teaching模型的两个相同dnn(deep neural network)改为一个早期dnn和一个中期dnn,中期dnn经过训练早期后标签噪声鲁棒性开始逐渐降低,而早期dnn还保留标签噪声鲁棒性。
4、但在上述方法中,关注于疾病分级的方法没有考虑到标签噪声的问题,关注于标签噪声的处理方法则没有考虑到疾病等级类别之间暗含的等级递进的顺序信息,即类别越相邻,类别所代表的疾病程度特征相关性越强的情况。
技术实现思路
1、为解决现有技术存在的上述问题,本发明提供了一种疾病等级分类方法、设备、介质及产品。
2、为实现上述目的,本发明提供了如下方案:
3、一种疾病等级分类方法,所述方法包括:
4、构建分类模型;所述分类模型用于自动化进行层级决策过程;
5、获取医疗数据,并将所述医疗数据输入至所述分类模型得到概率预测结果;
6、基于所述概率预测结果得到疾病分级预测结果。
7、可选地,构建分类模型,具体包括:
8、生成标签噪声,得到同时具有真实标签和噪声标签的样本,以生成医疗等级数据集;
9、基于所述医疗等级数据集构建层级决策问题;
10、根据层级决策问题修改初始分类模型的网络结构,得到所述分类模型。
11、可选地,生成标签噪声的过程包括:
12、确定噪声水平,并基于所述噪声水平确定翻转概率;所述翻转概率包括真实标签翻转为噪声标的概率以及真实标签翻转为自身的概率;
13、利用正态分布的概率密度函数控制所述翻转概率,使翻转概率随着与真实标签距离的增加而降低,以模拟现实情况下的噪声生成过程;
14、根据softmax方法对所述翻转概率进行归一化,以确定噪声转移矩阵;
15、依据噪声转移矩阵,将真实标签翻转为噪声标签。
16、可选地,根据层级决策问题修改初始分类模型的网络结构,得到所述分类模型,具体包括:
17、基于层级决策问题,使所述初始分类模型输出各个层级决策结果的中间过程中的条件概率,并进行递归计算,得到下一层决策问题的预测概率,依次类推,使得所述网络结构输出的神经元分别对应链接各个决策层的条件概率,以得到所述分类模型。
18、可选地,获取医疗数据,并将所述医疗数据输入至所述分类模型得到概率预测结果,具体包括:
19、将所述医疗数据输入至所述分类模型,得到医疗数据的概率;
20、在所述分类模型中,对所述医疗数据的概率进行顺序化操作,并合并相邻类别的概率得到多个决策问题;
21、确定每个类别所在决策问题的概率之和,并将各个类别对应的概率之和进行softmax归一化操作,得到所述概率预测结果。
22、可选地,基于所述概率预测结果得到疾病分级预测结果,具体包括:
23、将概率预测结果的最大值所在类别作为所述疾病分级预测结果。
24、一种计算机设备,包括:存储器、处理器以存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现上述任一项所述的疾病等级分类方法的步骤。
25、一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述的疾病等级分类方法的步骤。
26、一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一项所述的疾病等级分类方法的步骤。
27、根据本发明提供的具体实施例,本发明公开了以下技术效果:
28、本发明通过使用具有自动化进行层级决策过程的分类模型,对获取的医疗数据进行处理,得到概率预测结果,能够使得分类模型在标签噪声存在情况下的医疗等级分类任务中获得更好的性能。并且,本发明基于概率预测结果得到疾病分级预测结果,能够进一步提高疾病分级预测的精确性。
1.一种疾病等级分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的疾病等级分类方法,其特征在于,构建分类模型,具体包括:
3.根据权利要求2所述的疾病等级分类方法,其特征在于,生成标签噪声的过程包括:
4.根据权利要求2所述的疾病等级分类方法,其特征在于,根据层级决策问题修改初始分类模型的网络结构,得到所述分类模型,具体包括:
5.根据权利要求4所述的疾病等级分类方法,其特征在于,获取医疗数据,并将所述医疗数据输入至所述分类模型得到概率预测结果,具体包括:
6.根据权利要求1所述的疾病等级分类方法,其特征在于,基于所述概率预测结果得到疾病分级预测结果,具体包括:
7.一种计算机设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-6中任一项所述疾病等级分类方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述疾病等级分类方法的步骤。
9.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述疾病等级分类方法的步骤。
