1.本公开涉及计算机技术、生物信息学领域,具体而言,涉及一种图像分析方法、装置、计算机设备和存储介质。
背景技术:
2.目前,基因序列分析工具,可以预测出基因峰形图谱中单峰波形对应的基本碱基,但是,在存在噪声数据影响的情况下,不能精确地预测出基因峰形图谱中复合峰波形对应的简并碱基,且针对人为制定的判断待检测波形的规则,存在对碱基识别效率低,识别结果不稳定的情况;另外,针对碱基序列中错误的碱基结果进行人工修正,存在效率低,且成本高等问题。因此,如何提高碱基预测结果准确率以及稳定性,提高预测效率,是目前亟待解决的问题。
技术实现要素:
3.本公开实施例至少提供一种图像分析方法、装置、计算机设备和存储介质。
4.第一方面,本公开实施例提供了一种图像分析方法,包括:
5.获取待检测的基因峰形图谱,其中,所述基因峰形图谱包括至少一种基本碱基的待检测波形;
6.提取每个所述待检测波形对应的初始波形特征;
7.基于提取的所述初始波形特征,确定目标融合波形特征;
8.基于所述目标融合波形特征,确定所述基因峰形图谱对应的碱基序列。
9.本公开实施例中,将多种基本碱基所对应的初始波形特征进行融合,利用融合后的目标融合波形特征不仅能够准确地预测出基本碱基,还能够准确地预测出简并碱基,提高了基因预测的准确度;另外,上述方法可以通过训练好的神经网络模型实现,能够进一步提高预测的效率和预测的稳定性。
10.一种可选的实施方式中,所述碱基序列包括至少一种预设碱基;以及
11.所述基于所述目标融合波形特征,确定所述基因峰形图谱对应的碱基序列,包括:
12.分别获取每种预设碱基对应的预设波形特征;
13.将所述目标融合波形特征与所述预设波形特征进行匹配,并基于匹配结果确定所述碱基序列。
14.该实施方式,利用预设碱基对应的预设波形特征与目标融合波形特征的匹配结果,能够很精准地预测出碱基序列中对应的碱基类型,提高预测结果准确率。
15.一种可选的实施方式中,根据以下步骤确定所述预设碱基对应的预设波形特征:
16.获取峰形图谱样本以及峰形图谱样本对应的样本碱基序列,其中,所述样本碱基序列中包括所述预设碱基的位置信息;
17.基于所述样本碱基序列中预设碱基的位置信息,从所述峰形图谱样本中提取所述预设碱基对应的波形区域;
18.将从所述波形区域提取的波形特征作为与所述预设碱基对应的预设波形特征。
19.该实施方式,基于样本碱基序列中各个预设碱基的位置信息,能够从峰形图谱样本中较为准确地提取到对应预设碱基的波形区域,利用较为准确地波形区域能够为对应的预设碱基提取到较为准确地预设波形特征,为后续可以高精度匹配目标融合波形特征做准备。
20.一种可选的实施方式中,所述基于所述样本碱基序列中预设碱基的位置信息,从所述峰形图谱样本中提取所述预设碱基对应的波形区域,包括:
21.针对所述样本碱基序列中每个预设碱基,基于所述预设碱基的位置信息,确定在所述预设碱基之前的且与所述预设碱基相邻的预设碱基的第一位置信息,以及在所述预设碱基之后的且与所述预设碱基相邻的预设碱基的第二位置信息;
22.基于所述预设碱基的位置信息和第一位置信息,确定所述预设碱基对应的波形区域的第一端点;
23.基于所述预设碱基的位置信息和第二位置信息,确定所述预设碱基对应的波形区域的第二端点;
24.基于所述第一端点和所述第二端点,确定所述预设碱基对应的波形区域。
25.该实施方式,基于样本碱基序列中每个预设碱基的位置信息,以及与预设碱基相邻的预设碱基的第一位置信息和第二位置信息,能够从峰形图谱样本中更为准确地提取到对应预设碱基的波形区域,利用较为准确地波形区域能够为对应的碱基提取到较为准确地预设波形特征,为后续可以高精度匹配目标融合波形特征做准备。
26.一种可选的实施方式中,所述预设碱基包括基本碱基和/或简并碱基。
27.该实施方式中,预设碱基既可以包括基本碱基,还可以包括简并碱基,在预设碱基中包括简并碱基的情况下,能够较为准确地预测出碱基序列中的简并碱基,提高预测的效率和预测的稳定性。
28.一种可选的实施方式中,在提取每个所述待检测波形对应的初始波形特征之前,还包括:
29.针对每个待检测波形,确定所述待检测波形中信号强度为零的位置点;
30.将相邻的所述位置点之间的区域作为初始噪声区域,并将所述初始噪声区域内的待检测波形作为与所述初始噪声区域对应的目标波形;
31.基于所述初始噪声区域内的待检测波形,对所述初始噪声区域内的目标波形进行去噪声处理。
32.该实施方式,对待检测波形进行去噪声处理,能够提高碱基序列预测的准确度。
33.一种可选的实施方式中,所述基于初始噪声区域内的待检测波形,对所述初始噪声区域内的目标波形进行去噪声处理,包括:
34.基于所述初始噪声区域对应的碱基序列的长度,从所述初始噪声区域中筛选候选噪声区域;
35.基于所述候选噪声区域内的待检测波形,确定与所述候选噪声区域对应的目标波形是否为噪声数据;
36.在与所述候选噪声区域对应的目标波形为噪声数据的情况下,将所述目标波形的信号强度设置为零。
37.该实施方式,利用初始噪声区域对应的碱基序列的长度,能够较为准确地筛选出存在噪声的候选噪声区域,利用候选噪声区域内的各个波形的波形特征,能够较为准确地确定出候选噪声区域内的目标波形是否为噪声数据;对目标波形进行噪声处理,有利于精准地预测出基因峰形图谱中的碱基序列,提高预测碱基结果的准确率。
38.第二方面,本公开实施例还提供一种图像分析装置,包括:
39.获取模块,用于获取待检测的基因峰形图谱;所述基因峰形图谱包括至少一种基本碱基的待检测波形;
40.提取模块,用于提取每个所述待检测波形对应的初始波形特征;
41.融合模块,用于基于提取的所述初始波形特征,确定目标融合波形特征;
42.确定模块,用于基于所述目标融合波形特征,确定所述基因峰形图谱对应的碱基序列。
43.一种可选的实施方式中,所述碱基序列包括至少一种预设碱基;
44.所述确定模块,用于分别获取每种预设碱基对应的预设波形特征;将所述目标融合波形特征与所述预设波形特征进行匹配,并基于匹配结果确定所述碱基序列。
45.一种可选的实施方式中,根据以下步骤确定所述预设碱基对应的预设波形特征:
46.所述图像分析方法还包括第一处理模块,用于获取峰形图谱样本以及峰形图谱样本对应的样本碱基序列,其中,所述样本碱基序列中包括所述预设碱基的位置信息;基于所述样本碱基序列中预设碱基的位置信息,从所述峰形图谱样本中提取所述预设碱基对应的波形区域;将从所述波形区域提取的波形特征作为与所述预设碱基对应的预设波形特征。
47.一种可选的实施方式中,所述第一处理模块,用于针对所述样本碱基序列中每个预设碱基,基于所述预设碱基的位置信息,确定在所述预设碱基之前的且与所述预设碱基相邻的预设碱基的第一位置信息,以及在所述预设碱基之后的且与所述预设碱基相邻的预设碱基的第二位置信息;基于所述预设碱基的位置信息和第一位置信息,确定所述预设碱基对应的波形区域的第一端点;基于所述预设碱基的位置信息和第二位置信息,确定所述预设碱基对应的波形区域的第二端点;基于所述第一端点和所述第二端点,确定所述预设碱基对应的波形区域。
48.一种可选的实施方式中,所述预设碱基包括基本碱基和/或简并碱基。
49.一种可选的实施方式中,所述图像分析方法还包括第二处理模块,针对每个待检测波形,确定所述待检测波形中信号强度为零的位置点;将相邻的所述位置点之间的区域作为初始噪声区域,并将所述初始噪声区域内的该待检测波形作为与所述初始噪声区域对应的目标波形;基于所述初始噪声区域内的待检测波形,对所述初始噪声区域内的目标波形进行去噪声处理。
50.一种可选的实施方式中,所述第二处理模块,用于基于所述初始噪声区域对应的碱基序列的长度,从所述初始噪声区域中筛选候选噪声区域;基于所述候选噪声区域内的待检测波形,确定与所述候选噪声区域对应的目标波形是否为噪声数据;在与所述候选噪声区域对应的目标波形为噪声数据的情况下,将所述目标波形的信号强度设置为零。
51.第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方
面,或第一方面中任一种可能的实施方式中的步骤。
52.第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
53.关于上述图像分析装置、计算机设备和存储介质的效果描述参见上述图像分析方法的说明,这里不再赘述。
54.为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
55.为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
56.图1示出了本公开实施例所提供的一种图像分析方法的流程图;
57.图2示出了本公开实施例所提供的基因峰形图谱示意图;
58.图3示出了本公开实施例所提供的去噪声处理的流程图;
59.图4示出了本公开实施例所提供的去噪声处理的具体流程图;
60.图5示出了本公开实施例所提供的一种确定预设碱基对应的预设波形特征的流程图;
61.图6示出了本公开实施例所提供的从峰形图谱样本中提取预设碱基对应的波形区域的流程图;
62.图7示出了本公开实施例所提供的峰形图谱样本示意图;
63.图8示出了本公开实施例所提供的基因峰形图谱预测碱基,确定碱基序列的流程图;
64.图9示出了本公开实施例所提供的一种图像分析装置的示意图;
65.图10示出了本公开实施例所提供的一种计算机设备的结构示意图。
具体实施方式
66.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
67.另外,本公开实施例中的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。
68.在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
69.经研究发现,基因序列分析工具,可以预测出基因峰形图谱中单峰波形对应的基本碱基,但是,在存在噪声数据影响的情况下,不能精确地预测出基因峰形图谱中复合峰波形对应的简并碱基,且针对人为制定的判断待检测波形的规则,存在对碱基识别效率低,识别结果不稳定的情况;另外,针对碱基序列中错误的碱基结果进行人工修正,存在效率低,且成本高等问题。
70.针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
71.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
72.为便于对本实施例进行理解,首先对本公开实施例所公开的一种图像分析方法进行详细介绍,本公开实施例所提供的图像分析方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(user equipment,ue)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(personal digital assistant,pda)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该图像分析方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
73.下面以执行主体为计算机设备为例对本公开实施例提供的图像分析方法加以说明。
74.参见图1所示,为本公开实施例提供的一种图像分析方法的流程图,该方法包括步骤s101~s104,其中:
75.s101:获取待检测的基因峰形图谱。
76.本步骤中,基因峰形图谱包括至少一种基本碱基的待检测波形。示例性的,基本碱基可以为腺嘌呤(a)、鸟嘌呤(g)、胞嘧啶(c)和胸腺嘧啶(t)等。可以参见图2所示,其为基因峰形图谱示意图。
77.在一种可能的实施方式中,在获取到待检测的基因峰形图谱后,可以对基因峰形图谱中的待检测波形进行去噪声处理。具体实施时,可以参见图3所示,其为去噪声处理的流程图,包括步骤s301~s303,其中:
78.s301:针对每个待检测波形,确定待检测波形中信号强度为零的位置点。
79.可以参见图2所示,例如,可以从基本峰形图谱中选取任一待检测波形n或待检测波形m,如选取待检测波形n,可以确定待检测波形n上信号强度为零的位置点,即a点、b点、c点和d点等;或者,选取待检测波形m,可以确定波形m上信号强度为零的位置点,即e点和f点等。
80.s302:将相邻的位置点之间的区域作为初始噪声区域,并将初始噪声区域内的该
待检测波形作为与初始噪声区域对应的目标波形。
81.延续上例,可以确定出待检测波形n的初始噪声区域为[a,b]、[b,c]和[c,d],将[a,b]内的待检测波形n作为与[a,b]对应的目标波形,将[b,c]内的待检测波形n作为与[b,c]对应的目标波形,将[c,d]内的待检测波形n作为与[c,d]对应的目标波形;可以确定出待检测波形m的初始噪声区域为[e,f],将[e,f]内的待检测波形m作为与[e,f]对应的目标波形。
[0082]
s303:基于初始噪声区域内的待检测波形,对初始噪声区域内的目标波形进行去噪声处理。
[0083]
延续上例,针对待检测波形n中的[c,d]部分进行去噪声处理,可以基于初始噪声区域[c,d]内的待检测波形,如待检测波形n`、待检测波形n``、待检测波形n```,按照下列方式进行去噪声处理:参见图4所示,其为去噪声处理的具体流程图,步骤s401~s403,其中:
[0084]
s401:基于初始噪声区域对应的碱基序列的长度,从初始噪声区域中筛选候选噪声区域。
[0085]
本步骤中,通过对初始噪声区域对应的碱基序列的长度进行检测,当初始噪声区域对应的碱基序列的长度大于第一预设阈值,则可以确定筛选出该初始噪声区域为候选噪声区域。其中,第一预设阈值可以为,获取到的基因峰形图谱中所有碱基预设波形区域平均值的α倍,α可以通过经验值获取,在此不进行限定。
[0086]
延续上例,可以从待检测波形n对应的初始噪声区域[a,b]、[b,c]和[c,d]中筛选出[c,d]作为候选噪声区域。
[0087]
s402:基于候选噪声区域内的待检测波形,确定与候选噪声区域对应的目标波形是否为噪声数据。
[0088]
延续上例,基于候选噪声区域[c,d]内的待检测波形n、待检测波形n`、待检测波形n``、待检测波形n```,确定目标波形n是否为噪声数据。
[0089]
具体实施时,如果在候选噪声区域[c,d]内目标波形n存在波峰h点与其相邻的波谷l1点和l2点之间的差值分别大于基因峰形图谱中全部待检测波形波峰值的β倍,比如β可以取则在候选噪声区域[c,d]内的该目标波形n不是噪声数据,其中,β可以通过经验值获取,在此不进行限定。如果在候选噪声区域[c,d]内目标波形n纵向的高度值大于其他待检测波形n`、n``和n```纵向的高度值,则计数值加一,当计数值小于候选噪声区域[c,d]的长度值的γ倍,比如γ可以取0.4,则在候选噪声区域[c,d]内的该目标波形n是噪声数据,其中,γ可以通过经验值获取,在此不进行限定。
[0090]
s403:在与候选噪声区域对应的目标波形为噪声数据的情况下,将目标波形的信号强度设置为零。
[0091]
延续上例,确定在候选噪声区域[c,d]内目标波形n是噪声数据,可以将[c,d]内的目标波形n的纵向高度值设置为零。
[0092]
另外,在与候选噪声区域对应的目标波形不是噪声数据的情况下,保留目标波形。
[0093]
通过上述步骤s301~步骤s303和步骤s401~步骤s403,可以利用初始噪声区域对应的碱基序列的长度,能够较为准确地筛选出存在噪声的候选噪声区域,利用候选噪声区
域内的各个波形的波形特征,能够较为准确地确定出候选噪声区域内的目标波形是否为噪声数据;对目标波形进行噪声处理,有利于精准地预测出基因峰形图谱中的碱基序列,提高预测碱基结果的准确率。
[0094]
s102:提取每个待检测波形对应的初始波形特征。
[0095]
本步骤中,初始波形特征可以为基本碱基在基因峰形图谱中的位置、基本碱基各个位置的信号强弱、待检测波形走势、各峰形之间的比值等。可以参见图2所示,其中可以观察到每一基本碱基对应的位置,基本碱基各个位置的纵向高度值,即信号强弱,待检测波形的走势等。
[0096]
在一种可能的实施方式中,可以通过神经网络模型对待检测波形对应的初始波形特征进行特征提取。具体实施时,可以通过以下模型进行特征提取:
[0097]
1、基于多层感知机的模型,对初始波形特征进行特征提取。
[0098]
2、基于卷积神经网络(convolutional neural networks,cnn),对初始波形特征进行特征提取。如二维卷积、一维卷积、残差网络(deep residual network,resnet)、空洞卷积(dilated/atrous convolution)等。
[0099]
3、基于序列模型,对初始波形特征进行特征提取。如循环神经网络(recurrent neural network,rnn)、长短期记忆网络(long short
‑
term memory,lstm)、门控循环单元(gated recurrent unit,gru network)、序列标注模型(bilstm)、时间卷积网络(tcn)等。
[0100]
4、基于注意力的模型,对初始波形特征进行特征提取,如全局注意力模型、局部注意力模型、自注意力机制等。
[0101]
5、基于图的模型,对初始波形特征进行特征提取,如图神经网络(graph convolutional network,gcn)、图注意力网络(graph attention network,gat)、图同构网络模型(graph isomorphism network,gin)、空域图卷积模型(graph sample and aggregate,graphsage)等。
[0102]
通过以上模型构成的复合模型,对初始波形特征进行特征提取。例如,可以通过先利用卷积神经网络得到初始波形特征输出结果,再将初始波形特征输出结果作为序列模型的输入,得到最终初始波形特征的输出结果。或者,也可以利用上述任一单个模型来提取初始波形特征。
[0103]
s103:基于提取的初始波形特征,确定目标融合波形特征。
[0104]
本步骤中,基于步骤s102中提取出的四种基本碱基(g、a、t、c)的初始波形特征,可以采用全连接网络,拼接、点乘、加权求和等方法进行特征融合,最终确定目标融合波形特征。
[0105]
s104:基于目标融合波形特征,确定基因峰形图谱对应的碱基序列。
[0106]
其中,碱基序列可以包括至少一种预设碱基。其中,预设碱基可以为基本碱基,即g、a、t、c等;或者,预设碱基可以为简并碱基,即r(a/g)、y(c/t)、m(a/c)、k(g/t)、s(g/c)、w(a/t)等。
[0107]
具体实施时,可以分别获取每种预设碱基对应的预设波形特征;将目标融合波形特征与预设波形特征进行匹配,并基于匹配结果确定碱基序列。
[0108]
在一种可能的实施方式中,可以参见图5所示,其为一种确定预设碱基对应的预设波形特征的流程图,包括步骤s501~s503,其中:
[0109]
s501:获取峰形图谱样本以及峰形图谱样本对应的样本碱基序列。
[0110]
本步骤中,针对模型训练过程获取的峰形图谱样本包括样本碱基序列,其中,样本碱基序列中包括预设碱基的位置信息。示例性的,如图2所示的,第80个位置的预设碱基为胞嘧啶(c)。
[0111]
s502:基于样本碱基序列中预设碱基的位置信息,从峰形图谱样本中提取预设碱基对应的波形区域。
[0112]
其中,预设碱基包括基本碱基和/或简并碱基。
[0113]
具体实施时,基于样本碱基序列中简并碱基的位置信息,可以从峰形图谱样本中提取简并碱基对应的第一波形区域;和/或,基于碱基序列中基本碱基的位置信息,可以从峰形图谱样本中提取基本碱基对应的第二波形区域。
[0114]
参见图7所示,其为峰形图谱样本示意图,其中基本碱基对应单峰波形71,单峰波形71对应的波形区域即为上述第二波形区域。简并碱基对应复合峰波形72,复合峰波形72对应的波形区域即为上述第一波形区域,示例性的,复合峰波形72的特点可以为具有73位置处相交的波形。
[0115]
可以参见图6所示,其为从峰形图谱样本中提取预设碱基对应的波形区域的流程图,包括步骤s601~s604,其中:
[0116]
s601:针对样本碱基序列中每个预设碱基,基于预设碱基的位置信息,确定在预设碱基之前的且与预设碱基相邻的预设碱基的第一位置信息,以及在预设碱基之后的且与预设碱基相邻的预设碱基的第二位置信息。
[0117]
示例性的,针对图7中的第80个预设碱基(腺嘌呤a)的位置,基于该腺嘌呤(a)的位置信息,确定在该腺嘌呤(a)之前的、与该腺嘌呤(a)相邻的预设碱基的第一位置信息,即第79个预设碱基位置信息;以及在该腺嘌呤(a)之后的、与该腺嘌呤(a)相邻的预设碱基的第二位置信息,即第81个预设碱基位置信息。
[0118]
s602:基于预设碱基的位置信息和第一位置信息,确定预设碱基对应的波形区域的第一端点。
[0119]
示例性的,可以按照下列公式确定预设碱基对应的波形区域的第一端点:
[0120]
left=(position[i
‑
1] position[i])
×
0.5
[0121]
其中,left表示预设碱基对应的波形区域的左端点,position(i)表示第i个预设碱基的位置。延续上例,在已知第80个预设碱基(腺嘌呤a)的位置为200,第79个预设碱基位置为100,根据上述公式,可以得到第80个预设碱基(腺嘌呤a)对应的波形区域的第一端点位置为(100 200)
×
0.5=150。
[0122]
s603:基于预设碱基的位置信息和第二位置信息,确定预设碱基对应的波形区域的第二端点。
[0123]
示例性的,可以按照下列公式确定预设碱基对应的波形区域的第二端点:
[0124]
right=(position[i] position[i 1])
×
0.5
[0125]
其中,right表示预设碱基对应的波形区域的右端点。延续上例,在已知第80个预设碱基(腺嘌呤a)的位置为200,第81个预设碱基位置为300,根据上述公式,可以得到第80个预设碱基(腺嘌呤a)对应的波形区域的第二端点位置为(200 300)
×
0.5=250。
[0126]
s604:基于第一端点和第二端点,确定预设碱基对应的波形区域。
[0127]
基于步骤s602和s603确定的第一端点和第二端点,确定预设碱基对应的波形区域,延续上例,预设碱基对应的波形区域可以按照下述表示方法表示:
[0128]
domain(i)=[left,right]
[0129]
其中,domain表示预设碱基对应的波形区域,比如,第80个预设碱基对应的波形区域为[150,250]。
[0130]
示例性的,以图7为例,复合峰波形对应的波形区域的计算方式可以参见上述步骤s601~s604的实施方式,具体地,在已知第83个预设碱基(胸腺嘧啶t)的位置为520,第82个预设碱基位置为420,第84个预设碱基位置为640,可以根据公式left=(position[i
‑
1] position[i])
×
0.5,得到第83个预设碱基(胸腺嘧啶t)对应的波形区域的第一端点位置为(420 520)
×
0.5=470;可以根据公式right=(position[i] position[i 1])
×
0.5,得到第83个预设碱基(胸腺嘧啶t)对应的波形区域的第二端点位置为(520 640)
×
0.5=580。因此,第83个预设碱基对应的波形区域为[470,580]。
[0131]
这里,按照上述提取预设碱基对应的波形区域的方法,如图7所示,可以确定单峰波形对应的波形区域为[150,250],即[a,b],复合峰波形对应的波形区域为[470,580],即[c,d]。
[0132]
s503:将从波形区域提取的波形特征作为与预设碱基对应的预设波形特征。
[0133]
具体实施时,步骤s502中得到的复合峰波形72对应的波形区域[c,d],即为第一波形区域,将从第一波形区域提取的波形特征作为与简并碱基对应的预设波形特征;和/或,步骤s502中得到的单峰波形71对应的波形区域[a,b],即为第二波形区域,将从第二波形区域提取的波形特征作为与基本碱基对应的预设波形特征。
[0134]
通过上述步骤s101~步骤s104,将多种基本碱基所对应的初始波形特征进行融合,利用融合后的目标融合波形特征不仅能够准确地预测出基本碱基,还能够准确地预测出简并碱基,提高了基因预测的准确度;另外,上述方法可以通过训练好的神经网络模型实现,能够进一步提高预测的效率和预测的稳定性。
[0135]
参见图8所示,其为基因峰形图谱预测碱基,确定碱基序列的流程图。
[0136]
s801:获取待检测的基因峰形图谱;
[0137]
s802:对待检测的基因峰形图谱中初始噪声区域内的目标波形进行去噪声处理;
[0138]
s803:将去噪声处理后的基因峰形图谱输入神经网络模型,提取初始波形特征;
[0139]
s804:对提取的初始波形特征进行融合处理,确定目标融合波形特征;
[0140]
s805:基于目标融合波形特征进行碱基预测;
[0141]
s806:基于输出结果,确定基因峰形图谱对应的碱基序列。
[0142]
本领域技术人员可以理解,在上述方法的具体实施方式中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
[0143]
基于同一发明构思,本公开实施例中还提供了与图像分析方法对应的图像分析装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述图像分析方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
[0144]
参照图9所示,为本公开实施例提供的一种图像分析装置的示意图,所述装置包括:获取模块901、提取模块902、融合模块903和确定模块904;其中,
[0145]
获取模块901,用于获取待检测的基因峰形图谱;所述基因峰形图谱包括至少一种基本碱基的待检测波形;
[0146]
提取模块902,用于提取每个所述待检测波形对应的初始波形特征;
[0147]
融合模块903,用于基于提取的所述初始波形特征,确定目标融合波形特征;
[0148]
确定模块904,用于基于所述目标融合波形特征,确定所述基因峰形图谱对应的碱基序列。
[0149]
一种可选的实施方式中,所述碱基序列包括至少一种预设碱基;
[0150]
所述确定模块904,用于分别获取每种预设碱基对应的预设波形特征;将所述目标融合波形特征与所述预设波形特征进行匹配,并基于匹配结果确定所述碱基序列。
[0151]
一种可选的实施方式中,根据以下步骤确定所述预设碱基对应的预设波形特征:
[0152]
所述图像分析方法还包括第一处理模块905,用于获取峰形图谱样本以及峰形图谱样本对应的样本碱基序列,其中,所述样本碱基序列中包括所述预设碱基的位置信息;基于所述样本碱基序列中预设碱基的位置信息,从所述峰形图谱样本中提取所述预设碱基对应的波形区域;将从所述波形区域提取的波形特征作为与所述预设碱基对应的预设波形特征。
[0153]
一种可选的实施方式中,所述第一处理模块905,用于针对所述样本碱基序列中每个预设碱基,基于所述预设碱基的位置信息,确定在所述预设碱基之前的且与所述预设碱基相邻的预设碱基的第一位置信息,以及在所述预设碱基之后的且与所述预设碱基相邻的预设碱基的第二位置信息;基于所述预设碱基的位置信息和第一位置信息,确定所述预设碱基对应的波形区域的第一端点;基于所述预设碱基的位置信息和第二位置信息,确定所述预设碱基对应的波形区域的第二端点;基于所述第一端点和所述第二端点,确定所述预设碱基对应的波形区域。
[0154]
一种可选的实施方式中,所述预设碱基包括基本碱基和/或简并碱基。
[0155]
一种可选的实施方式中,所述图像分析方法还包括第二处理模块906,针对每个待检测波形,确定所述待检测波形中信号强度为零的位置点;将相邻的所述位置点之间的区域作为初始噪声区域,并将所述初始噪声区域内的该待检测波形作为与所述初始噪声区域对应的目标波形;基于所述初始噪声区域内的待检测波形,对所述初始噪声区域内的目标波形进行去噪声处理。
[0156]
一种可选的实施方式中,所述第二处理模块906,用于基于所述初始噪声区域对应的碱基序列的长度,从所述初始噪声区域中筛选候选噪声区域;基于所述候选噪声区域内的待检测波形,确定与所述候选噪声区域对应的目标波形是否为噪声数据;在与所述候选噪声区域对应的目标波形为噪声数据的情况下,将所述目标波形的信号强度设置为零。
[0157]
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
[0158]
基于同一技术构思,本技术实施例还提供了一种计算机设备。参照图10所示,为本技术实施例提供的计算机设备的结构示意图,包括:
[0159]
处理器101、存储器102和总线103。其中,存储器102存储有处理器101可执行的机器可读指令,处理器101用于执行存储器52中存储的机器可读指令,所述机器可读指令被处理器101执行时,处理器101执行下述步骤:s101:获取待检测的基因峰形图谱;s102:提取每
个待检测波形对应的初始波形特征;s103:基于提取的初始波形特征,确定目标融合波形特征;s104:基于目标融合波形特征,确定基因峰形图谱对应的碱基序列。
[0160]
上述存储器102包括内存1021和外部存储器1022;这里的内存1021也称内存储器,用于暂时存放处理器101中的运算数据,以及与硬盘等外部存储器1022交换的数据,处理器101通过内存1021与外部存储器1022进行数据交换,当计算机设备运行时,处理器101与存储器102之间通过总线103通信,使得处理器101在执行上述方法实施例中所提及的执行指令。
[0161]
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的图像分析方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
[0162]
本公开实施例所还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的图像分析方法的步骤,具体可参见上述方法实施例,在此不再赘述。
[0163]
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
[0164]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0165]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0166]
另外,在本公开各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
[0167]
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read
‑
only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0168]
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
转载请注明原文地址:https://doc.8miu.com/read-1730567.html