本技术涉及核酸扩增,特别是涉及一种预测引物二聚体的方法、装置和存储介质。
背景技术:
1、聚合酶链式反应技术(polymerase chain reaction,pcr)是一种用于放大扩增特定的dna片段的分子生物学技术。pcr技术在基因组学、分子生物学、临床医疗诊断及法医学等领域都有着广泛的应用。多重pcr又叫复合pcr,是在常规pcr基础上改进并发展起来的一种新型pcr扩增技术,即可在一个反应体系中加入两对以上引物,同时扩增出多个核酸片段。多重pcr技术依赖于与基因组中独特区域结合的引物,引物是pcr分析的关键组成部分。
2、在多重pcr技术中,引物二聚体(primer dimer)是最常见的问题,当引物对之间的部分序列存在同源性时,可能形成引物二聚体。引物二聚体是引物本身3’端的碱基在taqdna聚合酶的作用下与自身或别的引物互补结合并从3’端延伸形成的一对引物或小分子量的双链dna片段,是由“引物-引物”结合和延伸形成的脱靶扩增产物。这些“引物-引物”相互作用可以竞争性地抑制与靶dna的结合,从反应池中去除引物,并耗尽脱氧核苷酸,这些都会导致扩增效率和产物产量降低。通过在pcr前预测引物对之间是否可能形成引物二聚体,优化筛选高特异性引物,减少pcr反应过程中引物二聚体的产生,有助于实验顺利进行。因此,在设计引物时,对引物二聚体进行预测具有重要价值。目前高效、快速、准确地预测引物二聚体的方法对pcr分析仍具备十分重要的意义。
3、对引物二聚体的预测普遍流程如下:通过设计不同的算法,比较引物与引物间是否对齐,能否匹配,再通过计算引物的退火温度tm值和吉布斯自由能deltag(δg)值来预测该引物二聚体能否生成。目前,已有一些预测引物二聚体的方法,这些方法可快速查看gc含量,解链温度;高效、快速识别引物二聚体;预测的引物二聚体准确性高。但是这些预测方法仍然存在缺陷,例如常用的引物二聚体预测方法mfeprimer缺乏对引物序列出现“比对到空位置上”的情况的引物二聚体的预测;autodimer在预测引物二聚体过程中,引物的比对过程没有考虑到不同的碱基配对对引物二聚体稳定性的影响;multiple primer analyzer关注所有可比对上的引物二聚体,实际只有可延伸的引物二聚体才会对pcr过程产生重要影响。
4、因此,对于引物二聚体的预测,仍然迫切需要一种高效、快速、准确的方法来解决上述问题。
技术实现思路
1、本技术的目的是提供一种新的预测引物二聚体的方法、装置和存储介质。
2、为了实现上述目的,本技术采用了以下技术方案:
3、本技术的第一方面公开了一种预测引物二聚体的方法,该方法包括在预测引物二聚体时,引入空位罚分规则对引物二聚体进行打分和预测的步骤。
4、需要说明的是,本技术的引物二聚体预测方法,率先关注并提出空位对引物二聚体的影响,率先将空位罚分规则用于引物二聚体的打分和预测,从而提高了引物二聚体预测的准确性,为引物二聚体的预测提供了一种新的方案和思路。
5、本技术的一种实现方式中,空位罚分规则包括分别对出现单个空位和连续空位的位置,设计不同的罚分。
6、本技术的一种实现方式中,空位罚分规则还包括分别对空位出现在引物序列的第一个位置、中间和最后一个位置,设计不同的罚分。
7、需要说明的是,本技术的关键在于将空位罚分规则引入引物二聚体的打分和预测,至于具体的罚分设计可以自行调整。
8、本技术的一种实现方式中,本技术的引物二聚体预测方法还包括根据引物二聚体中配对的各类型碱基对的稳定顺序构建替换计分矩阵,通过替换计分矩阵来获得不同的比对结果的步骤。
9、本技术的一种实现方式中,引物二聚体预测采用史密斯-沃特曼算法找出引物对的两个核酸序列间的相似区域,并根据空位罚分规则和替换计分矩阵,进而通过回溯算法,获得两个核酸序列的最佳比对形式,从而预测引物二聚体。
10、需要说明的是,本技术创造性地将史密斯-沃特曼算法用于引物二聚体预测,并针对引物二聚体中的空位出现在引物序列的第一个位置、中间、最后一个位置,和连续空位的位置,设计不同的空位罚分规则;同时,根据引物二聚体中配对的各类型碱基对的稳定顺序构建替换计分矩阵;通过回溯算法,预测可能性最高的、最佳引物二聚体结构;因此,能够极大的提高引物二聚体预测的准确性。
11、本技术的一种实现方式中,本技术的引物二聚体预测方法还包括获取引物二聚体中所有碱基对单位的标准焓变δh和标准熵变δs的步骤,以及获取引物二聚体δh和引物二聚体δs的步骤;其中,计算引物二聚体中所有碱基对单位的标准焓变δh之和,并将所有碱基对单位的标准焓变δh之和作为引物二聚体δh,如存在空位,则跳过该空位计算下一组碱基对单位的标准焓变δh;计算引物二聚体中所有碱基对单位的标准熵变δs之和,并将所有碱基对单位的标准熵变δs之和作为引物二聚体δs,如存在空位,则跳过该空位计算下一组碱基对单位的标准熵变δs;根据引物二聚体δh和引物二聚体δs,计算引物二聚体的解链温度tm值和吉布斯自由能变δg值,根据tm值和δg值筛选引物二聚体。
12、需要说明的是,本技术率先关注并提出空位对引物二聚体的影响,不仅利用空位罚分规则对引物二聚体的预测和打分进行改进;进一步的,还根据空位的情况,优化和改进tm值和δg值的计算方式,使其能够更准确的反映引物二聚体的真实情况,从而提高引物二聚体筛选的有效性和准确性,进一步的提高了引物二聚体筛选结果的准确性。可以理解,将空位罚分规则引入引物二聚体预测,以及tm值和δg值的改进算法,是本技术的两个关键改进技术点;原则上,其中任何一个改进点都能够提高引物二聚体预测结果的准确性。因此,不排除可以将两个改进技术点分别单独用于引物二聚体预测;当然,两者组合能够进一步的有效提高引物二聚体预测的准确性。
13、本技术的一种实现方式中,本技术的引物二聚体预测方法还包括采用schildkraut盐校正公式对引物二聚体δs进行校正,进而采用校正后的引物二聚体δs,计算引物二聚体的tm值和δg值。
14、本技术的一种实现方式中,碱基对单位的标准焓变δh和标准熵变δs从santalucia热力学参数表获取,并采用santalucia最近邻法计算引物二聚体的tm值和δg值。
15、本技术的一种实现方式中,本技术的引物二聚体预测方法还包括计算预测的引物二聚体中正确配对的数量,与错配的数量和空位数量之和之间的差值,作为引物二聚体得分;根据引物二聚体得分和错配的数量筛选引物二聚体。例如,将引物二聚体中正确配对的数量,减去错配的数量,再减去空位数量,将该差值作为引物二聚体得分。
16、需要说明的是,本技术的实施例中具体设置不同的指标截点(cutoff),比较引物二聚体的指标参数和截点参数的大小,过滤不符合截点要求的引物二聚体即过滤稳定性低的引物二聚体;例如,可以设置截点的指标包括:引物二聚体得分、错配的数量、tm值和δg值。这些截点最终的阈值设定需要根据自身实际情况进行调整,在此不作具体限定。
17、本技术的一种实现方式中,本技术的引物二聚体预测方法还包括从预测的引物二聚体中筛选其至少一条引物的3’末端可与其他引物形成配对,且不存在碱基错配的引物二聚体。
18、需要说明的是,本技术分析认为,只有当形成可延伸的引物二聚体时,才会导致循环过程中更容易出现退火错误,进而对pcr过程产生不良后果;而可延伸的引物二聚体必然是引物的3’末端与其他引物形成配对,这样才能够延伸。因此,本技术进一步的对3’末端可与其他引物形成配对的引物二聚体进行筛选,从而筛选获得真正对pcr过程具有不良后果的引物二聚体,提高了引物二聚体预测和筛选结果的有效性。
19、本技术的一种实现方式中,本技术的引物二聚体预测方法还包括获取筛选获得的引物二聚体的基础信息,该基础信息包括,两条引物的对齐方式,引物二聚体中配对的at碱基对的数量、cg碱基对的数量等。
20、本技术的第二方面公开了一种计算双链dna的解链温度tm值或吉布斯自由能变δg值的方法,该方法包括如下步骤:获取双链dna中所有碱基对单位的标准焓变δh和标准熵变δs的步骤,以及获取双链dna的δh和双链dna的δs的步骤;其中,计算双链dna中所有碱基对单位的标准焓变δh之和,将所有碱基对单位的标准焓变δh之和作为双链dna的δh,如存在空位,则跳过该空位计算下一组碱基对单位的标准焓变δh;计算双链dna片段中所有碱基对单位的标准熵变δs之和,将所有碱基对单位的标准熵变δs之和作为双链dna的δs,如存在空位,则跳过该空位计算下一组碱基对单位的标准熵变δs;根据双链dna的δh和双链dna的δs,计算双链dna的解链温度tm值或吉布斯自由能变δg值。
21、需要说明的是,本技术计算双链dna的解链温度tm值或吉布斯自由能变δg值的方法,实际上就是本技术的引物二聚体预测方法中,引物二聚体的解链温度tm值和吉布斯自由能变δg值的计算部分;只是本技术的tm值和δg值计算方式显然不仅限于对引物二聚体进行解链温度和吉布斯自由能变计算,同样适用于其他的双链dna的tm值和δg值。因此,本技术计算双链dna的解链温度tm值或吉布斯自由能变δg值的方法中,schildkraut盐校正双链dna的δs,从santalucia热力学参数表获取碱基对单位的标准焓变δh和标准熵变δs,以及用santalucia最近邻法计算tm值或δg值,都可以参考本技术的引物二聚体预测方法,在此不累述。
22、本技术的第三方面公开了一种预测引物二聚体的装置,该装置包括待预测引物输入模块、引物二聚体推断模块和引物二聚体筛选模块;
23、待预测引物输入模块,其用于输入需要预测引物二聚体的引物对;
24、引物二聚体推断模块,其用于引入空位罚分规则对引物二聚体进行打分和预测;
25、引物二聚体筛选模块,其用于计算引物二聚体的解链温度tm值和吉布斯自由能变δg值,根据tm值和δg值筛选引物二聚体。
26、本技术的一种实现方式中,引物二聚体推断模块,还用于根据引物二聚体中配对的各类型碱基对的稳定顺序构建替换计分矩阵,通过替换计分矩阵来获得不同的比对结果。
27、进一步的,引物二聚体推断模块采用史密斯-沃特曼算法找出引物对的两个核酸序列间的相似区域,并根据空位罚分规则和替换计分矩阵,进而通过回溯算法,获得两个核酸序列的最佳比对形式,从而预测引物二聚体。
28、本技术的一种实现方式中,引物二聚体筛选模块计算引物二聚体的解链温度tm值和吉布斯自由能变δg值,具体包括,获取引物二聚体中所有碱基对单位的标准焓变δh和标准熵变δs;计算引物二聚体中所有碱基对单位的标准焓变δh之和,并将所有碱基对单位的标准焓变δh之和作为引物二聚体δh,如存在空位,则跳过该空位计算下一组碱基对单位的标准焓变δh;计算引物二聚体中所有碱基对单位的标准熵变δs之和,将所有碱基对单位的标准熵变δs之和作为引物二聚体δs,如存在空位,则跳过该空位计算下一组碱基对单位的标准熵变δs;根据引物二聚体δh和引物二聚体δs,计算引物二聚体的解链温度tm值和吉布斯自由能变δg值。
29、本技术的一种实现方式中,引物二聚体筛选模块,还用于通过schildkraut盐校正公式对引物二聚体δs进行校正,进而采用校正后的引物二聚体δs,计算引物二聚体的tm值和δg值。
30、本技术的一种实现方式中,引物二聚体筛选模块,还用于计算预测的引物二聚体中正确配对的数量,与错配的数量和空位数量之和之间的差值,作为引物二聚体得分,根据引物二聚体得分和错配的数量筛选引物二聚体。
31、本技术的一种实现方式中,引物二聚体筛选模块,还用于从预测的引物二聚体中筛选其至少一条引物的3’末端可与其他引物形成配对,且不存在碱基错配的引物二聚体。
32、本技术的一种实现方式中,引物二聚体筛选模块,还用于获取筛选获得的引物二聚体的基础信息,该基础信息包括两条引物的对齐方式,引物二聚体中配对的at碱基对的数量、cg碱基对的数量。
33、本技术的一种实现方式中,待预测引物输入模块还包括,判断输入的引物对中是否存在简并碱基,对存在简并碱基的引物进行展开,将简并碱基引物还原为多条非简并碱基的引物。
34、需要说明的是,本技术预测引物二聚体的装置,实际上就是通过各模块实现本技术预测引物二聚体的方法的各个步骤,因此,本技术装置中各模块的具体实现方式或参数条件可以参考本技术的引物二聚体预测方法,例如空位罚分规则、标准焓变δh和标准熵变δs的获取、santalucia最近邻法计算tm值和δg值等都可以参考本技术的预测引物二聚体的方法,在此不累述。
35、本技术的第四方面公开了一种预测引物二聚体的装置,该装置包括存储器和处理器;存储器,包括用于存储程序;处理器,包括用于通过执行存储器存储的程序以实现本技术的预测引物二聚体的方法。
36、本技术的第五方面公开了一种计算机可读存储介质,该存储介质中包括程序,该程序能够被处理器执行以实现本技术的预测引物二聚体的方法。
37、由于采用以上技术方案,本技术的有益效果在于:
38、本技术预测引物二聚体的方法,率先将空位罚分规则用于引物二聚体的打分和预测,提高了引物二聚体预测的准确性。采用本技术的方法进行引物二聚体预测,能够减少多重pcr过程中引物二聚体的生成,从而减少引物的消耗,提高多重pcr过程的扩增效率。
1.一种预测引物二聚体的方法,其特征在于:所述方法包括在预测引物二聚体时,引入空位罚分规则对引物二聚体进行打分和预测的步骤。
2.根据权利要求1所述的方法,其特征在于:所述空位罚分规则包括分别对出现单个空位和连续空位的位置,设计不同的罚分;
3.根据权利要求1所述的方法,其特征在于:所述方法还包括根据引物二聚体中配对的各类型碱基对的稳定顺序构建替换计分矩阵,通过替换计分矩阵来获得不同的比对结果的步骤;
4.根据权利要求1-3任一项所述的方法,其特征在于:所述方法还包括获取引物二聚体中所有碱基对单位的标准焓变δh和标准熵变δs的步骤,以及获取引物二聚体δh和引物二聚体δs的步骤;其中,
5.根据权利要求4所述的方法,其特征在于:所述方法还包括计算预测的引物二聚体中正确配对的数量、错配的数量、空位的数量,根据以下公式计算引物二聚体得分,并根据所述引物二聚体得分和错配的数量筛选引物二聚体;
6.一种计算双链dna的解链温度tm值或吉布斯自由能变δg值的方法,其特征在于:所述方法包括如下步骤:
7.根据权利要求6所述的方法,其特征在于:所述方法还包括采用schildkraut盐校正公式对双链dna的δs进行校正,进而采用校正后的双链dna的δs,计算双链dna的所述tm值或所述δg值;
8.一种预测引物二聚体的装置,其特征在于:所述装置包括待预测引物输入模块、引物二聚体推断模块和引物二聚体筛选模块;
9.根据权利要求8所述的装置,其特征在于:所述空位罚分规则包括分别对出现单个空位和连续空位的位置,设计不同的罚分;
10.根据权利要求8所述的装置,其特征在于:所述引物二聚体筛选模块中,计算引物二聚体的解链温度tm值和吉布斯自由能变δg值,具体包括,获取引物二聚体中所有碱基对单位的标准焓变δh和标准熵变δs;计算引物二聚体中所有碱基对单位的标准焓变δh之和,将所有碱基对单位的标准焓变δh之和作为引物二聚体δh,如存在空位,则跳过该空位计算下一组碱基对单位的标准焓变δh;计算引物二聚体中所有碱基对单位的标准熵变δs之和,将所有碱基对单位的标准熵变δs之和作为引物二聚体δs,如存在空位,则跳过该空位计算下一组碱基对单位的标准熵变δs;根据所述引物二聚体δh和所述引物二聚体δs,计算引物二聚体的解链温度tm值和吉布斯自由能变δg值;
11.根据权利要求8-10任一项所述的装置,其特征在于:所述待预测引物输入模块,还包括判断输入的引物对中是否存在简并碱基,对存在简并碱基的引物进行展开,将简并碱基引物还原为多条非简并碱基的引物。
12.一种预测引物二聚体的装置,其特征在于:所述装置包括存储器和处理器;
13.一种计算机可读存储介质,其特征在于:所述存储介质中包括程序,所述程序能够被处理器执行以实现权利要求1-5任一项所述的方法。
