本发明涉及分子诊断领域,特别是涉及基于基因组变异与异常表达结合的甲状腺结节良恶性辅助诊断系统。
背景技术:
1、甲状腺癌作为内分泌系统中较为常见的一种恶性肿瘤,其典型表现包括不伴随疼痛的甲状腺肿块,这些肿块可能是甲状腺细胞的过度增生或者是含有液体的囊肿所造成。根据病理学分类,甲状腺癌可分为乳头状、滤泡状、未分化和髓样四种主要类型,其中乳头状和滤泡状癌被归为分化型甲状腺癌,它们共占了甲状腺癌总数的90%以上。虽然细针穿刺细胞学检查被视为判断甲状腺肿块良性或恶性的标准程序,但由于良、恶性肿块在细胞学上的特征往往存在重叠,大约15%到25%的案例通过此方法无法得出明确诊断,使得这部分病例的临床处理变得较为困难,有时会导致不必要的过度诊断和治疗。
2、在无法通过常规方法确诊的情况下,nccn、ata、ace等权威指南推荐使用分子标志物检测作为辅助手段。国内的指南和专家共识也支持结合细针穿刺和分子标志物检测以提升术前诊断的精确度。在这一背景下,基因表达谱检测在甲状腺癌的辅助诊断中扮演了愈发关键的角色,不仅能够提高诊断的精准度,还能帮助制定更为合适的治疗和随访计划,从而避免不必要的诊疗风险。基因检测对于区分甲状腺肿块的性质、甲状腺癌的不同病理类型,乃至于对预后的评估和靶向治疗策略的制定都具有极其重要的价值。为了进一步提升诊断工具的性能,不仅需要引入新发现的甲状腺癌相关分子标志物,还需持续评估和完善检测新标志物的技术,例如基因组内的驱动突变或基因融合事件等。
技术实现思路
1、鉴于以上所述现有技术的缺点,本发明的目的在于提供基于基因组变异与异常表达结合的甲状腺结节良恶性辅助诊断系统,用于解决现有技术的问题。本发明在基因组变异检测的基础上,结合了结节组织转录表达标志物的检测,并提供一套量化的、可拓展性极强、可量化描述的良恶性分析方法,在临床实践中具有重要的应用价值。
2、为实现上述目的及其他相关目的,本申请第一方面提供一种基于基因组变异与异常表达结合的甲状腺结节良恶性辅助诊断系统,包括以下模块:
3、dna数据模块:用于获取各样本的dna进行分管叠瓦式多重扩增构建的测序文库的数据;
4、rna数据模块:用于获取各样本的rna进行逆转录后多重扩增构建的测序文库的数据及各样本的目标基因组的ra表达水平数据:其中,所述目标基因组包括:14个特征基因以及7个内参基因;14个特征基因分别为aggf1,banp,cdk12,cited1,dicer1,erbb3,erbb4,fgfr2,fgfr4,igf2bp3,kit,met,vhl,zbtb8a;
5、第一分析模块:用于对dna数据模块和ra数据模块中得到的测序文库的数据进行生物信息分析,并结合体细胞变异解读指南获得各样本的甲状腺结节良恶性判断结果;
6、第二分析模块:用于基于各样本的目标基因组的rna表达水平数据进行处理分析,并基于构建的甲状腺结节良恶性预测模型对各样本进行甲状腺结节良恶性预测获得对应样本的甲状腺结节良恶性预测结果;
7、判断模块:用于基于各样本的甲状腺结节良恶性判断结果以及甲状腺结节良恶性预测结果判断各样本的最终甲状腺结节良恶性判断结果。
8、本申请第二方面提供一种非疾病诊断目的的用于甲状腺结节良恶性辅助诊断的方法,包括以下步骤:
9、1)获取各样本的dna进行分管叠瓦式多重扩增构建的测序文库的数据;
10、2)获取各样本的rna进行逆转录后多重扩增构建的测序文库数据及各样本的目标基因组的ra表达水平数据;其中,所述目标基因组包括:14个特征基因以及7个内参基因;14个特征基因分别为aggf1,banp,cdk12,cited1,dicer1,erbb3,erbb4,fgfr2,fgfr4,igf2bp3,kt,met,vhl,zbtb8a;
11、3)将步骤1)和步骤2)的测序文库的数据进行生物信息分析,结合体细胞变异解读指南得到甲状腺结节良恶性判断结果;
12、4)将步骤2)中的目标基因组的rna表达水平数据进行处理分析,并基于构建的甲状腺结节良恶性预测模型获得甲状腺结节良恶性预测结果;
13、5)基于步骤3)的甲状腺结节良恶性判断结果和步骤4)的甲状腺结节良恶性预测结果,获得最终甲状腺结节良恶性判断结果。
14、本申请第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述的方法中步骤3)~步骤5)的分析步骤。
15、本申请第四方面提供一种终端,其特征在于,包括:处理器及存储器;
16、所述存储器用于存储计算机程序;
17、所述处理器用于执行所述存储器存储的计算机程序,以使所述设备执行前述的方法中步骤3)~步骤5)的分析步骤。
18、与现有技术相比,本申请具有以下有益效果:
19、本发明在基因组变异检测的基础上,结合了结节组织转录表达标志物的检测,并提供一套量化的、可拓展性极强、可量化描述的良恶性分析方法,在临床实践中具有重要的应用价值。
1.一种基于基因组变异与异常表达结合的甲状腺结节良恶性辅助诊断系统,包括以下模块:dna数据模块:用于获取各样本的dna进行分管叠瓦式多重扩增构建的测序文库的数据;
2.如权利要求1所述的系统,其特征在于,所述样本选自甲状腺结节新鲜组织样本、穿刺活检细胞样本或石蜡包埋的固定组织样本。
3.如权利要求1所述的系统,其特征在于,dna数据模块中,dna来自akt1、alk、apc、atm、banp、braf、cdk12、cdkn2a、chek2、ctnnb1、dicer1、egfr、eif1ax、ep300、erbb4、ezh1、fam193a、farsb、fgfr1、fgfr2、fgfr3、fgfr4、flt3、glis3、gnaq、gnas、hras、idh1、idh2、kit、klk1、kmt2c、kmt2d、kras、lrp1b、men1、met、mtor、ncor2、nf1、nf2、notch1、nras、ntrk1、ntrk3、pik3ca、plekhs1、por、pparg、pten、pth、rb1、rbm10、ret、ros1、smad4、spop、stk11、sugct、tp53、trim61、tsc2、tshr、vhl、znf148和tert基因。
4.如权利要求1所述的系统,其特征在于,rna数据模块中,rna来自融合基因;所述融合基因为第一基因断点的上游区段和第二基因断点的下游区段融合形成;
5.如权利要求1所述的系统,其特征在于,dna数据模块中,分管叠瓦式多重扩增的覆盖范围为dna基因的全部外显子区域、及向外拓展的20个碱基的区域。
6.如权利要求5所述的系统,其特征在于,dna数据模块中,当dna检测对象为tert基因时,分管叠瓦式多重扩增的覆盖范围还包含其启动子区域。
7.如权利要求4所述的系统,其特征在于,rna数据模块中,逆转录扩增的范围是融合基因的表达转录本。
8.如权利要求1所述的系统,其特征在于,dna数据模块或rna数据模块中,扩增所用的引物采用ngs-primerplex软件设计获得;
9.如权利要求8所述的系统,其特征在于,所述引物特征数据包括引物长度与gc含量、扩增区域长度与gc含量、5'端与3'端δg、基因组其它区域相似度中的一种或多种的组合;和/或,index选自单端index、双端index;优选地,所述index为udi;可选地,所述index还包括umi;
10.如权利要求1所述的系统,其特征在于,第二分析模块中,对dna数据模块和rna数据模块中得到的测序文库的数据进行生物信息分析的方式包括:
11.如权利要求10所述的系统,其特征在于,结合体细胞变异解读指南获得甲状腺结节良恶性判断结果包括:
12.如权利要求11所述的系统,其特征在于,若样本的检出位点对应包含braf v600e、tert启动子变异以及ret融合基因三种变异类型中的一种或多种,则基于体细胞变异解读指南解读为致病性。
13.如权利要求1所述的系统,其特征在于,所述内参基因从tcga数据库中甲癌患者的癌组织和癌旁组织表达谱数据中选取;7个内参基因为slc5a5,b2m,ppih,hprt1,nono,pum1,sdha。
14.如权利要求1所述的系统,其特征在于,第二分析模块中,构建甲状腺结节良恶性预测模型的方式包括:
15.如权利要求14所述的系统,其特征在于,基于各训练样本的处理分析结果计算各特征基因的正态分布包括:
16.如权利要求15所述的系统,其特征在于,基于各样本的目标基因组的rna表达水平数据进行处理分析包括:
17.如权利要求16所述的系统,其特征在于,对各样本进行甲状腺结节良恶性预测的方式包括:
18.如权利要求17所述的系统,其特征在于,基于各特征基因的正态分布,根据计算的各特征基因的log2 fold change值获得各样本的各特征基因的基因表达变异结果的方式包括:
19.如权利要求1所述的系统,其特征在于,基于各样本的甲状腺结节良恶性判断结果以及甲状腺结节良恶性预测结果判断各样本的最终甲状腺结节良恶性判断结果的方式包括:
20.一种非疾病诊断目的的用于甲状腺结节良恶性辅助诊断的方法,包括以下步骤:
21.如权利要求20所述的方法,其特征在于,
22.如权利要求20所述的方法,其特征在于,步骤3)中,所述体细胞变异解读指南选自美国amp/asco/cap组织制定的体细胞变异解读指南;优选地,若样本的检出位点对应包含braf v600e、tert启动子变异以及ret融合基因三种变异类型中的一种或多种,则基于体细胞变异解读指南解读为致病性;
23.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求20~22任一项所述的方法中步骤3)~步骤5)的分析步骤。
24.一种终端,其特征在于,包括:处理器及存储器;