本发明涉及亲缘关系鉴定,特别是一种牛属动物群体亲缘关系重建方法。
背景技术:
1、随着近年来高通量测序技术的发展以及测序成本的降低,基因组数据的增长已呈现井喷之势,宣示着遗传育种已全面进入基因组时代。全基因组选择技术经过多年的推广实践,已成为动物育种的关键应用技术,该技术实现了基因组直接选择,并解除传统育种在肉质、繁殖、抗病等关键性状选择效果不佳的限制,为种畜的选种选育提供更高的预见性,提高种畜重要经济性状的生产水平。在家畜育种中,基因组选择凭借其准确性高、世代间隔短和育种成本低等优势被应用于各种经济动物的种畜选择中。全基因组选择是通过覆盖全基因组的分子标记获取遗传信息,以目标性状基因组育种值作为个体选择的依据的策略,该技术使遗传评定准确性得到明显的提升,有利于加快育种进展。尽管全基因组选择已经成为育种的主要方法,但是不可忽视的是,传统的数量遗传学方法根据表型、谱系信息对家畜的中高遗传力性状的选择非常有效。
2、在实际生产方面,养殖场在育种时除了需要利用测序技术获得基因组数据之外往往还需要对谱系信息进行同步记录。然而在诸多实际情况下无法记录到动物群体多年的系谱关系,比如有些动物养殖方式过于原始,或养殖过程无法精确确保个体的亲本关系,这就造成了系谱关系的缺失。
技术实现思路
1、为了解决上述技术问题,本发明提供了一种牛属动物群体亲缘关系重建方法。
2、为达到上述目的,本发明是按照以下技术方案实施的:
3、一种牛属动物群体亲缘关系重建方法,包括以下步骤:
4、s1、获取牛基因型数据,并将牛基因型数据转变为0,1,2型的snp文件;
5、s2、对snp文件中的每一个个体进行两两配对,对于已配对的个体,假定他们可能具有亲子关系、全同胞关系、半同胞关系或者没有亲缘关系;并通过sequoia软件计算配对个体之间的亲子关系、全同胞关系、半同胞关系的似然值log10对数,取最大值为配对个体之间的亲缘关系;去掉无亲缘关系行,最后通过亲缘关系还原系谱;
6、s3、区分个体在系谱中所在的代数并找到新生代个体,通过新生代个体以一个个体只有一父一母的原理来还原系谱,并输出结果。
7、进一步地,所述步骤s1中,将主等位基因的纯合子转化为0,将杂合子转化为1,将次等位基因纯合转化为2。
8、进一步地,所述步骤s2中:
9、(1)亲子关系的可能性计算公式为:
10、
11、pp(sa=z)pm(b=ydb=v,sb=w)pp(db=v)pp(sb=w)
12、pme(a=xb=y,sa=z)=pe(a=xa=x,e)pm(a=xb=y,sa=z)(2)
13、式(2)中pme是pe和pm合并的简写;pe是a(b)的实际基因型x(y)和基因分型错误率e的函数,即当a(b)的父母为b(db)和sa(sb)时理论基因型为x(y)但实际基因型为x(y)的概率;pm是个体a(b)从其父母b(db),sa(sb)的基因型分别为y和z时的概率函数;继承实际基因型x的概率;式(1)中pp为亲本基因型概率项;
14、(2)同胞关系的可能性计算公式为:
15、
16、式(3)中前两项利用了式(2)中的简写pme;式(3)中dab,sab是个体a和个体b共同的父母亲,pe是a的实际基因型x和基因分型错误率e的函数,即当a(b)的父母为dab和sab时理论基因型为x(y)但实际基因型为x(y)的概率;pm是个体a(b)从其父母dab,sab的基因型分别为u和z时的概率函数;继承实际基因型x(y)的概率,pp为亲本基因型概率项;
17、(3)半同胞关系的可能性计算公式为:
18、
19、式(4)中前两项利用了eqn2中的简写pme;式(4)中dab是个体a和个体b共同的父亲,pe是a的实际基因型x和基因分型错误率e的函数,即当a(b)的父母为dab(dab)和sa(sb)时理论基因型为x(y)但实际基因型为x(y)的概率;pm是个体a(b)从其父母dab(dab),sa(sb)的基因型分别为u(u)和在z(w)时的概率函数;继承实际基因型x(y)的概率,pp为亲本基因型概率项。
20、进一步地,所述步骤s3具体包括:
21、s31、统计谱系中所有个体的公、母数量、产子数和系谱最大有多少代数;
22、s32、通过谱系数据计算出每个个体的近交系数;
23、s43、将系谱文件导入到cytoscape软件中后生成的亲子关系网络图。
24、与现有技术相比,本发明利用基因型文件转变为0,1,2型的文件进行亲缘关系分析,通过亲缘关系可以准确还原出谱系,找出个体的父本和母本,尤其是对于牛这种大多没有记录谱系关系的养殖家畜,亦或者是对于猪这种有明确记录谱系的家畜,能利用基因型数据还原谱系对人工记录的谱系数据缺失、错误进行填补和更正。同时还能对谱系进行统计分析和通过谱系与基因型两种不同的方法计算近交系数,并能生成表格文件或者谱系图储存在电脑硬盘中,并能利用已有谱系进行统计分析得出群体中的公母数、产子数、代数等;为后续家畜养殖中的育种选种作为一个参考。
1.一种牛属动物群体亲缘关系重建方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的牛属动物群体亲缘关系重建方法,其特征在于,所述步骤s1中,将主等位基因的纯合子转化为0,将杂合子转化为1,将次等位基因纯合转化为2。
3.根据权利要求1所述的牛属动物群体亲缘关系重建方法,其特征在于,所述步骤s2中:
4.根据权利要求1-3任一所述的牛属动物群体亲缘关系重建方法,其特征在于,所述步骤s3具体包括: