一种鸡线粒体基因组高通量测序及其结构特征分析的方法与流程

专利2022-05-09  96



1.本发明涉及家禽生物技术领域,更具体地说,特别涉及一种鸡线粒体基因组高通量测序及其结构特征分析的方法。


背景技术:

2.动物遗传资源多样性能够为品种改良提供素材,并且能够很好适应环境的变化。我国有丰富家禽地方品种资源,研究和评估我国家禽地方品种的遗传多样性,制定合理的利用和保护措施对我国畜牧业的可持续发展具有重要意义。研究动物遗传多样性的方法主要有微卫星和线粒体dna等,两种方法各有优缺点,线粒体dna更容易操作。畜(禽)品种大都受到外来公畜(禽)杂交改良的影响,群体数量减少甚至消失,给研究品种起源和多样性带来很大困难。线粒体dna在遗传过程中,遗传物质通过卵细胞质传递,较少发生dna重组,其野生祖先的线粒体dna类型一般能得以保持。这种遗传方式,一个个体就能代表一个母性集团,因此只需少量个体样本便能反映一个群体的遗传结构。研究者可以从复杂的遗传背景中分辨不连续的母系血统,即使经过几千年的杂交繁育,系统关系依然明晰。
3.鸡线粒体基因组一般在16785bp左右,为闭合环状双链结构,能够自主复制和转录。包括37个基因的编码编码区(13个蛋白质编码基因、2个核糖体rna基因、22个转运rna基因)和1个控制区(d

loop)。国内外虽然已经有人用d

loop区进行鸡遗传多样性和亲缘进化的研究,但全序列包含的遗传信息更为丰富。
4.因此对鸡的线粒体dna进行准确测定以准确定位其分类是很有必要的。为此,开发一种快速且准确性高的测序及其结构特征分析的方法也是很有必要的。


技术实现要素:

5.本发明的目的在于提供一种鸡线粒体基因组高通量测序及其结构特征分析的方法。
6.为了达到上述目的,本发明采用的技术方案如下:一种鸡线粒体基因组高通量测序及其结构特征分析的方法,该方法基于高通量测序,包括以下步骤:
7.(1)提取所述鸡血液中的全基因组dna,构建基因文库,利用第二代测序技术进行测序;
8.(2)通过参考近缘物种线粒体全基因组序列对高质量的测序读段进行筛选,除去核dna片段,然后进行线粒体基因组的拼接,选取最优的拼接结果,再对拼接好的线粒体基因组的编码蛋白基因、rrna和trna进行预测注释;
9.(3)样品基因组dna检测合格后,用物理方法(超声波)将dna打断,然后对打断后的dna进行纯化构建测序文库,步骤依次为:dna末端修复,3’端加a,连接测序接头,琼脂糖凝胶电泳法回收目的片段,对目的片段进行pcr扩增,最终建成文库,然后使用illumina novaseq对这个文库进行双末端测序。
10.优选地,所述全基因组dna提取步骤为:
11.a、取200μl抗凝全血,加200μl缓冲液gb和蛋白酶k,混匀,56℃水浴10分钟;上下翻动10分钟。
12.b、室温放置2

5分钟后加入350μl缓冲液bd,充分混匀;
13.c、过吸附柱,12000rpm离心30秒,弃滤液;
14.d、加入500μl缓冲液gdb,12000rpm离心30秒,弃滤液,重复洗涤一次;
15.e、12000rpm离心2分钟,弃废液,吸附柱室温静置2分钟;
16.f、加入50

200μl洗脱液,室温静置2分钟,12000rpm离心2分钟,将dna洗脱下来;
17.g、获得鸡基因组dna,

20℃保存备用。
18.优选地,步骤(1)中提取所述鸡血液的全基因组dna提取使用的是苯酚/氯仿法。
19.优选地,步骤(2)中所述近缘物种是红色原鸡(gallus gallus)
20.优选地,步骤(2)中线粒体基因组的拼接是利用spades(version:3.10.1;参数:k127)软件。
21.优选地,步骤(2)中对线粒体基因组的编码蛋白基因、rrna和trna进行预测注释别用是mitoz软件。
22.优选地,步骤(2)中对线粒体基因组组成,相对同义密码子使用的分析是利用mega7软件,trna

se和ogdraw。
23.优选地,步骤(2)中对线粒体基因组图谱的绘制是利用ogdraw软件。
24.优选地,步骤(2)中对线粒体基因组trna的二级结构预测是利用trna

se软件。
25.优选地,该dna序列如序列文件所示。
26.与现有技术相比,本发明的优点在于:
27.本发明的方法利用第二代测序技术的优点,克服了第一代测序技术的工作量大、成本高、耗时长等缺陷;
28.本发明的方法利用最新的生物信息技术精确的分析了鸡的线粒体基因组的组成和结构,为对基因组的更深入的研究提供了方法;
29.本发明的鸡线粒体全基因组dna的序列准确性高,为鸡进行准确的系统发育分析奠定了基础;
30.相较于第一代测序,本发明的测定鸡线粒体全基因组序列的方法省去了大量的人力资源和物力资源,并且也节省了大量的时间。
附图说明
31.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
32.图1是本发明的鸡线粒体基因组dna环状图。
33.图2是本发明的鸡线粒体基因组的trna的二级结构。
34.图3是本发明的鸡线粒体基因组的相对同义密码子的使用情况。
具体实施方式
35.本申请发明人在获得该dna序列过程中,首先利用第二代测序技术对构建的鸡全基因组dna的基因文库进行测序,然后通过参考近缘物种线粒体全基因组序列对高质量的测序读段进行筛选,除去核dna片段后进行线粒体基因组的拼接,选取最优的拼接结果,再对拼接好的线粒体基因组的编码蛋白基因、rrna和trna进行预测注释。本发明的方法可快速、准确地获得鸡线粒体基因组序列,为准确定位其生物学分类奠定了基础。下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
36.鸡线粒体全基因组dna的序列如以下序列文件所示:
37.38.39.40.41.42.43.44.45.[0046][0047]
下面结合具体实施例,进一步阐述本发明。具体实施例是在以本发明技术方案为前提下进行实施的,给出了详细的实施方式和操作过程。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件进行。除非另有说明,百分比和份数按重量计。
[0048]
本实施例所使用的鸡样品采自安徽省淮北麻鸡保种场。静脉采血,edta抗凝,并保存于

20℃的冰箱中待用。
[0049]
一种鸡线粒体全基因组测序的方法,包括以下步骤:
[0050]
1.1、血液dna提取
[0051]
a、取200μl抗凝全血,加200μl缓冲液gb和蛋白酶k,混匀,56℃水浴10分钟;上下翻动10分钟。
[0052]
b、室温放置2

5分钟后加入350μl缓冲液bd,充分混匀;
[0053]
c、过吸附柱,12000rpm离心30秒,弃滤液;
[0054]
d、加入500μl缓冲液gdb,12000rpm离心30秒,弃滤液,重复洗涤一次;
[0055]
e、12000rpm离心2分钟,弃废液,吸附柱室温静置2分钟;
[0056]
f、加入50

200μl洗脱液,室温静置2分钟,12000rpm离心2分钟,将dna洗脱下来;
[0057]
获得鸡基因组dna,

20℃保存备用。
[0058]
1.2、dna的质量检测:按照1.1的方法从血液中提取dna,取2μl dna样本在紫外分光光度计q5000(美国quawell公司)上进行浓度测定。测得dna浓度要求od260/od280比值在
1.8~2.0之间,od260/od230比值在1.8~2.2之间,以上两个比值可以判断所提取dna纯度的优劣。如果超出上述范围,则可认为提取dna纯度不符合要求,需要重新提取或再纯化。将质量检测合格的dna样本根据测定的浓度,用dna溶解缓冲液进一步稀释到浓度50ng/μl,备用。
[0059]
1.3、基因文库构建,高通量测序:样品基因组dna检测合格后,用物理方法(超声波)将dna打断,然后对打断后的dna进行纯化构建测序文库,步骤依次为:dna末端修复,3’端加a,连接测序接头,琼脂糖凝胶电泳法回收目的片段,对目的片段进行pcr扩增,最终建成1个350bp的文库,然后使用illumina novaseq对这个文库进行双末端测序,reads长度为150bp。
[0060]
1.4、原始测序数据质量控制:
[0061]
由于原始测序数据可能包含低质量序列、接头序列等,为了保证信息分析结果的可靠性,原始测序数据需要经过过滤,从而得到clean reads。本案例使用过滤软件为fastp,过滤标准如下:
[0062]
1.4.1、去除n碱基含量超过5%的reads;
[0063]
1.4.2、去除低质量(质量值小于等于10)碱基数目达到20%的reads;
[0064]
1.4.3、去除有adapter污染的reads;
[0065]
1.4.4、去除重复的pcr引入的重复reads。
[0066]
1.5、线粒体基因组组装及注释
[0067]
1.5.1、将原始测序数据与近缘线粒体基因组(gu261704)进行进行bowtie比对,保留比对上的reads,再使用spades(version:3.10.1;参数:k 127)软件,进行基因组拼接,检测是否成环。线粒体基因组功能注释包括编码基因预测和非编码rna注释(rrna和trna注释)。我们利用专们针对线粒体基因组的注释软件mitoz进行基因结构注释。表1为我们对线粒体基因组的注释结果。
[0068]
1.5.2、利用ogdraw绘制线粒体基因组的图谱,见图1。
[0069]
1.5.3、利用trnascan

se软件确定trnas的位置,预测trnas的二级结构。图2为预测的鸡线粒体基因组trna的二级结构。
[0070]
1.6、基因组分析
[0071]
1.6.1、使用mega7.0分析核苷酸相对同义密码子使用值,见图3。
[0072]
1.6.2、使用mega7.0分析碱基组成,并且使用以下公式进行组成偏态分析:at

skew=[a

t]/[a t];gc

skew=[g

c]/[g c],见表2。
[0073]
本发明所测线粒体基因组已上传至genbank数据库,登录号为mt773644。结果表明,鸡粒体基因组序列全长为16786bp,碱基组成分别为a(30.3%)、g(23.8%)、c(13.5%)和t(32.4%),共有13个蛋白编码基因,22个trna基因,2个rrna基因,nd6、trna

gln、rna

ala、rna

asn、rna

cys、rna

tyr、trna

ser、rna

pro、na

glu等基因编码在l链上,其余基因均在h链上编码。
[0074]
鸡线粒体基因组全序列与蛋白编码基因的a t含量分别为60.1%和54.1%,具有明显的at偏好性。线粒体基因中存在2个散在重复序列,分别位于线粒体控制区中终止结合序列区的前端和控制区3'的末端,在22个trna基因中,除了trna

ser(gct)外,均具有典型的三叶草二级结构。
[0075]
本发明的方法还适用于科研和生产单位使用,可快速且准确的测出鸡的线粒体全基因组序列,这有利于鸡遗传资源的保护、开发和利用。
[0076]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
[0077]
表1鸡线粒体基因组的组成和结构
[0078]
[0079]
表2鸡线粒体基因组的核酸组成及偏态
[0080]

技术特征:
1.一种鸡线粒体基因组高通量测序及其结构特征分析的方法,其特征在于,该方法基于高通量测序,包括以下步骤:(1)提取所述鸡血液中的全基因组dna,构建基因文库,利用第二代测序技术进行测序;(2)通过参考近缘物种线粒体全基因组序列对高质量的测序读段进行筛选,除去核dna片段,然后进行线粒体基因组的拼接,选取最优的拼接结果,再对拼接好的线粒体基因组的编码蛋白基因、rrna和trna进行预测注释;(3)样品基因组dna检测合格后,用物理方法(超声波)将dna打断,然后对打断后的dna进行纯化构建测序文库,步骤依次为:dna末端修复,3’端加a,连接测序接头,琼脂糖凝胶电泳法回收目的片段,对目的片段进行pcr扩增,最终建成文库,然后使用illumina novaseq对这个文库进行双末端测序。2.根据权利要求1所述的一种鸡线粒体基因组高通量测序及其结构特征分析的方法,其特征在于,所述全基因组dna提取步骤为:a、取200μl抗凝全血,加200μl缓冲液gb和蛋白酶k,混匀,56℃水浴10分钟;上下翻动10分钟;b、室温放置2

5分钟后加入350μl缓冲液bd,充分混匀;c、过吸附柱,12000rpm离心30秒,弃滤液;d、加入500μl缓冲液gdb,12000rpm离心30秒,弃滤液,重复洗涤一次;e、12000rpm离心2分钟,弃废液,吸附柱室温静置2分钟;f、加入50

200μl洗脱液,室温静置2分钟,12000rpm离心2分钟,将dna洗脱下来;g、获得鸡基因组dna,

20℃保存备用。3.根据权利要求1所述的一种鸡线粒体基因组高通量测序及其结构特征分析的方法,其特征在于,步骤(1)中提取所述鸡血液的全基因组dna使用的是苯酚/氯仿法。4.根据权利要求1所述的一种鸡线粒体基因组高通量测序及其结构特征分析的方法,其特征在于,步骤(2)中所述近缘物种是红色原鸡。5.根据权利要求1所述的一种鸡线粒体基因组高通量测序及其结构特征分析的方法,其特征在于,步骤(2)中线粒体基因组的拼接是利用spades(version:3.10.1;参数:k 127)软件。6.根据权利要求1所述的一种鸡线粒体基因组高通量测序及其结构特征分析的方法,其特征在于,步骤(2)中对线粒体基因组的编码蛋白基因、rrna和trna进行预测注释别用是mitoz软件。7.根据权利要求1所述的一种鸡线粒体基因组高通量测序及其结构特征分析的方法,其特征在于,步骤(2)中对线粒体基因组组成,相对同义密码子使用的分析是利用mega7软件,trna

se和ogdraw。8.根据权利要求1所述的一种鸡线粒体基因组高通量测序及其结构特征分析的方法,其特征在于,步骤(2)中对线粒体基因组图谱的绘制是利用ogdraw软件。9.根据权利要求1所述的一种鸡线粒体基因组高通量测序及其结构特征分析的方法,其特征在于,步骤(2)中对线粒体基因组trna的二级结构预测是利用trna

se软件。10.一种鸡线粒体全基因组dna序列,其特征在于,该dna序列如序列文件所示。
技术总结
本发明公开了一种鸡线粒体基因组高通量测序及其结构特征分析的方法,该方法基于高通量测序,包括以下步骤(1)提取所述鸡血液中的全基因组DNA,构建基因文库,利用第二代测序技术进行测序;(2)通过参考近缘物种线粒体全基因组序列对高质量的测序读段进行筛选,除去核DNA片段,然后进行线粒体基因组的拼接,选取最优的拼接结果,再对拼接好的线粒体基因组的编码蛋白基因、rRNA和tRNA进行预测注释;(3)对目的片段进行PCR扩增,最终建成文库,然后使用Illumina NovaSeq对这个文库进行双末端测序。相较于第一代测序,本发明的测定鸡线粒体全基因组序列的方法省去了大量的人力资源和物力资源,并且也节省了大量的时间。并且也节省了大量的时间。并且也节省了大量的时间。


技术研发人员:金四华 邱桂如 臧贺 税斐 郭立平 耿照玉 江洪峰 郑书丽 贾羽晴 夏晶晶
受保护的技术使用者:安徽农业大学
技术研发日:2021.03.25
技术公布日:2021/6/29

转载请注明原文地址:https://doc.8miu.com/read-9046.html

最新回复(0)