本公开属于分子生物学和生物工程领域,具体涉及一种具有天冬氨酸激酶活性的多肽、重组多肽、编码多肽或重组多肽的多核苷酸、核酸构建体、重组表达载体、重组宿主细胞,以及生产氨基酸的方法。
背景技术:
:赖氨酸(lysine)的化学名称是2,6-二氨基庚二酸,是动物和人体必需氨基酸,能促进人体发育、增强免疫能力,并有提高中枢神经组织功能的作用。赖氨酸有l-型(左旋)、d-型(右旋)和dl型(消旋型)三种化学旋光异构体,其中只有l型才能为生物所利用,通常所说的赖氨酸即为l-赖氨酸。赖氨酸在人类主食谷物食品中的含量较低,缺乏会引起蛋白质代谢及功能障碍,对生长造成不利影响,并且在加工过程中容易被破坏,故被称为第一限制性氨基酸,在医药、健康、食品、动物饲料和化妆品等行业中有着十分重要的地位。目前为止,工业上生产赖氨酸的方法主要有三种:蛋白水解法、化学合成法和微生物发酵法。其中微生物发酵法具有生产成本低、生产强度高、高特异性和对环境污染小等优点而成为当今工业生产赖氨酸应用最广泛的方法。棒状细菌和埃希氏菌在赖氨酸的工业化生产中获得了广泛应用,常用的埃希氏菌如大肠杆菌(escherichiacoli),常用的棒状细菌有棒状杆菌属的谷氨酸棒杆菌(corynebacteriumglutamicum),短杆菌属的黄色短杆菌(brevibacteriumflavum)、乳酸发酵短杆菌(brevibacteriumlactofermentus),以及节杆菌属的某些种和微杆菌属的某些种。而由于谷氨酸棒杆菌的生理优越性,谷氨酸棒杆菌已成为工业中最重要的生产菌株。谷氨酸棒杆菌中同时存在脱氢酶途径和琥珀酰化酶途径两种赖氨酸的生物合成途径。其中,谷氨酸棒杆菌利用脱氢酶途径合成赖氨酸有6个酶催化反应,分别是天冬氨酸激酶(ak,由基因lysc编码)、天冬氨酸半醛脱氢酶(asadh,由基因asd编码)、二氢吡啶二羧酸合酶(dhdps,由基因dapa编码)、二氢吡啶二羧酸还原酶(dhdpr,由基因dapb编码)、二氨基庚二酸脱氢酶(dapdh,由基因ddh编码)和二氨基庚二酸脱羧酶(dapdc,由基因lysa编码)。谷氨酸棒杆菌利用琥珀酰化酶途径合成赖氨酸的过程中还涉及合成内消旋二氨基庚二酸的四种酶:琥珀酰二氨基庚二酸氨基转移酶(由基因dapd编码),四氢吡啶二羧酸酯琥珀酰酶(由基因dapc编码),琥珀酰二氨基庚二酸脱酰基酶(由基因dape编码)及二氨基庚二酸差向异构酶(由基因dapf编码)。其中,天冬氨酸激酶催化l-天冬氨酸生成天冬氨酸磷酸,是谷氨酸棒杆菌中l-天冬氨酸生物合成途径的第一步,也是赖氨酸生产的限速步骤,天冬氨酸激酶的活性受赖氨酸的反馈抑制[1]。因此,如何解除赖氨酸生物合成途径中赖氨酸对天冬氨酸激酶的反馈抑制,对于选育赖氨酸的高产菌株具有重要意义。引用文献1公开了一种对赖氨酸抑制不敏感的天冬氨酸激酶的突变体,其对分离于大肠杆菌中的天冬氨酸激酶iii(aspartatekinaseiii,akiii)的编码基因进行随机突变,筛选得到了两种解除反馈抑制的akiii突变体,分别是将352位苏氨酸用异亮氨酸替换(t352i)和318位甲硫氨酸用异亮氨酸替换(m318i)。虽然两种akiii突变体可以解除赖氨酸对天冬氨酸激酶的反馈抑制,但其应用于赖氨酸生产的效率不高,无法获得赖氨酸产量显著提升的赖氨酸高产菌株。引用文献2公开了谷氨酸棒杆菌来源的天冬氨酸激酶突变体,包括279t,a279v,s301f,t308i,s301y,g345d,r320g,t311i和s381f。上述的akiii突变体虽然可解除赖氨酸对天冬氨酸激酶的反馈抑制,但应用于赖氨酸生产的效率差别较大,其中t311i是目前所有文献报道的应用于赖氨酸生产效果最好的突变体,可显著提升菌株的赖氨酸产量。能否获得解除赖氨酸反馈抑制且赖氨酸生产效果更高的天冬氨酸激酶突变体是本领域技术人员急需解决的问题。引用文献:引用文献1:ep1394257引用文献2:ep1590463a2技术实现要素:发明要解决的问题鉴于现有技术中存在的问题,例如,天冬氨酸激酶的突变体无法稳定、高效生产赖氨酸的缺陷。为此,本公开提供了一种具有天冬氨酸激酶活性的多肽,是野生型天冬氨酸激酶的突变体。与野生型的天冬氨酸激酶相比,本公开的突变体解除了赖氨酸对天冬氨基酸激酶的反馈抑制,具有高的天冬氨酸激酶活性,能够稳定、高效地生产赖氨酸。用于解决问题的方案(1)一种多肽,所述多肽具有天冬氨酸激酶活性,其中,所述多肽选自如下(i)-(iv)组成的组中的任一项:(i)具有如seqidno:1所示序列的多肽的突变体,所述突变体和seqidno:1所示的序列相比,在对应于seqidno:1所示序列的至少第293、294和307位中的一个或多个位置处包含突变;(ii)与(i)所示序列具有至少70%、至少80%或至少90%的序列同一性,且不包括seqidno:1所示序列的多肽;(iii)由多核苷酸编码的多肽,所述多核苷酸在非常高严格条件下与(a)或(b)所示的多核苷酸杂交:(a)编码如(i)所示氨基酸序列的多肽的多核苷酸;(b)(a)的全长互补多核苷酸;(iv)由(i)、(ii)、(iii)所示的多肽的片段,并且所述片段仍然具有天冬氨酸激酶活性。(2)根据(1)所述的多肽,其中,所述多肽为包含如下(c)-(e)中至少一组所示的突变的多肽:(c)对应seqidno:1所示序列的第293位的氨基酸由异亮氨酸(i)突变为丝氨酸(s)、甘氨酸(g)、谷氨酸(e)、脯氨酸(p)、色氨酸(w)、酪氨酸(y)、组氨酸(h)、蛋氨酸(m)、谷氨酰胺(q)、半胱氨酸(c)或精氨酸(r);(d)对应seqidno:1所示序列的第294位的氨基酸由天冬氨酸(d)突变为酪氨酸(y)、色氨酸(w)或苯丙氨酸(f);(e)对应seqidno:1所示序列的第307位的氨基酸由苏氨酸(t)突变为酪氨酸(y)、甘氨酸(g)或苯丙氨酸(f)。(3)根据(1)或(2)所述的多肽,其中,所述多肽包括在(i)所示序列的多肽的n端或c端部位缺失或添加至少一个氨基酸残基。(4)一种重组多肽,其中,所述重组多肽包括(1)-(3)任一项所述的多肽,以及与所述多肽融合的外源多肽;可选地,所述外源多肽包括标签多肽;优选地,所述外源多肽包括标签多肽,以及连接所述标签多肽与所述具有天冬氨酸激酶活的多肽的间隔多肽。(5)一种分离的多核苷酸,其中,所述多核苷酸包含编码(1)-(3)任一项所述多肽的核苷酸序列,或包含编码(4)所述重组多肽的核苷酸序列。(6)一种核酸构建体,其中,所述核酸构建体包含(5)所述的多核苷酸,所述多核苷酸与一个或多个调控序列可操作地连接,所述调控序列指导多肽在表达宿主中产生。(7)一种重组表达载体,其中,所述重组表达载体包含(5)所述的多核苷酸,或(6)所述的核酸构建体。(8)一种重组宿主细胞,其中,所述重组宿主细胞包含(1)-(3)任一项所述的多肽、(4)所述的重组多肽、(5)所述的多核苷酸、(6)所述的核酸构建体,或者(7)所述的重组表达载体。(9)根据(8)所述的重组宿主细胞,其中,所述宿主细胞来源于棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属;优选地,所述宿主细胞为谷氨酸棒杆菌或大肠杆菌。(10)(1)-(3)任一项所述的多肽、(4)所述的重组多肽、(5)所述的多核苷酸、(6)所述的核酸构建体、(7)所述的重组表达载体,或(8)-(9)任一项所述的重组宿主细胞在生产氨基酸中的应用;优选地,所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物包括戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种。(11)一种生产氨基酸的方法,其中,包括利用(1)-(3)任一项所述的多肽、(4)所述的重组多肽、(5)所述的多核苷酸、(6)所述的核酸构建体、(7)所述的重组表达载体,或(8)-(9)任一项所述的重组宿主细胞生产氨基酸的步骤;可选地,所述方法还包括纯化或分离所述氨基酸的步骤;优选地,所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物包括戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种。发明的效果在一些实施方式中,本公开发现了野生型天冬氨酸激酶的突变体,该突变体解除了赖氨酸对天冬氨酸激酶的反馈抑制,具有高的天冬氨酸激酶活性,将其应用于赖氨酸的生产,可显著提高赖氨酸产量,实现赖氨酸的稳定、高效生产。此外,本公开的天冬氨酸激酶的突变体还能高效生产苏氨酸、异亮氨酸,以及戊二胺、5-氨基戊酸、戊二酸、羟基异亮氨酸等的氨基酸衍生物。在一些实施方式中,本公开的重组多肽、分离的多核苷酸、核酸构建体、重组表达载体分别包含或表达上述具有天冬氨酸激酶活性的多肽,可应用于赖氨酸及其衍生物的生产。在一些实施方式中,本公开的重组宿主细胞,具有解除赖氨酸反馈抑制的天冬氨酸激酶活性的多肽,重组宿主细胞中能够过量积累赖氨酸,适用于赖氨酸及其衍生物的工业生产。在一些实施方式中,本公开的生产氨基酸的方法,利用了上述具有天冬氨酸激酶活性的多肽,或重组多肽、重组宿主细胞等,能够实现氨基酸的稳定、高效生产。当用于氨基酸生产时,能够获得稳定高产的赖氨酸、苏氨酸、异亮氨酸及其衍生物。附图说明图1示出了pcas9grna-ccdb质粒的示意图;图2示出了prect质粒的示意图。具体实施方式定义当在权利要求和/或说明书中与术语“包含”联用时,词语“一(a)”或“一(an)”可以指“一个”,但也可以指“一个或多个”、“至少一个”以及“一个或多于一个”。如在权利要求和说明书中所使用的,词语“包含”、“具有”、“包括”或“含有”是指包括在内的或开放式的,并不排除额外的、未引述的元件或方法步骤。在整个申请文件中,术语“约”表示:一个值包括测定该值所使用的装置或方法的误差的标准偏差。虽然所公开的内容支持术语“或”的定义仅为替代物以及“和/或”,但除非明确表示仅为替代物或替代物之间相互排斥外,权利要求中的术语“或”是指“和/或”。当用于权利要求书或说明书时,选择/可选/优选的“数值范围”既包括范围两端的数值端点,也包括相对于前述数值端点而言,所述数值端点中间所覆盖的所有自然数。如本公开所使用的,尽管可以使用其他有机或无机催化剂,但术语“转化(converting)”是指主要由一种或多种的多肽(酶)催化从一个分子到另一个分子的化学转化;其也可以指期望产物的摩尔量与限量底物的摩尔量之间的比率(以%为单位)如本公开所使用的,术语“天冬氨酸激酶”(aspartatekinase)及其缩写名称“ak”是指能够催化天冬氨酸磷酸化,使天冬氨酸转化为天冬氨酰磷酸的多肽(酶)。天冬氨酸激酶作为赖氨酸生物合成途径中的第一个关键酶,控制着天冬氨酸族各氨基酸的生物合成途径。如本公开所使用的,术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的,它可以包含修饰的氨基酸,并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作,如以标记组分缀合)的氨基酸聚合物。如本公开所使用的,术语“片段”意指从成熟多肽或结构域的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的一种多肽或一个催化或碳水化合物结合模块。在本公开的技术方案中,所述片段具有天冬氨酸激酶活性。如本公开所使用的,术语“野生型的”指在自然界中可以找到的对象。例如,一种存在于生物体中,可以从自然界的一个来源中分离出来并且在实验室中没有被人类有意修改的多肽或多核苷酸序列是天然存在的。如本公开所用的,“天然存在的”和“野生型的”是同义词。如本公开所使用的,术语“突变体”是指相对于“野生型”,或者“相比较的”多核苷酸或多肽,在一个或多个(例如,若干个)位置处包含改变(即,取代、插入和/或缺失)的多核苷酸或多肽,其中,取代是指用不同的核苷酸或氨基酸置换占用一个位置的核苷酸或氨基酸。缺失是指去除占据某一位置的核苷酸或氨基酸。插入是指在邻接并且紧随占据位置的核苷酸或氨基酸之后添加核苷酸或氨基酸。示例性的,本公开中的“突变体”为具有提高的天冬氨酸激酶活性的多肽。如本公开所使用的,术语“氨基酸突变”或“核苷酸突变”,包括“取代、重复、缺失或添加一个或多个氨基酸或核苷酸”。在本公开中,术语“突变”是指核苷酸序列或者氨基酸序列的改变。在一个具体的实施方式中,术语“突变”是指“取代”。在一些实施方式中,本公开的“突变”包含在seqidno:1所示序列的第293位、第294位和第307位的一个或多个位置处的取代的氨基酸。上述位置处的氨基酸被取代后的突变体,与seqidno:1所示序列的多肽相比,解除了赖氨酸对酶活性的反馈抑制,具有提高的天冬氨酸激酶活性,可提高天冬氨酸向天冬氨酰磷酸的转化效率,进而提高赖氨酸的产量。在本公开中,“突变”还可以包含在对应seqidno:1所示序列的一个或几个位置处不影响天冬氨酸酶活性的添加、缺失或取代的氨基酸。众所周知,在多肽的某些区域,例如非重要区域改变少数氨基酸残基基本上不会改变生物活性,例如,适当替换、添加或缺失某些氨基酸得到的序列并不会影响其活性[2]。示例性的,本公开的“突变”包含在对应seqidno:1所示序列的多肽的c端和n端至少一端的至少一个氨基酸残基的缺失或添加,且多肽具有天冬氨酸激酶活性。在一些实施方式中,本公开的“突变”对应如seqidno:1所示序列的多肽的n端起或c端起,缺失或添加1-20个氨基酸,优选1-15个,更优选1-10个,更优选1-3个,最优选1个,并且具有天冬氨酸激酶活性。在一些实施方式中,本公开的“突变”可以选自“保守突变”。在本公开中,术语“保守突变”是指可正常维持蛋白质的功能的突变。保守突变的代表性例子为保守置换。如本公开所使用的,术语“保守置换”涉及用具有类似侧链的氨基酸残基替换氨基酸残基。本领域已经定义了具有类似侧链的氨基酸残基家族,并且包括具有碱性侧链(例如赖氨酸、精氨酸和组氨酸)、酸性侧链(例如天冬氨酸和谷氨酸)、不带电极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、和半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸和色氨酸)、β-支链(例如苏氨酸、缬氨酸和异亮氨酸)和芳香侧链(例如酪氨酸、苯丙氨酸、色氨酸和组氨酸)。如本公开所使用的,“保守置换”通常在蛋白质的一个或多个位点上交换一种氨基酸。这种取代可以是保守的。作为被视作保守置换的置换,示例性的,可以举出ala向ser或thr的置换、arg向gln、his或lys的置换、asn向glu、gln、lys、his或asp的置换、asp向asn、glu或gln的置换、cys向ser或ala的置换、gln向asn、glu、lys、his、asp或arg的置换、glu向gly、asn、gln、lys或asp的置换、gly向pro的置换、his向asn、lys、gln、arg或tyr的置换、ile向leu、met、val或phe的置换、leu向ile、met、val或phe的置换、lys向asn、glu、gln、his或arg的置换、met向ile、leu、val或phe的置换、phe向trp、tyr、met、ile或leu的置换、ser向thr或ala的置换、thr向ser或ala的置换、trp向phe或tyr的置换、tyr向his、phe或trp的置换、及val向met、ile或leu的置换。此外,保守突变还包括起因于基因所来源的个体差异、株、种的差异等天然产生的突变。如本公开所使用的,术语“重组多肽”是指以采用基因工程的方法,使两种或两种以上的多肽融合表达。在一些实施方式中,重组多肽是将seqidno:1所示序列的多肽的突变体与外源多肽融合得到的重组多肽。在一些实施方式中,外源多肽包括标签多肽。在一些实施方式中,外源多肽包括标签多肽,以及连接突变体与标签多肽的间隔多肽,具体而言,间隔多肽可以具有10个以下的间隔氨基酸残基。示例性的,标签多肽为下表1中所示的标签序列的多肽。表1标签的序列标签残基序列poly-arg5-6个(通常为5个)rrrrrpoly-his2-10个(通常为6个)hhhhhhflag8dykddddkstrep-tagii8wshpqfekc-myc10eqkliseedlha9ypydvpdya在一些实施方式中,重组多肽从n端至c端依次为:如seqidno:1所示序列的多肽的突变体、间隔多肽、标签多肽;其中,标签多肽可以是如his6所示标签序列的多肽,间隔多肽具有10个以下的氨基酸残基,例如,间隔多肽的氨基酸序列为“le”。如本公开所使用的,在两种核酸或多肽比较中的术语“序列同一性”或“同一性百分比”,是指当使用核苷酸或氨基酸残基序列比较算法或通过目视检查测量,以最大的对应性进行比较和比对时,它们是相同的或具有相同序列特定百分比数。也就是说,核苷酸或者氨基酸序列的同一性可以利用下述比例来定义,该比例是将两个或多个核苷酸或氨基酸序列按照一致的核苷酸或氨基酸数达到最大的方式,并根据需要加入空位来进行比对时一致的核苷酸数或氨基酸数,在比对部分的全部核苷酸或氨基酸数中的比例。本公开涉及的测定“序列同一性”或“同一性百分比”的方法包括但不限于:计算机分子生物学(computationalmolecularbiology),lesk,a.m.编,牛津大学出版社,纽约,1988;生物计算:信息学和基因组项目(biocomputing:informaticsandgenomeprojects),smith,d.w.编,学术出版社,纽约,1993;序列数据的计算机分析(computeranalysisofsequencedata),第一部分,griffin,a.m.和griffin,h.g.编,humanapress,新泽西,1994;分子生物学中的序列分析(sequenceanalysisinmolecularbiology),vonheinje,g.,学术出版社,1987和序列分析引物(sequenceanalysisprimer),gribskov,m.与devereux,j.编mstocktonpress,纽约,1991和carillo,h.与lipman,d.,siamj.appliedmath.,48:1073(1988)。测定相同性的优选方法要在测试的序列之间得到最大的匹配。测定相同性的方法编译在公众可获得的计算机程序中。优选的测定两条序列之间相同性的计算机程序方法包括但不限于:gcg程序包(devereux,j.等,1984)、blastp、blastn和fasta(altschul,s,f.等,1990)。公众可从ncbi和其它来源得到blastx程序(blast手册,altschul,s.等,ncbinlmnihbethesda,md.20894;altschul,s.等,1990)。熟知的smithwaterman算法也可用于测定相同性。在一些实施方式中,本公开的具有天冬氨酸活性的多肽包含与seqidno:1所示序列的多肽的突变体具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%氨基酸残基的“序列同一性”或“同一性百分比”。在另外一些实施方式中,本公开的编码具有天冬氨酸活性的多肽的多核苷酸包含与编码seqidno:1所示序列的多肽的突变体的多核苷酸具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%核苷酸的“序列同一性”或“同一性百分比”。“序列同一性”或“同一性百分比”的判断/计算可以基于序列任何合适的区域上。例如,长度至少约50个残基的区域、至少约100个残基的区域,至少约200个残基的区域,至少约400个残基的区域,或至少约500个残基的区域。在某些实施方案中,所述序列在任一或两个相比较的生物聚合物(就是核酸或多肽)的整个长度上基本相同。如本公开所使用的,术语“多核苷酸”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式,也可以是更大的核苷酸序列结构的一个组成部分,其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的,能够通过标准分子生物学方法(例如,使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个dna序列(即a、t、g、c)表示时,这也包括一个rna序列(即a、u、g、c),其中“u”取代“t”。换句话说,“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物,或者可以是一个较大核苷酸结构的组成部分或成分,如表达载体或多顺反子序列。多核苷酸包括dna、rna和cdna序列。如本公开所使用的,术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、突变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中。例如宿主细胞可以被遗传修饰以表达本公开的多肽。来自宿主细胞的发酵液将包含分离的多肽。“重组多核苷酸”属于“多核苷酸”中的一种。如本公开所使用的,术语“重组多核苷酸”指具有在自然界中不连接在一起的序列的多核苷酸。重组多核苷酸可包括在合适的载体中,且该载体可用于转化至合适的宿主细胞。含有重组多核苷酸的宿主细胞被称为“重组宿主细胞”。然后多核苷酸在重组宿主细胞中表达以产生例如“重组多肽”。如本公开所使用的,术语“表达”包括涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、和分泌。如本公开所使用的,术语“表达载体”是指线状或环状dna分子,该分子包含编码多肽的多核苷酸并且该多核苷酸有效地连接于供用于其表达的控制序列。如本公开所使用的,术语“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的dna结构。重组表达载体可包括,例如包含i)对基因表达具有调控作用的遗传元素的集合,例如启动子和增强子;ii)转录成mrna并翻译成蛋白质的结构或编码序列;以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要,并可以使用任何载体,包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成dna序列,例如细菌质粒、噬菌体dna、酵母质粒以及从质粒和噬菌体dna的组合中衍生的载体,来自如牛痘、腺病毒、鸡痘、杆状病毒、sv40和伪狂犬病等病毒的dna。如本公开所使用的,术语“重组基因”是并非天然存在的基因。重组基因是人造的。重组基因包括可操作地连接到表达控制序列上的蛋白质编码序列。实施方案包括但不限于引入微生物的外源基因、可操作地连接到异源启动子的内源蛋白质编码序列和具有经修改的蛋白质编码序列的基因。重组基因保存在微生物的基因组、微生物中的质粒或微生物中的噬菌体上。如本公开所使用的,术语“可操作地连接”是指如下的构造:调控序列相对于多核苷酸的编码序列安置在适当位置,从而使得该调控序列指导该编码序列的表达。示例性的,所述调控序列可以选自启动子和/或增强子编码的序列。如本公开所使用的,术语“核酸构建体”包含与适合的调控序列有效地连接的编码多肽或结构域或模块的多核苷酸,该调控序列对于在所选细胞或者菌株进行多核苷酸的表达是必需的。在本公开中,转录调控元件包含启动子,在此基础上,还可以包含增强子、沉默子、绝缘子等元件。本公开中的术语“宿主细胞”意指易于用包含本公开的突变体多肽、编码突变体多肽的多核苷酸或重组表达载体转化、转染、转导等的任何细胞类型。术语“重组宿主细胞”涵盖导入编码突变体多肽的多核苷酸或重组表达载体后不同于亲本细胞的宿主细胞,重组宿主细胞具体通过转化来实现。本公开的宿主细胞可以是原核细胞或真核细胞,只要是能够导入本公开的具有编码天冬氨酸激酶活性的多肽、重组多肽的多核苷酸的细胞即可。在一个实施方案中,宿主细胞指原核细胞,具体地,宿主细胞来源于适合发酵生产氨基酸的微生物,例如棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属。作为优选地,宿主细胞是来源于棒状杆菌属的谷氨酸棒杆菌,或来源于埃希氏菌属的大肠杆菌。本公开中的术语“转化、转染、转导”具有本领域技术人员普遍理解的意思,即将外源性的dna导入宿主的过程。所述转化、转染、转导的方法包括任何将核酸导入细胞的方法,这些方法包括但不限于电穿孔法、磷酸钙(capo4)沉淀法、氯化钙(cacl2)沉淀法、微注射法、聚乙二醇(peg)法、deae-葡聚糖法、阳离子脂质体法以及乙酸锂-dmso法。本公开的宿主细胞的培养可以根据本领域的常规方法进行,包括但不限于孔板培养、摇瓶培养、批次培养、连续培养和分批补料培养等,并可以根据实际情况适当地调整各种培养条件如温度、时间和培养基的ph值等。如本公开所使用的,术语“高严格条件”是指,对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃处在5xsspe(salinesodiumphosphateedta)、0.3%sds、200微克/ml剪切并变性的鲑精dna和50%甲酰胺中预杂交和杂交12至24小时。最后在65℃处使用2xssc、0.2%sds将载体材料洗涤三次,每次15分钟。如本公开所使用的,术语“非常高严格条件”是指,对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃处在5xsspe(salinesodiumphosphateedta)、0.3%sds、200微克/ml剪切并变性的鲑精dna和50%甲酰胺中预杂交和杂交12至24小时。最后在70℃处使用2xssc、0.2%sds将载体材料洗涤三次,每次15分钟。除非另外定义或由背景清楚指示,否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。天冬氨酸激酶的突变体在一些实施方式中,本公开通过定点突变构建了谷氨酸棒状杆菌中编码天冬氨酸激酶的lysc基因的突变文库,从中筛选出可以解除赖氨酸的反馈抑制,从而提高天冬氨酸激酶活性的突变体。在一些实施方式中,本公开的解除赖氨酸反馈抑制的突变位点包括seqidno:1所示序列的第293、294和307位的一个或多个位置的取代的氨基酸。示例性的,第293位点的突变包括氨基酸由异亮氨酸(i)突变为丝氨酸(s)、甘氨酸(g)、谷氨酸(e)、脯氨酸(p)、色氨酸(w)、酪氨酸(y)、组氨酸(h)、蛋氨酸(m)、谷氨酰胺(q)、半胱氨酸(c)或精氨酸(r)。第294位点的突变包括氨基酸由天冬氨酸(d)突变为酪氨酸(y)、色氨酸(w)、苯丙氨酸(f)。第307位的突变包括氨基酸由苏氨酸(t)突变为酪氨酸(y)、甘氨酸(g)、苯丙氨酸(f)。在一些实施方式中,本公开提供了具有天冬氨酸激酶活性的多肽,包括与本公开的天冬氨酸激酶的突变体具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%的序列同一性,且氨基酸序列不为seqidno:1所示序列的多肽。在一些实施方式中,本公开提供了具有天冬氨酸激酶活性的多肽,包括天冬氨酸激酶的突变体的n端和c端的至少一端起,存在氨基酸的添加或缺失。在一些具体的实施方式中,上述天冬氨酸激酶的突变体的n端和c端的至少一端起,添加或缺失1-20个氨基酸,优选1-15个,更优选1-10个,更优选1-3个,最优选1个,并且具有天冬氨酸激酶活性。在一些实施方式中,本公开提供了编码天冬氨酸激酶的突变体的多核苷酸,多核苷酸编码如seqidno:1所示序列的多肽的突变体。具体的,多核苷酸为lysc基因的突变文库中筛选得到的高产赖氨酸的lysc基因的突变基因,lysc基因的核苷酸序列如seqidno:2所示。在一些实施方式中,多核苷酸对应编码第293位氨基酸的核苷酸序列选自如下任一组:tcc;ggc;gaa;cca;tgg;tac;cac;atg;caa;tgc;cgc。优选地,多核苷酸对应编码第293位氨基酸的核苷酸序列选自tcc;ggc;gaa;cca;tgg;tac;cac;atg;caa中的任一组。在一些实施方式中,多核苷酸对应编码第294位氨基酸的核苷酸序列选自如下任一组:tac;tgg;ttc。优选地,多核苷酸对应编码第294位氨基酸的核苷酸序列选自tgg;ttc中的任一组。在一些实施方式中,多核苷酸对应编码307位氨基酸的核苷酸序列选自如下任一组:tac;ggc;ttc。优选地,多核苷酸对应编码第307位氨基酸的核苷酸序列选自tac;ggc中的任一组。lysc基因的突变文库的构建以pcas9质粒[3]为模板,以cas9-1/cas9-2为扩增引物,扩增包含cas9的扩增片段1。其中,cas9-1/cas9-2引物中引入操纵元件laco突变和rbs突变。以pncas9(d10a)-aid-grna-ccdbts[4]为模板,以grna-1/grna-2为扩增引物,扩增包含grna-ccdb表达盒和温敏复制原点的扩增片段2。将扩增片段1和扩增片段2重组连接,得到pcas9grna-ccdb质粒。得到pcas9grna-ccdb质粒图谱如图1所示,序列如seqidno:3所示。以谷氨酸棒杆菌atcc13032基因组为模板,以pddh-1/pddh-2为引物,扩增包含ddh基因的启动子突变体,作为扩增片段3。以大肠杆菌mg1655基因组为模板,以rect-1/rect-2为引物,扩增rect基因,作为扩增片段4。以pec-xk99e质粒为模板,以rrnb-1/rrnb-2为引物,扩增rrnb终止子,作为扩增片段5。以pec-xk99e质粒为模板,以pec-1/pec-2为引物,扩增去除per基因的质粒骨架片段,作为扩增片段6。将扩增片段3、扩增片段、扩增片段5和扩增片段6重组连接,获得表达rect的prect质粒。prect质粒图谱如图2所示,序列如seqidno:5所示。以goldengate克隆方法构建靶向lysc基因293/294和307位点的pcas9grna质粒。其中,grna-1的靶dna结合区为tgcagaaatcaacattgaca,grna-2的靶dna结合区为gcaggtgaaggtgatgtcgg具体的,分别将lysc-f1/lysc-r1,lysc-f2/lysc-r2进行变性退火,再与pcas9grna-ccdb质粒进行goldengate克隆,分别获得pcas9grna-lysc1和pcas9grna-lysc2质粒。将prect质粒电转化至谷氨酸棒杆菌atcc13032,获得atcc13032(prect)菌株。分别设计293-1至293-9,294-1至294-9;307-1至307-9的单链dna,作为突变体构建的重组模板。在atcc13032(prect)感受态细胞中分别转入pcas9grna-lysc1质粒和293-1至293-9、294-1至294-9的单链dna,以及pcas9grna-lysc2质粒和307-1至307-9的单链dna,将转导有质粒和单链dna的感受态细胞涂布平板,挑选包含293、294和307位氨基酸突变的单克隆菌株,获得lysc基因的突变文库。在一些实施方式中,将转化了目标dna的感受态细胞加入1ml46℃预热的tsb液体培养基,46℃热击6min,30℃孵育3h,涂布添加5μg/ml氯霉素和0.05mmiptg的tsb平板,培养2天,长出数百克隆,从中筛选获得293、294和307位氨基酸位点的突变体库。tsb液体培养基成份为(g/l):葡萄糖,5g/l;酵母粉,5g/l;大豆蛋白胨,9g/l;尿素,3g/l;丁二酸,0.5g/l;k2hpo4·3h2o,1g/l;mgso4·7h2o,0.1g/l;生物素,0.01mg/l;维生素b1,0.1mg/l;mops,20g/l。固体培养基补充15g/l琼脂粉。谷氨酸棒杆菌的具体来源为谷氨酸棒杆菌atcc13032(corynebacteriumglutamicumatcc13032,geneid:2830649)。氨基酸的生产过程(1)在293、294和307位氨基酸突变的lysc基因的突变文库中通过可重复得到筛选结果的方法筛选高产赖氨酸的单克隆菌株,作为生产氨基酸的重组宿主细胞。(2)对重组宿主细胞进行发酵培养,从重组宿主细胞或重组宿主细胞的培养液中收集氨基酸,完成氨基酸的生产过程。上述的氨基酸生产过程中,重组宿主细胞包含的突变的lysc基因能够编码解除赖氨酸抑制作用的天冬氨酸激酶,重组宿主细胞可大量积累赖氨酸,实现了对于赖氨酸、苏氨酸、异亮氨酸及其衍生物的稳定、高效生产。对于生产的氨基酸,所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物包括戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种。对于重组宿主细胞,重组宿主细胞中还包含其他参与合成氨基酸的酶,示例性的,参与合成氨基酸的酶包括天冬氨酸激酶、天冬氨酸半醛脱氢酶、天冬氨酸氨裂合酶、二氢吡啶二羧酸合成酶、二氢吡啶甲酸还原酶、琥珀酰二氨基庚二酸氨基转移酶、四氢吡啶二羧酸酯琥珀酰酶、琥珀酰二氨基庚二酸脱酰基酶、二氨基庚二酸差向异构酶、二氨基庚二酸脱酰基酶、甘油醛-3-磷酸脱氢酶、赖氨酸运输蛋白、转酮酶、二氨基庚二酸脱氢酶和丙酮酸羧化酶中的一种或两种以上的组合。在一些实施方式中,可以通过基因工程的方法增强参与合成氨基酸的酶的活性或酶的表达量,例如通过引入强启动子或者采用质粒游离表达形式提高参与合成氨基酸的酶编码基因的表达强度,或者采用染色体整合的方式整合其他物种来源的酶活性更高的参与合成氨基酸的酶的编码基因。在一些实施方式中,宿主细胞为谷氨酸棒杆菌,在另外一些实施方式中,宿主细胞为大肠杆菌。谷氨酸棒杆菌和大肠杆菌均是生产赖氨酸的重要菌株,通过在谷氨酸棒杆菌和大肠杆菌中表达解除赖氨酸反馈抑制的天冬氨酸激酶的突变体,可实现对赖氨酸及其衍生物的高效生产。在一些实施方式中,重组宿主细胞的筛选条件为:采用牙签挑取少量菌接种到每孔含有200μl发酵培养基的96孔板中,30℃培养24h,孔板摇床转速为800rpm。在一些实施方式中,发酵培养条件为:将重组宿主细胞接种到tsb液体培养基中培养6-8h,培养物作为种子接种到每孔含有600μl发酵培养基的24孔板中,初始od600控制约为0.1,30℃培养17h,孔板摇床转速为800rpm,每个菌株3个平行,发酵结束后检测od600和l-赖氨酸产量。发酵培养基成份为:葡萄糖,80g/l;酵母粉,1g/l;大豆蛋白胨,1g/l;nacl,1g/l;硫酸铵,1g/l;尿素,8g/l;k2hpo4·3h2o,1g/l;mgso4·7h2o,0.45g/l;feso4·7h2o,0.05g/l;生物素,0.4mg/l;维生素b1,0.1mg/l;mops,40g/l;初始ph7.2。在一些实施方式中,对于重组宿主细胞或重组细胞的培养液回收氨基酸,可通过本领域常用方法,包括但不限于:过滤、阴离子交换色谱、结晶和hplc。本公开所述的催化一些或所有反应的酶可在非天然的、经工程改造的异源生物体中表达。具体地,编码途径用酶的基因可被分离,插入到用于转化生产的生物体的表达载体中,可被并入至基因组,并直接表达所述酶。在本领域,用于操纵微生物的方法是已知的,如《分子生物学现代方法》(onlineisbn:9780471142720,johnwileyandsons,inc.)、《微生物代谢工程:方法和规程》(qiongchenged.,springer)和《系统代谢工程:方法和规程》(hals.alpered.,springer)等出版物中被解释。实施例本公开的其他目的、特征和优点将从以下详细描述中变得明显。但是,应当理解的是,详细描述和具体实施例(虽然表示本公开的具体实施方式)仅为解释性目的而给出,因为在阅读该详细说明后,在本公开的精神和范围内所作出的各种改变和修饰,对于本领域技术人员来说将变得显而易见。本实施例中所用到的实验技术与实验方法,如无特殊说明均为常规技术方法,例如下列实施例中未注明具体条件的实验方法,通常按照常规条件如sambrook等人,分子克隆:实验室手册(newyork:coldspringharborlaboratorypress,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所使用的材料、试剂等,如无特殊说明,均可通过正规商业渠道获得。实施例1.构建谷氨酸棒杆菌lysc基因的突变体库基于谷氨酸棒杆菌lysc的序列和结构特征,以及我们对其功能的理解,推测293、294和307位氨基酸位点突变可以解除lysc的赖氨酸反馈抑制,并可以提高谷氨酸棒杆菌的l-赖氨酸产量。为了实现谷氨酸棒杆菌的快速定点突变,首先构建基于单链重组的crispr/cas9基因组编辑系统。以pcas9质粒[3]为模板,以cas9-1/cas9-2为引物,在引物上引入操纵元件laco突变(tgtgtggaattgtgagcggataacaatttcacaca突变为tgtgtggaattgtgagcgctcacaatttcacaca)和rbs突变(aaaggagttgaga突变为aaaggcacccgat),扩增包含cas9的片段;再以pncas9(d10a)-aid-grna-ccdbts[4]质粒为模板,以grna-1/grna-2为引物,扩增包含grna-ccdb表达盒和温敏复制原点的质粒骨架片段。以上2个片段通过诺唯赞的一步重组试剂盒克隆连接,获得可以高效构建的pcas9grna-ccdb质粒,质粒图谱如图1所示,序列如seqidno:3所示。以谷氨酸棒杆菌atcc13032基因组为模板,以pddh-1/pddh-2为引物,扩增ddh基因的启动子突变体(atgcatctc突变为acaaaaggt),序列如seqidno:4所示;以大肠杆菌mg1655基因组为模板,扩增rect基因;以pec-xk99e质粒为模板,以rrnb-1/rrnb-2为引物,扩增rrnb终止子片段;以pec-xk99e质粒为模板,以pec-1/pec-2为引物,扩增去除per基因的质粒骨架片段。以上4个片段通过诺唯赞的一步重组试剂盒克隆连接,获得表达rect的prect质粒,质粒图谱如图2所示,序列如seqidno:5所示。根据文献报道的goldengate克隆方法[4]构建2个靶向lysc基因293/294和307位点的pcas9grna质粒,grna1的靶dna结合区为tgcagaaatcaacattgaca,grna2的靶dna结合区为gcaggtgaaggtgatgtcgg。分别将lysc-f1/lysc-r1,lysc-f2/lysc-r2引物进行变性退火,再与pcas9grna-ccdb质粒进行goldengate克隆,分别获得pcas9grna-lysc1和pcas9grna-lysc2质粒。基于单链重组的crispr/cas9基因组编辑系统构建lysc基因293、294和307位氨基酸位点的突变体库。将prect质粒电转化至谷氨酸棒杆菌atcc13032,获得atcc13032(prect)菌株。atcc13032(prect)菌株采用文献报道的方法制备感受态细胞[5]。为了对lysc基因293、294和307位的氨基酸位点进行野生型以外的19种突变,分别设计293-1至293-9,294-1至294-9;307-1至307-9的单链dna,作为突变体构建的重组模板。atcc13032(prect)感受态细胞,分别电转化1-2μgpcas9grna-lysc1质粒和10μg293-1至293-9的理论上19种突变等摩尔浓度的单链dna,1-2μgpcas9grna-lysc1质粒和10μg294-1至294-9的理论上19种突变等摩尔浓度的单链dna,以及1-2μgpcas9grna-lysc2质粒和10μg307-1至307-9的理论上19种突变等摩尔浓度的单链dna,然后加入1ml46℃预热的tsb培养基,46℃热击6min,30℃孵育3h,涂布添加5μg/ml氯霉素和0.05mmiptg的tsb平板,培养2天,长出数百克隆,分别获得293、294和307位氨基酸位点的突变体库。tsb培养基成份为(g/l):葡萄糖,5g/l;酵母粉,5g/l;大豆蛋白胨,9g/l;尿素,3g/l;丁二酸,0.5g/l;k2hpo4·3h2o,1g/l;mgso4·7h2o,0.1g/l;生物素,0.01mg/l;维生素b1,0.1mg/l;mops,20g/l。固体培养基补充15g/l琼脂粉。以上所用引物序列如表2所示。表2实施例2.谷氨酸棒杆菌lysc基因突变体库的筛选及测序为了筛选谷氨酸棒杆菌lysc基因的突变体库,分别挑取293、294和307位点突变体库各60个克隆进行发酵,筛选可以高产l-赖氨酸的突变体。发酵培养基成份为:葡萄糖,80g/l;酵母粉,1g/l;大豆蛋白胨,1g/l;nacl,1g/l;硫酸铵,1g/l;尿素,8g/l;k2hpo4·3h2o,1g/l;mgso4·7h2o,0.45g/l;feso4·7h2o,0.05g/l;生物素,0.4mg/l;维生素b1,0.1mg/l;mops,40g/l;初始ph7.2。采用牙签挑取少量菌接种到每孔含有200μl发酵培养基的96孔板中,30℃培养24h,孔板摇床转速为800rpm,发酵结束后检测l-赖氨酸产量。293突变体库的所有克隆产量都高于0.5g/l,294和307突变库也有部分克隆产量高于0.5g/l,表明以上位点突变可以解除赖氨酸反馈抑制,提高赖氨酸产量。对赖氨酸产量大于0.5g/l的突变体,以及294和307突变库中部分不产赖氨酸的突变体,采用lysc-c1/lysc-c2(表2)引物pcr扩增目的条带进行测序分析。突变体的产量和测序结果如表3所示,有部分相同突变的克隆,最终293位点获得11种突变体,294位点获得6种突变体,307位点获得5种突变体。表3注:–,不产赖氨酸; ,赖氨酸产量0.5-1.0g/l; ,赖氨酸产量1.0-2.0g/l; ,赖氨酸产量2.0-3.0g/l; ,赖氨酸产量3.0-4.0g/l。实施例3.谷氨酸棒杆菌lysc基因突变体的赖氨酸产量评价由于前面突变体赖氨酸产量初筛时菌株中还包含prect和pcas9grna-lysc1或pcas9grna-lysc2质粒,因此本实施例将以上质粒进行了丢失,获得仅基因组上存在突变体的菌株,并对其赖氨酸产量进行了评价。对以上获得产量较高菌株293-m1至293-m9、293-m1至293-m3、307-m1至307-m2菌株,在无抗性的tsb培养基培养,丢失两个质粒,分别获得丢失质粒后zcglj1至zcglj9、zcglj11至zcglj13、zcglj14至zcglj15突变体菌株。为了进行效果对比,同时构建了大量在先文献报道的高效解除赖氨酸反馈抑制的lysct311i突变体,该菌株是在谷氨酸棒杆菌atcc13032的天冬氨酸激酶编码基因lysc上引入t311i(碱基由acc突变为atc)氨基酸突变(引用文献2),此外,以野生型谷氨酸棒杆菌atcc13032作为对照菌株(wt)。采用24孔板评价菌株的赖氨酸产量,首先将菌株接种到tsb液体培养基中培养6-8h,培养物作为种子接种到每孔含有600μl发酵培养基(同实施例2)的24孔板中,初始od600控制约为0.1,30℃培养17h,孔板摇床转速为800rpm,每个菌株3个平行,发酵结束后检测od600和l-赖氨酸产量。结果如表4所示,293位点的所有11个突变体产量都高于t311i对照突变体,294位点的d294f(zcglj13菌株)和307位点的t307g(zcglj15)产量也高于t311i对照突变体。这些氨基酸位点突变在氨基酸及其衍生物生产中具有较t311i更好的应用前景,特别是对于均依赖lysc催化反应的赖氨酸、苏氨酸和异亮氨酸的生产及其衍生物戊二胺、5-氨基戊酸、戊二酸、羟基异亮氨酸等的生产。表4菌株氨基酸突变od600赖氨酸产量(g/l)wt–11.78±0.180.17±0.06lysct311it311i12.15±0.232.33±0.06zcglj1i293s12.50±0.353.27±0.15zcglj2i293g11.99±0.343.00±0.10zcglj3i293e11.86±0.593.00±0.20zcglj4i293p12.22±0.553.30±0.20zcglj5i293w12.35±0.033.33±0.06zcglj6i293y12.72±0.243.53±0.06zcglj7i293h12.40±0.083.30±0.00zcglj8i293m12.15±0.252.77±0.06zcglj9i293q12.23±0.063.50±0.00zcglj11d294y12.00±0.510.60±0.00zcglj12d294w12.04±0.411.73±0.06zcglj13d294f12.66±0.202.73±0.06zcglj14t307y12.14±0.410.7±0.00zcglj15t307g12.41±0.182.50±0.00本说明书公开的所有技术特征都可以任何组合方式进行组合。本说明所公开的每个特征也可以被其它具有相同、相等或相似作用的特征所替换。因此,除非特殊说明,所公开的每一特征仅仅是一系列相等或相似特征的实例。此外,从上述描述中,本领域技术人员可从本公开中很容易清楚本公开的关键特征,在不脱离本公开的精神及范围的情况下,可对发明进行很多修改以适应各种不同的使用目的及条件,因此这类修改也旨在落入所附权利要求书的范围内。参考文献:[1]bearercf,neetke;stadtman,e.r.,cohen,g.n.,lebras,g.,robichon-szulmajster,h.(1961)."feed-backinhibitionandrepressionofaspartokinaseactivityinescherichiacoliandsaccharomycescerevisiae."j.biol.chem.[2]watson等,molecularbiologyofthegene,第四版,1987,thebenjamin/cummingspub.co.p224.[3]liu,jiao,etal.developmentofacrispr/cas9genomeeditingtoolboxforcorynebacteriumglutamicum.microbialcellfactories,2017,16.1:205.[4]wang,yu,etal.expandingtargetingscope,editingwindow,andbasetransitioncapabilityofbaseeditingincorynebacteriumglutamicum.biotechnologyandbioengineering,2019,116:3016-3029.[5]ruany,zhul,liq.improvingtheelectro-transformationefficiencyofcorynebacteriumglutamicumbyweakeningitscellwallandincreasingthecytoplasmicmembranefluidity.biotechnollett.2015;37:2445–52。序列表<110>中国科学院天津工业生物技术研究所<120>具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用<130>6a17-2093168i<141>2020-10-16<160>50<170>siposequencelisting1.0<210>1<211>421<212>prt<213>corynebacteriumglutamicum<400>1metalaleuvalvalglnlystyrglyglyserserleugluserala151015gluargileargasnvalalagluargilevalalathrlyslysala202530glyasnaspvalvalvalvalcysseralametglyaspthrthrasp354045gluleuleugluleualaalaalavalasnprovalproproalaarg505560glumetaspmetleuleuthralaglygluargileserasnalaleu65707580valalametalailegluserleuglyalaglualaglnserphethr859095glyserglnalaglyvalleuthrthrgluarghisglyasnalaarg100105110ilevalaspvalthrproglyargvalargglualaleuaspglugly115120125lysilecysilevalalaglypheglnglyvalasnlysgluthrarg130135140aspvalthrthrleuglyargglyglyseraspthrthralavalala145150155160leualaalaalaleuasnalaaspvalcysgluiletyrseraspval165170175aspglyvaltyrthralaaspproargilevalproasnalaglnlys180185190leuglulysleuserphegluglumetleugluleualaalavalgly195200205serlysileleuvalleuargservalglutyralaargalapheasn210215220valproleuargvalargsersertyrserasnaspproglythrleu225230235240ilealaglysermetgluaspileprovalgluglualavalleuthr245250255glyvalalathrasplysserglualalysvalthrvalleuglyile260265270serasplysproglyglualaalalysvalpheargalaleualaasp275280285alagluileasnileaspmetvalleuglnasnvalserservalglu290295300aspglythrthraspilethrphethrcysproargseraspglyarg305310315320argalametgluileleulyslysleuglnvalglnglyasntrpthr325330335asnvalleutyraspaspglnvalglylysvalserleuvalglyala340345350glymetlysserhisproglyvalthralagluphemetglualaleu355360365argaspvalasnvalasnilegluleuileserthrsergluilearg370375380ileservalleuilearggluaspaspleuaspalaalaalaargala385390395400leuhisgluglnpheglnleuglyglygluaspglualavalvaltyr405410415alaglythrglyarg420<210>2<211>1266<212>dna<213>artificialsequence<400>2gtggccctggtcgtacagaaatatggcggttcctcgcttgagagtgcggaacgcattaga60aacgtcgctgaacggatcgttgccaccaagaaggctggaaatgatgtcgtggttgtctgc120tccgcaatgggagacaccacggatgaacttctagaacttgcagcggcagtgaatcccgtt180ccgccagctcgtgaaatggatatgctcctgactgctggtgagcgtatttctaacgctctc240gtcgccatggctattgagtcccttggcgcagaagcccaatctttcacgggctctcaggct300ggtgtgctcaccaccgagcgccacggaaacgcacgcattgttgatgtcactccaggtcgt360gtgcgtgaagcactcgatgagggcaagatctgcattgttgctggtttccagggtgttaat420aaagaaacccgcgatgtcaccacgttgggtcgtggtggttctgacaccactgcagttgcg480ttggcagctgctttgaacgctgatgtgtgtgagatttactcggacgttgacggtgtgtat540accgctgacccgcgcatcgttcctaatgcacagaagctggaaaagctcagcttcgaagaa600atgctggaacttgctgctgttggctccaagattttggtgctgcgcagtgttgaatacgct660cgtgcattcaatgtgccacttcgcgtacgctcgtcttatagtaatgatcccggcactttg720attgccggctctatggaggatattcctgtggaagaagcagtccttaccggtgtcgcaacc780gacaagtccgaagccaaagtaaccgttctgggtatttccgataagccaggcgaggctgcg840aaggttttccgtgcgttggctgatgcagaaatcaacattgacatggttctgcagaacgtc900tcttctgtagaagacggcaccaccgacatcaccttcacctgccctcgttccgacggccgc960cgcgcgatggagatcttgaagaagcttcaggttcagggcaactggaccaatgtgctttac1020gacgaccaggtcggcaaagtctccctcgtgggtgctggcatgaagtctcacccaggtgtt1080accgcagagttcatggaagctctgcgcgatgtcaacgtgaacatcgaattgatttccacc1140tctgagattcgtatttccgtgctgatccgtgaagatgatctggatgctgctgcacgtgca1200ttgcatgagcagttccagctgggcggcgaagacgaagccgtcgtttatgcaggcaccgga1260cgctaa1266<210>3<211>11773<212>dna<213>artificialsequence<400>3aattaagcttaaaggcacccgatatggataagaaatactcaataggcttagatatcggca60caaatagcgtcggatgggcggtgatcactgatgaatataaggttccgtctaaaaagttca120aggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttat180ttgacagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtata240cacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaag300tagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagc360atgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatc420caactatctatcatctgcgaaaaaaattggtagattctactgataaagcggatttgcgct480taatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggag540atttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaacctaca600atcaattatttgaagaaaaccctattaacgcaagtggagtagatgctaaagcgattcttt660ctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgaga720agaaaaatggcttatttgggaatctcattgctttgtcattgggtttgacccctaatttta780aatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatg840atgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcag900ctaagaatttatcagatgctattttactttcagatatcctaagagtaaatactgaaataa960ctaaggctcccctatcagcttcaatgattaaacgctacgatgaacatcatcaagacttga1020ctcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttg1080atcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaatttt1140ataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaac1200taaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatc1260aaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttt1320taaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttg1380gtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaa1440ttaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattg1500aacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtt1560tgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgaag1620gaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactct1680tcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatag1740aatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggta1800cctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatg1860aagatatcttagaggatattgttttaacattgaccttatttgaagatagggagatgattg1920aggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaac1980gtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggata2040agcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaatt2100ttatgcagctgatccatgatgatagtttgacatttaaagaagacattcaaaaagcacaag2160tgtctggacaaggcgatagtttacatgaacatattgcaaatttagctggtagccctgcta2220ttaaaaaaggtattttacagactgtaaaagttgttgatgaattggtcaaagtaatggggc2280ggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagg2340gccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaa2400gtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatc2460tctattatctccaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtt2520taagtgattatgatgtcgatcacattgttccacaaagtttccttaaagacgattcaatag2580acaataaggtcttaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtg2640aagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatca2700ctcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgata2760aagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcac2820aaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagagg2880ttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattct2940ataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcg3000ttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgatt3060ataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaa3120ccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttg3180caaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattg3240tctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtca3300atattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaa3360aaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtg3420gttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaaggga3480aatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagtt3540cctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaag3600acttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacgga3660tgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatg3720tgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacg3780aacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaa3840tcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtg3900catataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttat3960ttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatc4020gtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatca4080ctggtctttatgaaacacgcattgatttgagtcagctaggaggtgactgaagcttggctg4140ttttggcggatgagagaagattttcagcctgatacagattaaatcagaacgcagaagcgg4200tctgataaaacagaatttgcctggcggcagtagcgcggtggtcccacctgaccccatgcc4260gaactcagaagtgaaacgccgtagcgccgatggtagtgtggggtctgcccatgcgagagt4320agggaactgccaggcatcaaataaaacgaaaggctcagtcgaaagactgggcctttcgtt4380ttatctgttgtttgtcggtgaacgctctcctgagtaggacaaatccgccgggagcggatt4440tgaacgttgcgaagcaacggcccggagggtggcgggcaggacgcccgccataaactgcca4500ggcatcaaattaagcagaaggccatcctgacggatggcctttttgcgtttctacaaactc4560ttttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctga4620taaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcc4680cttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtg4740aaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctc4800aacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcact4860tttgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatca4920gctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaac4980atgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgttt5040ttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtgg5100cgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgc5160tctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagc5220gtggcgctttctcaatgctcacgctgtaggtatctcagttcggtgtaggtcgttcgctcc5280aagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaac5340tatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggt5400aacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcct5460aactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttacc5520ttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggt5580ttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttg5640atcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtc5700atgagattatcaaaaaggatcttcacctagatccttttggggtgggcgaagaactccagc5760atgagatccccgcgctggaggatcatccagccattcggggtcgttcactggttccccttt5820ctgatttctggcatagaagaacccccgtgaactgtgtggttccgggggttgctgattttt5880gcgagacttctcgcgcaattccctagcttaggtgaaaacaccatgaaacactagggaaac5940acccatgaaacacccattagggcagtagggcggcttcttcgtctagggcttgcatttggg6000cggtgatctggtctttagcgtgtgaaagtgtgtcgtaggtggcgtgctcaatgcactcga6060acgtcacgtcatttaccgggtcacggtgggcaaagagaactagtgggttagacattgttt6120tcctcgttgtcggtggtggtgagcttttctagccgctcggtaaacgcggcgatcatgaac6180tcttggaggttttcaccgttctgcatgcctgcgcgcttcatgtcctcacgtagtgccaaa6240ggaacgcgtgcggtgaccacgacgggcttagcctttgcctgcgcttctagtgcttcgatg6300gtggcttgtgcctgcgcttgctgcgcctgtagtgcctgttgagcttcttgtagttgctgt6360tctagctgtgccttggttgccatgctttaagactctagtagctttcctgcgatatgtcat6420gcgcatgcgtagcaaacattgtcctgcaactcattcattatgtgcagtgctcctgttact6480agtcgtacatactcatatttacctagtctgcatgcagtgcatgcacatgcagtcatgtcg6540tgctaatgtgtaaaacatgtacatgcagattgctgggggtgcagggggcggagccaccct6600gtccatgcggggtgtggggcttgccccgccggtacagacagtgagcaccggggcacctag6660tcgcggataccccccctaggtatcggacacgtaaccctcccatgtcgatgcaaatcttta6720acattgagtacgggtaagctggcacgcatagccaagctaggcggccaccaaacaccacta6780aaaattaatagtccctagacaagacaaacccccgtgcgagctaccaactcatatgcacgg6840gggccacataacccgaaggggtttcaattgacaaccatagcactagctaagacaacgggc6900acaacacccgcacaaactcgcactgcgcaaccccgcacaacatcgggtctaggtaacact6960gagtaacactgaaatagaagtgaacacctctaaggaaccgcaggtcaatgagggttctaa7020ggtcactcgcgctagggcgtggcgtaggcaaaacgtcatgtacaagatcaccaatagtaa7080ggctctggcggggtgccataggtggcgcagggacgaagctgttgcggtgtcctggtcgtc7140taacggtgcttcgcagtttgagggtctgcaaaactctcactctcgctgggggtcatctct7200ggctgaattggaagtcatgggcgaacgccgcattgagctggctattgctactaagaatca7260cttggcggcgggtggcgcgctcatgatgtttgtgggcactgttcgacacaaccgctcaca7320gtcatttgcgcaggttgaagcgggtattaagactgcgtactcttcgatggtgaaaacatc7380tcagtggaagaaagaacgtgcacggtacggggtggagcacacctatagtgactatgaggt7440cacagactcttgggcgaacggttggcacttgcaccgcaacatgctgttgttcttggatcg7500tccactgtctgacgatgaactcaaggcgtttgaggattccatgttttcccgctggtctgc7560tggtgtggttaaggccggtatggacgcgccactgcgtgagcacggggtcaaacttgatca7620ggtgtctacctggggtggagacgctgcgaaaatggcaacctacctcgctaagggcatgtc7680tcaggaactgactggctccgctactaaaaccgcgtctaaggggtcgtacacgccgtttca7740gatgttggatatgttggccgatcaaagcgacgccggcgaggatatggacgctgttttggt7800ggctcggtggcgtgagtatgaggttggttctaaaaacctgcgttcgtcctggtcacgtgg7860ggctaagcgtgctttgggcattgattacatagacgctgatgtacgtcgtgaaatggaaga7920agaactgtacaagctcgccggtctggaagcaccggaacgggtcgaatcaacccgcgttgc7980tgttgctttggtgaagcccgatgattggaaactgattcagtctgatttcgcggttaggca8040gtacgttctcgattgcgtggataaggctaaggacgtggccgctgcgcaacgtgtcgctaa8100tgaggtgctggcaagtctgggtgtggattccaccccgtgcatgatcgttatggatgatgt8160ggacttggacgcggttctgcctactcatggggacgctactaagcgtgatctgaatgcggc8220ggtgttcgcgggtaatgagcagactattcttcgcacccactaaaagcggcataaaccccg8280ttcgatattttgtgcgatgaatttatggtcaatgtcgcgggggcaaactatgatgggtct8340tgttgttggcgtcccggaaaacgattccgaagcccaacctttcatagaaggcggcggtgg8400aatttttctccacataagctggcaatgttgcgacgcaacaggtacagtgtaattcatgag8460accacgcgtggatccggcttactaaaagccagataacagtatgcgtatttgcgcgctgat8520ttttgcggtataagaatatatactgatatgtatacccgaagtatgtcaaaaagaggtatg8580ctatgaagcagcgtattacagtgacagttgacagcgacagctatcagttgctcaaggcat8640atatgatgtcaatatctccggtctggtaagcacaaccatgcagaatgaagcccgtcgtct8700gcgtgccgaacgctggaaagcggaaaatcaggaagggatggctgaggtcgcccggtttat8760tgaaatgaacggctcttttgctgacgagaacaggggctggtgaaatgcagtttaaggttt8820acacctataaaagagagagccgttatcgtctgtttgtggatgtacagagtgatattattg8880acacgcccgggcgacggatggtgatccccctggccagtgcacgtctgctgtcagataaag8940tctcccgtgaactttacccggtggtgcatatcggggatgaaagctggcgcatgatgacca9000ccgatatggccagtgtgccggtatccgttatcggggaagaagtggctgatctcagccacc9060gcgaaaatgacatcaaaaacgccattaacctgatgttctggggaatataaggtctcagtt9120ttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggc9180accgagtcggtgctttttttccaggcatcaaataaaacgaaaggctcagtcgaaagactg9240ggcctttcgttttatctgttgtttgtcggtgaacgctctcctgagtaggacaaatccgcc9300gggagcggatttgaacgttgcgaagcaacggcccggagggtggcgggcaggacgcccgcc9360ataaactgccaggcatcaaattaagcagaaggccatcctgacggatggcctttttgcgtt9420tctacaaactctttttgtttatttttctaaatacattcaaatatgtatccgctcatgaat9480taattccgctagatgacgtgcggcttcgaaaatctcgtgatggcaggttgggcgtcgctt9540ggtcggtcatttcgaagggcaccaataactgccttaaaaaaattacgccccgccctgcca9600ctcatcgcagtactgttgtaattcattaagcattctgccgacatggaagccatcacagac9660ggcatgatgaacctgaatcgccagcggcatcagcaccttgtcgccttgcgtataatattt9720gcccatggtgaaaacgggggcgaagaagttgtccatattggccacgtttaaatcaaaact9780ggtgaaactcacccagggattggctgagacgaaaaacatattctcaataaaccctttagg9840gaaataggccaggttttcaccgtaacacgccacatcttgcgaatatatgtgtagaaactg9900ccggaaatcgtcgtggtattcactccagagcgatgaaaacgtttcagtttgctcatggaa9960aacggtgtaacaagggtgaacactatcccatatcaccagctcaccgtctttcattgccat10020acggaactccggatgagcattcatcaggcgggcaagaatgtgaataaaggccggataaaa10080cttgtgcttatttttctttacggtctttaaaaaggccgtaatatccagctgaacggtctg10140gttataggtacattgagcaactgactgaaatgcctcaaaatgttctttacgatgccattg10200ggatatatcaacggtggtatatccagtgatttttttctccattttagcttccttagctcc10260tgaaaatctcgtcgaagctcggcggatttgtcctactcaagctgatccgacaaaatccac10320acattatcccaggtgtccggatcggtcaaatacgctgccagctcatagaccgtatccaaa10380gcatccggggctgatccccggcgccagggtggtttttcttttcaccagtgagacgggcaa10440cagctgattgcccttcaccgcctggccctgagagagttgcagcaagcggtccacgtggtt10500tgccccagcaggcgaaaatcctgtttgatggtggttaacggcgggatataacatgagctg10560tcttcggtatcgtcgtatcccactaccgagatatccgcaccaacgcgcagcccggactcg10620gtaatggcgcgcattgcgcccagcgccatctgatcgttggcaaccagcatcgcagtggga10680acgatgccctcattcagcatttgcatggtttgttgaaaaccggacatggcactccagtcg10740ccttcccgttccgctatcggctgaatttgattgcgagtgagatatttatgccagccagcc10800agacgcagacgcgccgagacagaacttaatgggcccgctaacagcgcgatttgctggtga10860cccaatgcgaccagatgctccacgcccagtcgcgtaccgtcttcatgggagaaaataata10920ctgttgatgggtgtctggtcagagacatcaagaaataacgccggaacattagtgcaggca10980gcttccacagcaatggcatcctggtcatccagcggatagttaatgatcagcccactgacg11040cgttgcgcgagaagattgtgcaccgccgctttacaggcttcgacgccgcttcgttctacc11100atcgacaccaccacgctggcacccagttgatcggcgcgagatttaatcgccgcgacaatt11160tgcgacggcgcgtgcagggccagactggaggtggcaacgccaatcagcaacgactgtttg11220cccgccagttgttgtgccacgcggttgggaatgtaattcagctccgccatcgccgcttcc11280actttttcccgcgttttcgcagaaacgtggctggcctggttcaccacgcgggaaacggtc11340tgataagagacaccggcatactctgcgacatcgtataacgttactggtttcacattcacc11400accctgaattgactctcttccgggcgctatcatgccataccgcgaaaggttttgcaccat11460tcgatggtgtcaacgtaaatgccgcttcgccttcgcgcgcgaattgcaagctgatccggg11520cttatcgactgcacggtgcaccaatgcttctggcgtcaggcagccatcggaagctgtggt11580atggctgtgcaggtcgtaaatcactgcataattcgtgtcgctcaaggcgcactcccgttc11640tggataatgttttttgcgccgacatcataacggttctggcaaatattctgaaatgagctg11700ttgacaattaatcatcggctcgtataatgtgtggaattgtgagcgctcacaatttcacac11760aggaaacagaatt11773<210>4<211>351<212>dna<213>corynebacteriumglutamicum<400>4gtgcgtggcgagttttacaaagaaccccacatcatcaatgcctaaatggcgggtattttc60atccaaacccaaccgcgcatcattccaatgctgatccaccccatccggataaaccaccat120gaacggcaacggatcaaaagtcctgttggtgaagctgcgccccacagatcctgactgctg180ggagccatgaaaatagatcagcgcatccgtggtggaaccaaaaggctcaacaatacgaaa240cgttcgctttcggtcctgatgaaagagatgtccctgaatcatcatctaagtacaaaaggt300ggtaagctcgaccaggacagtgccaccacaattttggaggattacaagaac351<210>5<211>5688<212>dna<213>artificialsequence<400>5gtgcgtggcgagttttacaaagaaccccacatcatcaatgcctaaatggcgggtattttc60atccaaacccaaccgcgcatcattccaatgctgatccaccccatccggataaaccaccat120gaacggcaacggatcaaaagtcctgttggtgaagctgcgccccacagatcctgactgctg180ggagccatgaaaatagatcagcgcatccgtggtggaaccaaaaggctcaacaatacgaaa240cgttcgctttcggtcctgatgaaagagatgtccctgaatcatcatctaagtacaaaaggt300ggtaagctcgaccaggacagtgccaccacaattttggaggattacaagaacatgactaag360caaccaccaatcgcaaaagccgatctgcaaaaaactcagggaaaccgtgcaccagcagca420gttaaaaatagcgacgtgattagttttattaaccagccatcaatgaaagagcaactggca480gcagctcttccacgccatatgacggctgaacgtatgatccgtatcgccaccacagaaatt540cgtaaagttccggcgttaggaaactgtgacactatgagttttgtcagtgcgatcgtacag600tgttcacagctcggacttgagccaggtagcgccctcggtcatgcatatttactgcctttt660ggtaataaaaacgaaaagagcggtaaaaagaacgttcagctaatcattggctatcgcggc720atgattgatctggctcgccgttctggtcaaatcgccagcctgtcagcccgtgttgtccgt780gaaggtgacgagtttagcttcgaatttggccttgatgaaaagttaatacaccgcccggga840gaaaacgaagatgccccggttacccacgtctatgctgtcgcaagactgaaagacggaggt900actcagtttgaagttatgacgcgcaaacagattgagctggtgcgcagcctgagtaaagct960ggtaataacgggccgtgggtaactcactgggaagaaatggcaaagaaaacggctattcgt1020cgcctgttcaaatatttgcccgtatcaattgagatccagcgtgcagtatcaatggatgaa1080aaggaaccactgacaatcgatcctgcagattcctctgtattaaccggggaatacagtgta1140atcgataattcagaggaataactgttttggcggatgagagaagattttcagcctgataca1200gattaaatcagaacgcagaagcggtctgataaaacagaatttgcctggcggcagtagcgc1260ggtggtcccacctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatggtag1320tgtggggtctccccatgcgagagtagggaactgccaggcatcaaataaaacgaaaggctc1380agtcgaaagactgggcctttcgttttatctgttgtttgtcggtgaacgctctcctgagta1440ggacaaatccgccgggagcggatttgaacgttgcgaagcaacggcccggagggtggcggg1500caggacgcccgccataaactgccaggcatcaaattaagcagaaggccatcctgacggatg1560gcctttttgcgtttctacaaactctttttgtttatttttctaaatacattcaaatatgta1620tccgctcatgaattaattccgctagatgacgtgcggcttcgactagctccaaaaaggtct1680ccaggatctcgaggagatttttgagggggagggagtcgaggaagagccagagcagaaggc1740ggggaaccgttctctgccgacagcgtgagccccccttaaaaatcaggccggggaggaacc1800ggggagggatcagagctaggagcgagacaccctaaagggggggaaccgttttctgctgac1860ggtgtttcgtttattagttttcagcccgtggatagcggagggtgagggcaagtgagagcc1920agagcaaggacgggacccctaaaggggggaaccgttttctgctgacggtgtttcgtttat1980tagttttcagcccgtggacggccgcgtttagcttccattccaagtgcctttctgacttgt2040tggatgcgcctttcactgacacctagttcgcctgcaagctcacgagtcgagggatcagca2100accgattgagaacgggcatccaggatcgcagttttgacgcgaagttcgagcaactcgcct2160gtcatttctcggcgtttgtttgcttccgctaatcgctgtcgcgtctcctgcgcatactta2220ctttctgggtcagcccatctgcgtgcattcgatgtagctgcgccccgtcgccccatcgtc2280gctagagctttccgccctcggctgctctgcgtttccacccgacgagcagggacgactggc2340tggcctttagccacgtagccgcgcacacgacgcgccatcgtcaggcgatcacgcatggcg2400ggaagatccggctcccggccgtctgcaccgaccgcctgggcaacgttgtacgccacttca2460tacgcgtcgatgatcttggcatcttttaggcgctcaccagcagctttgagctggtatccc2520acggtcaacgcgtggcgaaacgcggtctcgtcgcgcgctcgctctggatttgtccagagc2580actcgcacgccgtcgatcaggtcgccggacgcgtccagggcgctcggcaggctcgcgtcc2640aaaatcgctagcgccttggcttctgcggtggcgcgttgtgccgcttcaatgcgggcgcgt2700ccgctggaaaagtcctgctcaatgtactttttcggcttctgtgatccggtcatcgttcga2760gcaatctccattaggtcggccagccgatccacacgatcatgctggcagtgccatttatag2820gctgtcggatcgtctgagacgtgcagcggccaccggctcagcctatgcgaaaaagcctgg2880tcagcgccgaaaacacgagtcatttcttccgtcgttgcagccagcaggcgcatatttggg2940ctggttttacctgctgcggcatacaccgggtcaatgagccagatgagctggcatttcccg3000ctcagcggattcacgccgatccaagccggcgctttttctaggcgtgcccatttctctaaa3060atcgcgtagacctgcgggtttacgtgctcaatcttcccgccggcctggtggctgggcaca3120tcgatgtcaagcacgatcaccgcggcatgttgcgcgtgcgtcagcgcaacgtactggcac3180cgcgtcagcgcttttgagccagcccggtagagctttggttgggtttcgccggtatccggg3240tttttaatccaggcgctcgcgaaatctcttgtcttgctgccctggaagctttcgcgtccc3300aggtgagcgagcagttcgcggcgatcttctgccgtccagccgcgtgagccgcagcgcata3360gcttcggggtgggtgtcgaacagatcggcggacaatttccacgcgctagctgtgactgtg3420tcctgcggatcggctagagtcatgtcttgagtgctttctcccagctgatgactgggggtt3480agccgacgccctgtgagttcccgctcacggggcgttcaactttttcaggtatttgtgcag3540cttatcgtgttttcttcgtaaatgaacgcttaactaccttgttaaacgtggcaaataggc3600aggattgatggggatctagcttcacgctgccgcaagcactcagggcgcaagggctgctaa3660aggaagcggaacacgtagaaagccagtccgcagaaacggtgctgaccccggatgaatgtc3720agctactgggctatctggacaagggaaaacgcaagcgcaaagagaaagcaggtagcttgc3780agtgggcttacatggcgatagctagactgggcggttttatggacagcaagcgaaccggaa3840ttgccagctggggcgccctctggtaaggttgggaagccctgcaaagtaaactggatggct3900ttcttgccgccaaggatctgatggcgcaggggatcaagatctgatcaagagacaggatga3960ggatcgtttcgcatgattgaacaagatggattgcacgcaggttctccggccgcttgggtg4020gagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtg4080ttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgcc4140ctgaatgaactccaagacgaggcagcgcggctatcgtggctggccacgacgggcgttcct4200tgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaa4260gtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatg4320gctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaa4380gcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggat4440gatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcg4500cggatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatc4560atggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggac4620cgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgg4680gctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttc4740tatcgccttcttgacgagttcttctgagcgggactctggggttcgcggaatcatgaccaa4800aatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaagg4860atcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccacc4920gctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaac4980tggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggcca5040ccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagt5100ggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttacc5160ggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcg5220aacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcc5280cgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcac5340gagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacct5400ctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgc5460cagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctt5520tcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgatac5580cgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagtg5640cctgatgcggtattttctccttacgcatctgtgcggtatttcacaccg5688<210>6<211>78<212>dna<213>artificialsequence<400>6gcgctcacaatttcacacaggaaacagaattaattaagcttaaaggcacccgatatggat60aagaaatactcaataggc78<210>7<211>27<212>dna<213>artificialsequence<400>7tcagtcacctcctagctgactcaaatc27<210>8<211>42<212>dna<213>artificialsequence<400>8gtcagctaggaggtgactgaagcttggctgttttggcggatg42<210>9<211>30<212>dna<213>artificialsequence<400>9ctgtgtgaaattgtgagcgctcacaattcc30<210>10<211>42<212>dna<213>artificialsequence<400>10ctgtgcggtatttcacaccggtgcgtggcgagttttacaaag42<210>11<211>82<212>dna<213>artificialsequence<400>11gttcttgtaatcctccaaaattgtggtggcactgtcctggtcgagcttaccaccttttgt60acttagatgatgattcagggac82<210>12<211>43<212>dna<213>artificialsequence<400>12ttttggaggattacaagaacatgactaagcaaccaccaatcgc43<210>13<211>25<212>dna<213>artificialsequence<400>13ttcctctgaattatcgattacactg25<210>14<211>45<212>dna<213>artificialsequence<400>14taatcgataattcagaggaataactgttttggcggatgagagaag45<210>15<211>23<212>dna<213>artificialsequence<400>15ggagacctttttggagctagtcg23<210>16<211>23<212>dna<213>artificialsequence<400>16ctagctccaaaaaggtctccagg23<210>17<211>23<212>dna<213>artificialsequence<400>17cggtgtgaaataccgcacagatg23<210>18<211>24<212>dna<213>artificialsequence<400>18ttcatgcagaaatcaacattgaca24<210>19<211>24<212>dna<213>artificialsequence<400>19aaactgtcaatgttgatttctgca24<210>20<211>24<212>dna<213>artificialsequence<400>20ttcagcaggtgaaggtgatgtcgg24<210>21<211>24<212>dna<213>artificialsequence<400>21aaacccgacatcaccttcacctgc24<210>22<211>90<212>dna<213>artificialsequence<400>22ggtggtgccgtcttctacagaagagacgttctgcagaaccatgtcgargttgatttctgc60atcagccaacgcacggaaaaccttcgcagc90<210>23<211>90<212>dna<213>artificialsequence<400>23ggtggtgccgtcttctacagaagagacgttctgcagaaccatgtccwtgttgatttctgc60atcagccaacgcacggaaaaccttcgcagc90<210>24<211>90<212>dna<213>artificialsequence<400>24ggtggtgccgtcttctacagaagagacgttctgcagaaccatgtcgghgttgatttctgc60atcagccaacgcacggaaaaccttcgcagc90<210>25<211>90<212>dna<213>artificialsequence<400>25ggtggtgccgtcttctacagaagagacgttctgcagaaccatgtcgtdgttgatttctgc60atcagccaacgcacggaaaaccttcgcagc90<210>26<211>90<212>dna<213>artificialsequence<400>26ggtggtgccgtcttctacagaagagacgttctgcagaaccatgtctkggttgatttctgc60atcagccaacgcacggaaaaccttcgcagc90<210>27<211>90<212>dna<213>artificialsequence<400>27ggtggtgccgtcttctacagaagagacgttctgcagaaccatgtcwtcgttgatttctgc60atcagccaacgcacggaaaaccttcgcagc90<210>28<211>90<212>dna<213>artificialsequence<400>28ggtggtgccgtcttctacagaagagacgttctgcagaaccatgtcgcvgttgatttctgc60atcagccaacgcacggaaaaccttcgcagc90<210>29<211>90<212>dna<213>artificialsequence<400>29ggtggtgccgtcttctacagaagagacgttctgcagaaccatgtcgacgttgatttctgc60atcagccaacgcacggaaaaccttcgcagc90<210>30<211>90<212>dna<213>artificialsequence<400>30ggtggtgccgtcttctacagaagagacgttctgcagaaccatgtcccagttgatttctgc60atcagccaacgcacggaaaaccttcgcagc90<210>31<211>90<212>dna<213>artificialsequence<400>31gtcggtggtgccgtcttctacagaagagacgttctgcagaaccatgadaatgttgatttc60tgcatcagccaacgcacggaaaaccttcgc90<210>32<211>90<212>dna<213>artificialsequence<400>32gtcggtggtgccgtcttctacagaagagacgttctgcagaaccatcwtaatgttgatttc60tgcatcagccaacgcacggaaaaccttcgc90<210>33<211>90<212>dna<213>artificialsequence<400>33gtcggtggtgccgtcttctacagaagagacgttctgcagaaccatgghaatgttgatttc60tgcatcagccaacgcacggaaaaccttcgc90<210>34<211>90<212>dna<213>artificialsequence<400>34gtcggtggtgccgtcttctacagaagagacgttctgcagaaccatgtdaatgttgatttc60tgcatcagccaacgcacggaaaaccttcgc90<210>35<211>90<212>dna<213>artificialsequence<400>35gtcggtggtgccgtcttctacagaagagacgttctgcagaaccattkgaatgttgatttc60tgcatcagccaacgcacggaaaaccttcgc90<210>36<211>90<212>dna<213>artificialsequence<400>36gtcggtggtgccgtcttctacagaagagacgttctgcagaaccatttcaatgttgatttc60tgcatcagccaacgcacggaaaaccttcgc90<210>37<211>90<212>dna<213>artificialsequence<400>37gtcggtggtgccgtcttctacagaagagacgttctgcagaaccatgcvaatgttgatttc60tgcatcagccaacgcacggaaaaccttcgc90<210>38<211>90<212>dna<213>artificialsequence<400>38gtcggtggtgccgtcttctacagaagagacgttctgcagaaccatgacaatgttgatttc60tgcatcagccaacgcacggaaaaccttcgc90<210>39<211>90<212>dna<213>artificialsequence<400>39gtcggtggtgccgtcttctacagaagagacgttctgcagaaccatccaaatgttgatttc60tgcatcagccaacgcacggaaaaccttcgc90<210>40<211>90<212>dna<213>artificialsequence<400>40cgcgcggcggccgtcggaacgagggcaggtgaaggtgatgtcggtgadgccgtcttctac60agaagagacgttctgcagaaccatgtcaat90<210>41<211>90<212>dna<213>artificialsequence<400>41cgcgcggcggccgtcggaacgagggcaggtgaaggtgatgtcggtcwtgccgtcttctac60agaagagacgttctgcagaaccatgtcaat90<210>42<211>90<212>dna<213>artificialsequence<400>42cgcgcggcggccgtcggaacgagggcaggtgaaggtgatgtcggtagmgccgtcttctac60agaagagacgttctgcagaaccatgtcaat90<210>43<211>90<212>dna<213>artificialsequence<400>43cgcgcggcggccgtcggaacgagggcaggtgaaggtgatgtcggtgtdgccgtcttctac60agaagagacgttctgcagaaccatgtcaat90<210>44<211>90<212>dna<213>artificialsequence<400>44cgcgcggcggccgtcggaacgagggcaggtgaaggtgatgtcggttkggccgtcttctac60agaagagacgttctgcagaaccatgtcaat90<210>45<211>90<212>dna<213>artificialsequence<400>45cgcgcggcggccgtcggaacgagggcaggtgaaggtgatgtcggtwtcgccgtcttctac60agaagagacgttctgcagaaccatgtcaat90<210>46<211>90<212>dna<213>artificialsequence<400>46cgcgcggcggccgtcggaacgagggcaggtgaaggtgatgtcggtgcvgccgtcttctac60agaagagacgttctgcagaaccatgtcaat90<210>47<211>90<212>dna<213>artificialsequence<400>47cgcgcggcggccgtcggaacgagggcaggtgaaggtgatgtcggtgacgccgtcttctac60agaagagacgttctgcagaaccatgtcaat90<210>48<211>90<212>dna<213>artificialsequence<400>48cgcgcggcggccgtcggaacgagggcaggtgaaggtgatgtcggtccagccgtcttctac60agaagagacgttctgcagaaccatgtcaat90<210>49<211>22<212>dna<213>artificialsequence<400>49cggacgttgacggtgtgtatac22<210>50<211>23<212>dna<213>artificialsequence<400>50gcacggaaatacgaatctcagag23当前第1页1 2 3 
技术特征:1.一种多肽,所述多肽具有天冬氨酸激酶活性,其中,所述多肽选自如下(i)-(iv)组成的组中的任一项:
(i)具有如seqidno:1所示序列的多肽的突变体,所述突变体和seqidno:1所示的序列相比,在对应于seqidno:1所示序列的至少第293、294和307位中的一个或多个位置处包含突变;
(ii)与(i)所示序列具有至少70%、至少80%或至少90%的序列同一性,且不包括seqidno:1所示序列的多肽;
(iii)由多核苷酸编码的多肽,所述多核苷酸在非常高严格条件下与(a)或(b)所示的多核苷酸杂交:
(a)编码如(i)所示氨基酸序列的多肽的多核苷酸;
(b)(a)的全长互补多核苷酸;
(iv)由(i)、(ii)、(iii)所示的多肽的片段,并且所述片段仍然具有天冬氨酸激酶活性。
2.根据权利要求1所述的多肽,其中,所述多肽为包含如下(c)-(e)中至少一组所示的突变的多肽:
(c)对应seqidno:1所示序列的第293位的氨基酸由异亮氨酸(i)突变为丝氨酸(s)、甘氨酸(g)、谷氨酸(e)、脯氨酸(p)、色氨酸(w)、酪氨酸(y)、组氨酸(h)、蛋氨酸(m)、谷氨酰胺(q)、半胱氨酸(c)或精氨酸(r);
(d)对应seqidno:1所示序列的第294位的氨基酸由天冬氨酸(d)突变为酪氨酸(y)、色氨酸(w)或苯丙氨酸(f);
(e)对应seqidno:1所示序列的第307位的氨基酸由苏氨酸(t)突变为酪氨酸(y)、甘氨酸(g)或苯丙氨酸(f)。
3.根据权利要求1或2所述的多肽,其中,所述多肽包括在(i)所示序列的多肽的n端或c端部位缺失或添加至少一个氨基酸残基。
4.一种重组多肽,其中,所述重组多肽包括权利要求1-3任一项所述的多肽,以及与所述多肽融合的外源多肽;可选地,所述外源多肽包括标签多肽;优选地,所述外源多肽包括标签多肽,以及连接所述标签多肽与所述具有天冬氨酸激酶活的多肽的间隔多肽。
5.一种分离的多核苷酸,其中,所述多核苷酸包含编码权利要求1-3任一项所述多肽的核苷酸序列,或包含编码权利要求4所述重组多肽的核苷酸序列。
6.一种核酸构建体,其中,所述核酸构建体包含权利要求5所述的多核苷酸,所述多核苷酸与一个或多个调控序列可操作地连接,所述调控序列指导多肽在表达宿主中产生。
7.一种重组表达载体,其中,所述重组表达载体包含权利要求5所述的多核苷酸,或权利要求6所述的核酸构建体。
8.一种重组宿主细胞,其中,所述重组宿主细胞包含权利要求1-3任一项所述的多肽、权利要求4所述的重组多肽、权利要求5所述的多核苷酸、权利要求6所述的核酸构建体,或者权利要求7所述的重组表达载体。
9.根据权利要求8所述的重组宿主细胞,其中,所述宿主细胞来源于棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属;优选地,所述宿主细胞为谷氨酸棒杆菌或大肠杆菌。
10.权利要求1-3任一项所述的多肽、权利要求4所述的重组多肽、权利要求5所述的多核苷酸、权利要求6所述的核酸构建体、权利要求7所述的重组表达载体,或权利要求8-9任一项所述的重组宿主细胞在生产氨基酸中的应用;
优选地,所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物包括戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种。
11.一种生产氨基酸的方法,其中,包括利用权利要求1-3任一项所述的多肽、权利要求4所述的重组多肽、权利要求5所述的多核苷酸、权利要求6所述的核酸构建体、权利要求7所述的重组表达载体,或权利要求8-9任一项所述的重组宿主细胞生产氨基酸的步骤;
可选地,所述方法还包括纯化或分离所述氨基酸的步骤;
优选地,所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物包括戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种。
技术总结本公开涉及具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用。具体来说,本公开涉及一种新的具有天冬氨酸激酶活性的多肽、重组多肽、多核苷酸、核酸构建体、重组表达载体、重组宿主细胞,以及生产氨基酸的方法。本公开的具有天冬氨酸激酶活性的多肽是在在对应于SEQ ID NO:1所示的氨基酸序列的第293、294和307位的一个或多个位置处发生突变的突变体,与SEQ ID NO:1所示序列的多肽相比,突变体多肽解除了赖氨酸对天冬氨酸激酶的反馈抑制,具有高的天冬氨酸激酶活性,能够用于赖氨酸及其衍生物的稳定、高效生产。
技术研发人员:郑平;刘娇;王钰;周文娟;孙际宾;陈久洲;马延和
受保护的技术使用者:中国科学院天津工业生物技术研究所
技术研发日:2020.10.16
技术公布日:2021.08.03